苹果多模态大语言模型Ferret正式开源发布

图灵 • 2023年12月25日下午4:42 • 人工智能 • 阅读 1887

今年10月，苹果和哥伦比亚大学的研究团队共同发布了一个名为Ferret的多模态大语言模型。相较于传统模型，Ferret的独特之处在于其能够精准地识别并描述图像内容，同时还能准确地辨别和定位图像中的各种元素。

Ferret模型分为7B和13B两个版本，为用户提供了不同的选择。为了进一步提升模型的表现，苹果还专门构建了一个名为GRIT的大型数据集。该数据集包含了1.1M个样本，涵盖了丰富多样的层次空间知识，为模型的训练提供了有力的支持。

在发布之初，苹果仅提供了代码和权重，主要面向研究领域的使用而非商业应用。因此，这一消息并未引起广泛的关注。然而，随着日前苹果发表的一系列具有影响力的论文，揭示了其在iPhone上部署大语言模型方面所取得的重大突破，越来越多的AI专家和研究者开始注意到此前发布的Ferret模型。

这一系列论文不仅展示了苹果在AI领域的深入研究和领先地位，也为整个行业带来了新的思考和启示。苹果通过与学术界的紧密合作，成功地将研究成果转化为实际的产品和服务，为用户带来了更智能、更便捷的体验。

未来随着多模态大语言模型技术的不断发展和完善，我们有望看到更多类似Ferret的优秀模型出现。这些模型将进一步推动人工智能领域的发展，并在各个领域发挥其强大的应用价值。

本文来自用户或匿名投稿，不代表大众智能立场；本文所有内容（包括图片、视频等）版权均为原作者所有。涉及的相关问题请查阅本站免责声明，如侵权请及时与本站运营方取得联系（联系我们）我们将按声明中的处理方式进行处理。本文链接：https://dzzn.com/2023/2333.html