上海AI实验室推出新一代书生·视觉大模型:60亿参数引领视觉与语言精细对齐

上海AI实验室发布了新一代书生·视觉大模型,即InternVL-6B。这一模型的视觉编码器参数量达到了60亿,并采用了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。

除了上述技术特点外,该模型还能处理复杂图片中的细微视觉信息,完成图生文任务。同时,它还能识别和解读复杂页面中的信息,甚至解决其中的数理问题。

上海AI实验室发布的新一代书生·视觉大模型在技术上具有较高的创新性和实用性,对图像和文本的处理能力值得期待。

本文来自用户或匿名投稿,不代表大众智能立场;本文所有内容(包括图片、视频等)版权均为原作者所有。涉及的相关问题请查阅本站免责声明,如侵权请及时与本站运营方取得联系(联系我们)我们将按声明中的处理方式进行处理。本文链接:https://dzzn.com/2024/3070.html

(0)
上一篇 2024年2月2日 下午1:10
下一篇 2024年2月2日 下午1:15

相关推荐

发表回复

登录后才能评论