上海AI实验室推出新一代书生·视觉大模型：60亿参数引领视觉与语言精细对齐

AI狂 • 2024年2月2日下午1:12 • 人工智能 • 阅读 1548

上海AI实验室发布了新一代书生·视觉大模型，即InternVL-6B。这一模型的视觉编码器参数量达到了60亿，并采用了对比-生成融合的渐进式对齐技术，实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。

除了上述技术特点外，该模型还能处理复杂图片中的细微视觉信息，完成图生文任务。同时，它还能识别和解读复杂页面中的信息，甚至解决其中的数理问题。

上海AI实验室发布的新一代书生·视觉大模型在技术上具有较高的创新性和实用性，对图像和文本的处理能力值得期待。

本文来自用户或匿名投稿，不代表大众智能立场；本文所有内容（包括图片、视频等）版权均为原作者所有。涉及的相关问题请查阅本站免责声明，如侵权请及时与本站运营方取得联系（联系我们）我们将按声明中的处理方式进行处理。本文链接：https://dzzn.com/2024/3070.html