上海AI实验室发布了新一代书生·视觉大模型,即InternVL-6B。这一模型的视觉编码器参数量达到了60亿,并采用了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。
除了上述技术特点外,该模型还能处理复杂图片中的细微视觉信息,完成图生文任务。同时,它还能识别和解读复杂页面中的信息,甚至解决其中的数理问题。
上海AI实验室发布的新一代书生·视觉大模型在技术上具有较高的创新性和实用性,对图像和文本的处理能力值得期待。
上海AI实验室发布了新一代书生·视觉大模型,即InternVL-6B。这一模型的视觉编码器参数量达到了60亿,并采用了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。
除了上述技术特点外,该模型还能处理复杂图片中的细微视觉信息,完成图生文任务。同时,它还能识别和解读复杂页面中的信息,甚至解决其中的数理问题。
上海AI实验室发布的新一代书生·视觉大模型在技术上具有较高的创新性和实用性,对图像和文本的处理能力值得期待。