Gemini：谷歌的AI重磅炸弹，号称已全面超越GPT-4的多模态大模型

AI狂 • 2023年12月7日下午4:48 • 人工智能 • 阅读 1956

北京时间12月7日凌晨，谷歌破晓而动，终于发布了期盼已久的AI大模型Gemini。这个神秘的新模型被谷歌寄予厚望，被视为应对OpenAI的GPT-4的“杀手锏”。不负众望，Gemini一亮相就带来了惊人的成绩：在MMLU（大规模多任务语言理解）测评中首次超越了人类专家，同时在32个多模态基准测试中取得了30个最优效果（SOTA），几乎全方位超越了GPT-4。

其实，Gemini的发布过程可谓是一波三折。早在今年8月就有消息传出Gemini将在秋季发布，然而到了11月，发布时间又被推迟至明年第一季度。看来，谷歌对Gemini的研发和测试是相当谨慎的，毕竟这是一款对标GPT-4的重量级模型。

在本次发布中，谷歌为Gemini 1.0推出了三个版本：适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano。其中，Gemini Pro和Gemini Nano已经分别在谷歌的聊天机器人Bard和智能手机Pixel 8 Pro上集成。而最强大的Gemini Ultra则计划在明年发布。

值得一提的是，Gemini是一款从头开始构建的多模态大模型。与GPT-4的单模态相比，Gemini可以同时识别和理解文本、图像、音频、视频和代码五种信息。这意味着用户可以自然地输入文字、图像、短视频等信息，而模型也会以同样的方式进行输出。这种多模态的特性使得Gemini在处理复杂任务时更加得心应手。

目前，虽然只有Gemini Pro和Nano开放供用户体验，但根据谷歌公布的信息，Gemini Ultra在测评基准上已经取得了非常亮眼的成绩。尤其是在代码生成能力方面，Gemini Ultra的表现令人瞩目。这无疑是在OpenAI陷入内部混乱的时候给其重重一击。

随着科技的不断发展，AI领域的竞争也越来越激烈。微软刚刚宣布了旗下AI助手Copilot重大升级，将接入OpenAI的最新模型GPT-4 Turbo。此时此刻，谷歌却突然亮出了Gemini这个底牌，以多模态大模型的强大实力与之一较高下。随着Gemini Ultra的即将发布和实际应用，我们有理由期待这个多模态大模型会在更多领域大放异彩。让我们拭目以待，看看Gemini能否继续刷新记录，引领AI技术的新潮流。

本文来自用户或匿名投稿，不代表大众智能立场；本文所有内容（包括图片、视频等）版权均为原作者所有。涉及的相关问题请查阅本站免责声明，如侵权请及时与本站运营方取得联系（联系我们）我们将按声明中的处理方式进行处理。本文链接：https://dzzn.com/2023/1947.html