北京时间12月7日凌晨,谷歌破晓而动,终于发布了期盼已久的AI大模型Gemini。这个神秘的新模型被谷歌寄予厚望,被视为应对OpenAI的GPT-4的“杀手锏”。不负众望,Gemini一亮相就带来了惊人的成绩:在MMLU(大规模多任务语言理解)测评中首次超越了人类专家,同时在32个多模态基准测试中取得了30个最优效果(SOTA),几乎全方位超越了GPT-4。
其实,Gemini的发布过程可谓是一波三折。早在今年8月就有消息传出Gemini将在秋季发布,然而到了11月,发布时间又被推迟至明年第一季度。看来,谷歌对Gemini的研发和测试是相当谨慎的,毕竟这是一款对标GPT-4的重量级模型。
在本次发布中,谷歌为Gemini 1.0推出了三个版本:适用于高度复杂任务的Gemini Ultra、适用于各种任务的最佳模型Gemini Pro以及适用于端侧设备的Gemini Nano。其中,Gemini Pro和Gemini Nano已经分别在谷歌的聊天机器人Bard和智能手机Pixel 8 Pro上集成。而最强大的Gemini Ultra则计划在明年发布。
值得一提的是,Gemini是一款从头开始构建的多模态大模型。与GPT-4的单模态相比,Gemini可以同时识别和理解文本、图像、音频、视频和代码五种信息。这意味着用户可以自然地输入文字、图像、短视频等信息,而模型也会以同样的方式进行输出。这种多模态的特性使得Gemini在处理复杂任务时更加得心应手。
目前,虽然只有Gemini Pro和Nano开放供用户体验,但根据谷歌公布的信息,Gemini Ultra在测评基准上已经取得了非常亮眼的成绩。尤其是在代码生成能力方面,Gemini Ultra的表现令人瞩目。这无疑是在OpenAI陷入内部混乱的时候给其重重一击。
随着科技的不断发展,AI领域的竞争也越来越激烈。微软刚刚宣布了旗下AI助手Copilot重大升级,将接入OpenAI的最新模型GPT-4 Turbo。此时此刻,谷歌却突然亮出了Gemini这个底牌,以多模态大模型的强大实力与之一较高下。随着Gemini Ultra的即将发布和实际应用,我们有理由期待这个多模态大模型会在更多领域大放异彩。让我们拭目以待,看看Gemini能否继续刷新记录,引领AI技术的新潮流。