谷歌发布其最新一代的人工智能模型Gemini,全面超越GPT-4

谷歌憋了好几个月的大招、人类迄今为止最强大的AI模型——Gemini,终于发布了。

Gemini之所以令人瞩目,其中一个重要原因是它从根本上就是一个多模态模型。就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习。因此,这个模型天生就具备了更强大的能力,它可以像人类一样理解我们周围的世界,处理代码、文字、音频、图像和视频通通不在话下。

基准的MMLU(大规模多任务语言理解)测试是专门用于衡量AI模型在文本和图像的任务上的表现的。

谷歌CEO表示,在MMLU测试中,Gemini全面击败GPT4。对于纯文本问题,Gemini得分为90,人类专家得分为89。GPT-4得分为86;是大模型首次超过了人类专家。

对于多模态问题,Gemini得分为59,而GPT-4得分为57,也是Gemini更胜一筹。

Gemini似乎在几乎所有测试中都领先于GPT-4,虽然领先优势并不明显。

Gemini将从本周三开始为谷歌的Bard聊天机器人提供支持,我们也有机会自己体验一下了。并且Gemini将从明年开始广泛地应用于谷歌搜索引擎。

Gemini 包括三种量级:能力最强的Gemini Ultra,适用于多任务的Gemini Pro ,以及适用于特定任务和端侧的Gemini Nano

Nano是Gemini大模型中最小的一款,但它是谷歌专门为在手机上运行而设计的,无需联网,可以直接在手机上本地和离线运行。谷歌已经把人工智能大模型竞赛的战线卷到了手机硬件上。

尽管一直以来,谷歌在人工智能领域有着深厚的基础,但其风头近来逐渐被OpenAI盖过。OpenAI去年推出的DALL-E和GPT-3.5,以及今年的GPT-4,无疑在人工智能行业掀起了巨大的波澜。

Gemini的诞生,无疑使谷歌在这场竞争中重新获得了有力地位。而谷歌美股盘前涨近3%,市场也是给出了相对积极的反馈。接下来OpenAI如何应对,我们拭目以待。

贾定强微信

微信扫一下,或点击链接添加好友