谷歌旗下的大模型Gemini终于在今天深夜上线了,那么综合来看,Gemini的表现如何?它是否可以超过GPT-4呢?这篇文章里,作者就针对大模型Gemini做了解读,一起来看。 人类有五种感官,我们所建造的世界、所消费的媒体,都是以这样的方式所呈现。 而Gemini的出现,就是迈向真正通用的AI模型的第一步! Gemini猜对了纸团在最左边的杯子里 Google DeepMind首席执行官兼联合创始人Demis Hassabis表示,谷歌一直对非常通用的系统感兴趣。 而这里最关键的,就是如何混合所有这些模式,如何从任意数量的输入和感官中收集尽可能多的数据,然后给出同样多样化的响应。 DeepMind和谷歌大脑合并后,果然拿出了真东西。 之所以命名为Gemini,就是因为谷歌两大AI实验室的合体,另外也一个解释是参考了美国宇航局的Gemini项目,后者为阿波罗登月计划铺平了道路。 二、首次超越人类,大幅碾压GPT-4虽然没有正式公布,但根据内部消息,Gemini有万亿参数,训练所用的算力甚至达到GPT-4的五倍。 既然是被拿来硬刚GPT-4的模型,Gemini当然少不了经历最严格的测试。 谷歌在多种任务上评估了两种模型的性能,惊喜地发现:从自然图像、音频、视频理解到数学推理,Gemini Ultra在32个常用的学术基准的30个上,已经超越GPT-4! 而在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的高分,首次超过了人类专家。 在新的MMMU基准测试中,Gemini Ultra也取得了59.4%的高分,这一测试包括了跨越不同领域的多模态任务,这些任务需要深入的推理过程。 图像基准测试中,Gemini Ultra的表现也超过了之前的领先模型,而且,这一成就是在没有OCR系统帮助的情况下实现的! 种种测试表明,Gemini在多模态处理上表现出了强大的能力,并且在更复杂的推理上也有着极大潜力。 报告地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf 1. 中杯、大杯、超大杯!Gemini Ultra是谷歌迄今为止创建的最强大LLM最大,能够完成高度复杂的任务,主要面向数据中心和企业级应用。 Gemini Pro是性能最好的模型,用于广泛的任务。它会为许多谷歌的AI服务提供动力,并且从今天起,成为Bard的支柱。 Gemini Nano是最高效的模型,用于设备端任务,可以在安卓设备上本地和离线运行,Pixel 8 Pro的用户就能马上体验到。其中,Nano-1的参数为1.8B,Nano-2为3.25B。 针对其中任何一个步骤,都可以追问Gemini来获得更具体的解释。 3. 复杂推理轻松搞定此外,Gemini 1.0具有的多模态推理能力,可以更好地理解复杂的书面和视觉信息。这使得它在发掘埋藏在海量的数据中难以辨别的知识方面具有优越的性能。 通过阅读、过滤和理解信息,Gemini 1.0还能够从成千上万的文档中提取出独到的观点,从而助力从科学到金融等众多领域实现新的突破。 两年前,谷歌推出过一款叫做AlphaCode的产品,它也是第一个在编程竞赛中达到具有竞争力水平的AI代码生成系统。 而基于定制版的Gemini,谷歌推出了更先进的代码生成系统——AlphaCode 2。 在面对不仅涉及编程,还涉及复杂的数学和计算机科学理论等领域的问题时,AlphaCode 2都表现出了卓越的性能。 其中,AlphaCode 2编程的性能超过了85%的人类程序员,相比之下,AlphaCode只超过了约50%的程序员。 不仅如此,当人类程序员与AlphaCode 2协作时,人类程序员为代码样例设定特定的要求,Alphacode 2的性能会进一步提升。 详情可参阅Alpha Code 2技术报告: 报告地址:https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf 三、更可靠、更高效、可扩展对谷歌来说同样重要的是,Gemini显然是一个效率更高、更可靠、可扩展的模型。 它是在谷歌自己的张量处理单元上训练的,比谷歌以前的模型(如PaLM)运行起来更快、更便宜。 开发人员使用了谷歌内部研发的张量处理单元TPU v4和v5e,在AI优化的基础设施上对Gemini 1.0进行了大规模的训练。 而可靠、可扩展的训练模型和最高效的服务模型,就是谷歌做出Gemini的重要目标。 在TPU上,Gemini的运行速度明显快于早期规模较小、能力较弱的模型。这些定制设计的AI加速器是谷歌大模型产品的核心。 要知道,这些产品为搜索、YouTube、Gmail、谷歌地图、Google Play和Android等数十亿用户提供服务。它们还帮助了世界各地的科技公司经济、高效地训练大模型。 除了Gemini,谷歌在今天还发布了迄今为止最强大、最高效,并且可扩展的TPU系统——Cloud TPU v5p,专为训练尖端的AI模型而设计。 新一代TPU将加速Gemini的发展,帮助开发人员和企业客户更快地训练大规模生成式AI模型,开发出新产品和新功能。 四、Gemini,让谷歌再次伟大?显然,在Pichai和Hassabis看来,Gemini的发布仅仅是一个开始——一个更大的项目即将开启。 Gemini是谷歌一直在等待的模式,在OpenAI和ChatGPT接管世界后,Gemini是谷歌探索一年得出的结论。 发布「红色警报」后,谷歌一直在追赶,但两人都表示,不愿意为了跟上步伐而走得太快,尤其是我们越来越接近AGI。 Gemini是否会改变世界?最好的情况是,它能帮谷歌在生成式AI竞赛中赶上OpenAI。 但劈柴、Hassabis等人似乎都认为,这是谷歌真正伟大的开始。 今天发布的技术报告,没有透露架构细节、模型参数或训练数据集。 艾伦人工智能研究所前CEO Oren Etzioni说,「没有理由怀疑Gemini在这些基准上比GPT-4更好,但没准GPT-5会比Gemini做得更好。」 打造像Gemini这样的巨量模型,可能需要花费数亿美元,但对于在通过云提供AI占据主导地位的公司来说,最终的回报可能是数十亿甚至数万亿美元。 「这是一场不能失败,必须打赢的战争。」 参考资料: https://blog.google/technology/ai/google-gemini-ai/#availability https://deepmind.google/technologies/gemini/#hands-on 为我投票我在参加人人都是产品经理2023年度评选,希望喜欢我的文章的朋友都能来支持我一下~ 点击下方链接进入我的个人参选页面,点击红心即可为我投票。 每人每天最多可投30票,投票即可获得抽奖机会,抽取书籍、人人都是产品经理纪念周边&起点课堂会员等好礼哦! 投票传送门:https://996.pm/z4Knm 编辑:编辑部 来源公众号:新智元(ID:AI_era),“智能+”中国主平台,致力于推动中国从“互联网+”迈向“智能+”。 本文由人人都是产品经理合作媒体 @新智元 授权发布,未经许可,禁止转载。 题图来自 Unsplash,基于CC0协议。 该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。 |