1.谷歌发布新一代智能模型Gemini 2.5 Pro,具备强大的推理能力和准确性提升。
2.Gemini 2.5 Pro支持文本、音频、图像、视频及大型数据集等多模态输入,具备理解完整代码仓库的能力。
3.该模型在高级推理基准测试中表现领先,尤其在评估人类知识与推理能力的测试集中取得了18.8%的顶尖成绩。
4.除此之外,Gemini 2.5 Pro在编程任务方面展现出强劲实力,多项基准测试成绩超越前代Gemini 2.0。
5.谷歌还需直面OpenAI推理模型的竞争,尽管OpenAI最新发布的GPT-4.5并非专注推理的模型,但业内普遍预期该公司将推出更多推理专用模型。
以上内容由腾讯混元大模型生成,仅供参考
在推出Gemini 2.0并见证DeepSeek崛起仅数月后,谷歌正式发布其“最智能模型”Gemini 2.5。这款新一代模型不仅具备强大的推理能力,在性能和准确性方面也实现了明显提升。
距离谷歌发布上一代旗舰模型Gemini 2.0仅过去三个月,当时该系列首次引入了推理能力和智能体用例。
此次推出的Gemini 2.5 Pro(实验版)已登陆Google AI Studio平台,Gemini Advanced用户也可在聊天界面体验。同时,Vertex AI平台即将同步上线。
谷歌DeepMind首席技术官Koray Kavukcuoglu在官方博客中表示:“Gemini 2.5标志着我们在'打造更智能、更具推理能力的AI'目标上迈出了重要一步。”
“通过大幅增强的基础模型与改进的后训练技术相结合,Gemini 2.5实现了性能的全新突破。” Kavukcuoglu表示,“未来我们将把这些思维能力直接植入所有模型,使其能够处理更复杂的问题,并支持更强大、更具情境感知能力的智能体。”
01.更强大的上下文理解能力
与Gemini 2.0及Gemini 2.0 Flash Thinking一脉相承,Gemini 2.5 Pro延续了“先思考后应答”的运作机制。
这款新模型能够处理文本、音频、图像、视频及大型数据集等多模态输入,并具备理解完整代码仓库的能力,可显著提升编程项目的开发效率。
在实验性模型中,Gemini 2.5 Pro提供了目前最广阔的上下文窗口,初始版本支持100万token的上下文长度,并将很快升级至200万token。
谷歌AI Studio产品经理Logan Kilpatrick在社交平台X上透露,该模型是“首个支持更高速率限制且开放商业计费的实验性模型”。
谷歌表示,即将公布Gemini 2.5系列模型的详细定价方案。
02.卓越的编程与推理性能
谷歌表示,该模型在高级推理基准测试中表现领先。公司指出,Gemini 2.5 Pro“在GPQA和AIME 2025等数学与科学基准测试中保持领先优势”。
Kavukcuoglu特别提到,在旨在评估人类知识与推理能力的“Humanity's Last Exam”测试集中,该模型“在不使用工具辅助的情况下取得了18.8%的顶尖成绩”。
在编程任务方面,Gemini 2.5 Pro同样展现出强劲实力,多项基准测试成绩超越前代Gemini 2.0。
谷歌强调,新模型“尤其擅长开发视觉吸引力强的网页应用和智能体代码应用,同时在代码转换与编辑任务上表现突出”。这些进步使开发者能够更高效地构建复杂的编程项目。
03.竞争日益激烈的市场
Gemini 2.5 Pro的推出环境已与去年12月Gemini 2.0发布时大不相同。
DeepSeek推出的推理大语言模型DeepSeek-R1证明,强大模型完全可以用更低的训练和计算成本实现优异性能。更重要的是,DeepSeek展示了开源模型完全有能力与OpenAI的o1、o3等闭源大模型一较高下。
除了DeepSeek不断扩充的模型阵容,谷歌还需直面OpenAI推理模型的竞争。虽然OpenAI最新发布的GPT-4.5并非专注推理的模型,但业内普遍预期该公司很快将推出更多推理专用模型。
值得一提的是,Gemini 2.5已是谷歌本月发布的第二款新模型。
三月初,该公司刚推出轻量级语言模型Gemma 3的最新版本,该模型支持12.8万token的上下文长度,特别适合移动端设备使用。这一连串动作显示出科技巨头们在AI赛道日益白热化的竞争态势。
原文来源于:
1.https://venturebeat.com/ai/google-releases-most-intelligent-model-to-date-gemini-2-5-pro/
中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。