百万token加持，谷歌Gemini 2.5 Pro正面对决DeepSeek-R1

元宇宙之心MetaverseHub

2025-03-28 15:46发布于四川科技领域创作者

+关注

AI划重点 · 全文约1426字，阅读需5分钟

1.谷歌发布新一代智能模型Gemini 2.5 Pro，具备强大的推理能力和准确性提升。

2.Gemini 2.5 Pro支持文本、音频、图像、视频及大型数据集等多模态输入，具备理解完整代码仓库的能力。

3.该模型在高级推理基准测试中表现领先，尤其在评估人类知识与推理能力的测试集中取得了18.8%的顶尖成绩。

4.除此之外，Gemini 2.5 Pro在编程任务方面展现出强劲实力，多项基准测试成绩超越前代Gemini 2.0。

5.谷歌还需直面OpenAI推理模型的竞争，尽管OpenAI最新发布的GPT-4.5并非专注推理的模型，但业内普遍预期该公司将推出更多推理专用模型。

以上内容由腾讯混元大模型生成，仅供参考

在推出Gemini 2.0并见证DeepSeek崛起仅数月后，谷歌正式发布其“最智能模型”Gemini 2.5。这款新一代模型不仅具备强大的推理能力，在性能和准确性方面也实现了明显提升。

距离谷歌发布上一代旗舰模型Gemini 2.0仅过去三个月，当时该系列首次引入了推理能力和智能体用例。

此次推出的Gemini 2.5 Pro（实验版）已登陆Google AI Studio平台，Gemini Advanced用户也可在聊天界面体验。同时，Vertex AI平台即将同步上线。

谷歌DeepMind首席技术官Koray Kavukcuoglu在官方博客中表示：“Gemini 2.5标志着我们在'打造更智能、更具推理能力的AI'目标上迈出了重要一步。”

“通过大幅增强的基础模型与改进的后训练技术相结合，Gemini 2.5实现了性能的全新突破。” Kavukcuoglu表示，“未来我们将把这些思维能力直接植入所有模型，使其能够处理更复杂的问题，并支持更强大、更具情境感知能力的智能体。”

01.更强大的上下文理解能力

与Gemini 2.0及Gemini 2.0 Flash Thinking一脉相承，Gemini 2.5 Pro延续了“先思考后应答”的运作机制。

这款新模型能够处理文本、音频、图像、视频及大型数据集等多模态输入，并具备理解完整代码仓库的能力，可显著提升编程项目的开发效率。

在实验性模型中，Gemini 2.5 Pro提供了目前最广阔的上下文窗口，初始版本支持100万token的上下文长度，并将很快升级至200万token。

谷歌AI Studio产品经理Logan Kilpatrick在社交平台X上透露，该模型是“首个支持更高速率限制且开放商业计费的实验性模型”。

谷歌表示，即将公布Gemini 2.5系列模型的详细定价方案。

谷歌表示，该模型在高级推理基准测试中表现领先。公司指出，Gemini 2.5 Pro“在GPQA和AIME 2025等数学与科学基准测试中保持领先优势”。

Kavukcuoglu特别提到，在旨在评估人类知识与推理能力的“Humanity's Last Exam”测试集中，该模型“在不使用工具辅助的情况下取得了18.8%的顶尖成绩”。

在编程任务方面，Gemini 2.5 Pro同样展现出强劲实力，多项基准测试成绩超越前代Gemini 2.0。

谷歌强调，新模型“尤其擅长开发视觉吸引力强的网页应用和智能体代码应用，同时在代码转换与编辑任务上表现突出”。这些进步使开发者能够更高效地构建复杂的编程项目。

Gemini 2.5 Pro的推出环境已与去年12月Gemini 2.0发布时大不相同。

DeepSeek推出的推理大语言模型DeepSeek-R1证明，强大模型完全可以用更低的训练和计算成本实现优异性能。更重要的是，DeepSeek展示了开源模型完全有能力与OpenAI的o1、o3等闭源大模型一较高下。

除了DeepSeek不断扩充的模型阵容，谷歌还需直面OpenAI推理模型的竞争。虽然OpenAI最新发布的GPT-4.5并非专注推理的模型，但业内普遍预期该公司很快将推出更多推理专用模型。

值得一提的是，Gemini 2.5已是谷歌本月发布的第二款新模型。

三月初，该公司刚推出轻量级语言模型Gemma 3的最新版本，该模型支持12.8万token的上下文长度，特别适合移动端设备使用。这一连串动作显示出科技巨头们在AI赛道日益白热化的竞争态势。

原文来源于：
1.https://venturebeat.com/ai/google-releases-most-intelligent-model-to-date-gemini-2-5-pro/
中文内容由元宇宙之心（MetaverseHub）团队编译，如需转载请联系我们。

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。