在加利福尼亚州 Mountain View 举办的 Google I/O 2025 上,Google DeepMind 和 Google AI 团队发布了其 Gemini 2.5 系列大型语言模型的重大改进。这些更新涵盖 Gemini 2.5 Pro 和 Gemini 2.5 Flash 两个版本,引入了先进的推理能力、原生音频输出、多语言支持、安全防护以及显著的效率提升。总体而言,这些改进旨在通过 Google AI Studio、Gemini API 和 Vertex AI,为开发者、企业与终端用户提供更可靠、更自然且更具成本效益的 AI 服务。
Gemini 2.5 Pro 增强
Deep Think:增强的多假设推理
2.5 Pro 的一项重磅功能是 Deep Think,这是一种实验性推理模式,允许模型在生成最终输出之前在内部生成、比较并优化多条解题路径。早期基准测试显示了 Deep Think 的实力:它在 2025 USAMO 数学考试中领跑,在竞技级编码的 LiveCodeBench 上位居榜首,并在 MMMU 多模态推理测试中取得 84.0% 的成绩。
从本月起,Deep Think 将通过 Gemini API 向“受信任的测试者”开放。Google 表示,在更广泛开放 Deep Think 之前,还需要更多时间进行安全评估。

原生音频与多语言对话
在文本能力的基础上,Gemini 2.5 Pro 现已支持覆盖 24 种语言的原生音频输出。该功能提供具备上下文感知的韵律与情感语调,使人与 AI 的互动更具人性化。同时,模型的对话系统可动态调节语气——在客服与教育应用中增强共情。早期演示包括具有细腻重音的实时语音聊天以及多语言代码讲解,凸显了 Google 向真正的对话式 AI 推进的方向。
安全与可信性
2.5 Pro 的安全增强重点在于缓解间接提示注入攻击。更新的框架采用更严格的输入净化与动态上下文过滤,这对于处理敏感数据的受监管行业至关重要。根据 Google 开发者博客,这些防护在内部红队评估中可将漏洞风险最高降低 40%,为更广泛的企业采用奠定基础。
Gemini 2.5 Flash 优化
效率与速度
作为 2.5 Pro 的延迟优化同系模型,Gemini 2.5 Flash 经过全面改造,实现了 22% 的计算效率提升与更快的响应时间。在主题演讲中,Demis Hassabis 指出,Flash 相较前代“几乎在各个维度都有更佳表现”,其预览版已面向开发者在 Google AI Studio、Vertex AI 以及 Gemini 移动应用中提供。正式版预计在 2025 年 6 月上旬发布。最新发布的 Gemini 2.5 Flash 版本为 gemini-2.5-flash-preview-05-20,于 Google I/O 2025 发布。
扩展的多模态能力
Flash 与 Pro 两个版本共享新的多模态推理能力,允许用户在文本、图像、音频甚至视频输入上协作迭代。在 I/O 上展示的典型用例包括由单个提示生成的分形可视化,以及将教学视频转换为交互式教育体验的“视频到学习应用”管道。
开发者生态更新
Google AI Studio 集成
Google AI Studio 现已提供对 Gemini 2.5 Pro 与 Flash 的无缝访问。其原生代码编辑器直接嵌入模型,使开发者通过简单提示即可生成可用于生产的 Web 应用。入门模板涵盖从带音频的对话代理到实时数据分析仪表板等任务,将原型周期从数周缩短至数分钟。
Gemini API 进展
- 精简的函数调用:简化的模式定义将集成工作量减少 30%。
- 思考预算控制:开发者现在可以调节推理深度,以平衡成本与性能。
- Agentic 工作流:新的端点通过 Project Mariner 支持多步智能体编排,使 AI 通过一次调用即可自主执行多达 10 个关联任务(例如数据检索、摘要与报告生成)。
Gemini Code Assist 全面可用
Gemini 2.5 为个人用户与 GitHub 集成提供 Gemini Code Assist 支持,现已在免费与付费层级全面可用。该工具擅长代码转换、前端 UI 生成与自动重构,满足新手程序员与资深工程师的需求。
可用性与定价
Gemini 2.5 系列可通过 Vertex AI 向所有 Google Cloud 客户提供,性能等级由订阅级别决定:
- AI Pro($19.99/月)提供对 Gemini 2.5 Flash 及标准 2.5 Pro 功能的访问权限。
- AI Ultra($249.99/月)解锁 Deep Think、优先吞吐以及完整的多模态与 Agentic 能力套件,并包含 30 TB 云存储和 YouTube Premium 等捆绑服务。
结论与展望
随着最新的 Gemini 2.5 Pro 与 Flash 更新,Google 正在为 AI 的推理能力、交互性与开发者生产力树立新的标杆。Deep Think 的多假设评估结合原生音频、安全改进与效率提升,为更智能、可信与易用的 AI 系统铺平道路。随着这些模型在 6 月推出,它们在 Google AI Studio、Gemini API 与 Vertex AI 的集成将加速创新——从更智能的编码助手到沉浸式教育工具——重塑个人与组织利用人工智能的方式。
开始使用
CometAPI 提供统一的 REST 接口,将包括 Gemini 系列在内的数百个 AI 模型汇聚到一致的端点之下,并内置 API 密钥管理、用量配额与计费仪表板。无需同时处理多个供应商的 URL 和凭证。
开发者可以通过 CometAPI 访问 Gemini 2.5 Flash Pre API (model:gemini-2.5-flash-preview-05-20)以及 Gemini 2.5 Pro API(model:gemini-2.5-pro-preview-05-06)等。开始之前,请在 Playground 中探索模型能力,并查阅 API 指南 获取详细说明。访问之前,请确保已登录 CometAPI 并获得 API 密钥。
