Google 已升级 Gemini 2.5 Flash 和 2.5 Flash-Lite,以提供更好的性能

CometAPI
AnnaSep 27, 2025
Google 已升级 Gemini 2.5 Flash 和 2.5 Flash-Lite,以提供更好的性能

在 2025 年 9 月 25 日,Google 发布了 Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite 的预览更新。这些预览版带来了更快、更高效的输出、更好的指令遵循和多模态能力,并新增 -latest 别名,方便开发者轻松测试最新构建。现在让我们看看这两个模型的具体调整。

核心改进

Gemini 2.5 Flash-Lite

更好地遵循复杂指令:提升对复杂提示词和系统命令的理解。

  • 指令遵循与冗长度: Flash-Lite 针对复杂指令遵循进行了优化,并生成更精炼的输出(有助于降低成本并提升吞吐量)。
  • 多模态与转写/翻译: Flash-Lite 提升了音频转写、图像理解和翻译质量。
  • 成本优化:将输出 token 数量减少 50%。
  • 使用的模型字符串:gemini-2.5-flash-lite-preview-09-2025。

Gemini 2.5 Flash

Flash: 改进了 agentic/工具使用(更擅长多步骤工作流和工具调用),并在质量/速度方面进行了优化,这对大规模、低延迟/agentic 部署至关重要。

  • 多模态 I/O 与 token 限制: Flash 接受文本、代码、图像、音频和视频等多种输入形式;部分 Flash 图像预览支持文本+图像输出。2.5 Flash 各变体在支持的预览/变体中输入与输出 token 上限可达 32,768。
  • “思考”能力:Gemini 2.5 Flash 是一款 Flash 级模型,现已支持“思考”(展示中间的思路/过程信息,以提升推理能力与透明度)。
  • Agentic/工具使用(Flash): Gemini 2.5 Flash 改进了其在多步骤/agentic 工作流中的工具使用方式(相较上一版本,在 SWE-Bench Verified 上约有 ~5% 提升)。启用“思考”后,对于复杂任务更具成本效率。

Gemini 2.5 Flash

实际影响 / 推荐用法

  • 对成本敏感、需要高吞吐的流水线(批量摘要、实时转录处理、翻译)使用 Flash-Lite 预览版,在这些场景中更少的 token 使用与更快的吞吐更为重要。
  • 使用 Flash 预览版来试验基于 agentic/工具的流程,以及受益于“思考”模式与结构化输出的工作流(智能体、编排、多步骤助理)。
  • 为确保生产环境稳定性,在验证新构建之前,请继续指向稳定的模型 ID(例如 gemini-2.5-flashgemini-2.5-flash-lite),而非 -preview-latest 别名。

其他更新

引入 -latest 模型别名(例如 gemini-flash-latest 和 gemini-flash-lite-latest),可自动指向最新版本,避免开发者频繁修改代码。

为保持稳定性,要求稳定环境的应用建议继续使用 gemini-2.5-flash 和 gemini-2.5-flash-lite。

入门

CometAPI 是一个统一的 API 平台,将来自领先提供商的 500+ 款 AI 模型(如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到单一且对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理,CometAPI 大幅简化了将 AI 能力集成到应用中的流程。无论你在构建聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析流水线,CometAPI 都能帮助你更快迭代、控制成本并保持供应商无关性,同时获取 AI 生态的最新突破。

开发者可通过 CometAPI 访问 Gemini 2.5 FlashGemini 2.5 Flash-Lite最新的模型版本 始终与官网保持同步更新。开始之前,请在 Playground 探索模型能力,并查阅 API 指南 获取详细说明。访问前,请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官网的价格,帮助你完成集成。

准备好开始了吗?→ 立即注册 CometAPI

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣