Google 已升级 Gemini 2.5 Flash 和 2.5 Flash-Lite，以提供更好的性能

在 2025 年 9 月 25 日，Google 发布了 Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite 的预览更新。这些预览版带来了更快、更高效的输出、更好的指令遵循和多模态能力，并新增 -latest 别名，方便开发者轻松测试最新构建。现在让我们看看这两个模型的具体调整。

核心改进

Gemini 2.5 Flash-Lite

更好地遵循复杂指令：提升对复杂提示词和系统命令的理解。

指令遵循与冗长度： Flash-Lite 针对复杂指令遵循进行了优化，并生成更精炼的输出（有助于降低成本并提升吞吐量）。
多模态与转写/翻译： Flash-Lite 提升了音频转写、图像理解和翻译质量。
成本优化：将输出 token 数量减少 50%。
使用的模型字符串：gemini-2.5-flash-lite-preview-09-2025。

Gemini 2.5 Flash

Flash： 改进了 agentic/工具使用（更擅长多步骤工作流和工具调用），并在质量/速度方面进行了优化，这对大规模、低延迟/agentic 部署至关重要。

多模态 I/O 与 token 限制： Flash 接受文本、代码、图像、音频和视频等多种输入形式；部分 Flash 图像预览支持文本+图像输出。2.5 Flash 各变体在支持的预览/变体中输入与输出 token 上限可达 32,768。
“思考”能力：Gemini 2.5 Flash 是一款 Flash 级模型，现已支持“思考”（展示中间的思路/过程信息，以提升推理能力与透明度）。
Agentic/工具使用（Flash）： Gemini 2.5 Flash 改进了其在多步骤/agentic 工作流中的工具使用方式（相较上一版本，在 SWE-Bench Verified 上约有 ~5% 提升）。启用“思考”后，对于复杂任务更具成本效率。

Gemini 2.5 Flash

实际影响 / 推荐用法

对成本敏感、需要高吞吐的流水线（批量摘要、实时转录处理、翻译）使用 Flash-Lite 预览版，在这些场景中更少的 token 使用与更快的吞吐更为重要。
使用 Flash 预览版来试验基于 agentic/工具的流程，以及受益于“思考”模式与结构化输出的工作流（智能体、编排、多步骤助理）。
为确保生产环境稳定性，在验证新构建之前，请继续指向稳定的模型 ID（例如 gemini-2.5-flash、gemini-2.5-flash-lite），而非 -preview 或 -latest 别名。

其他更新

引入 -latest 模型别名（例如 gemini-flash-latest 和 gemini-flash-lite-latest），可自动指向最新版本，避免开发者频繁修改代码。

为保持稳定性，要求稳定环境的应用建议继续使用 gemini-2.5-flash 和 gemini-2.5-flash-lite。

入门

CometAPI 是一个统一的 API 平台，将来自领先提供商的 500+ 款 AI 模型（如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等）聚合到单一且对开发者友好的接口中。通过提供一致的认证、请求格式与响应处理，CometAPI 大幅简化了将 AI 能力集成到应用中的流程。无论你在构建聊天机器人、图像生成器、音乐创作工具，还是数据驱动的分析流水线，CometAPI 都能帮助你更快迭代、控制成本并保持供应商无关性，同时获取 AI 生态的最新突破。

开发者可通过 CometAPI 访问 Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite，最新的模型版本始终与官网保持同步更新。开始之前，请在 Playground 探索模型能力，并查阅 API 指南获取详细说明。访问前，请确保已登录 CometAPI 并获取 API key。CometAPI 提供远低于官网的价格，帮助你完成集成。

核心改进

Gemini 2.5 Flash-Lite

Gemini 2.5 Flash

实际影响 / 推荐用法

其他更新

入门

阅读更多

一个 API 中超 500 个模型