Google升級 Gemini 2.5 Flash 與 2.5 Flash-Lite,提供更佳效能

CometAPI
AnnaSep 27, 2025
Google升級 Gemini 2.5 Flash 與 2.5 Flash-Lite,提供更佳效能

On 9月25,2025 Google 發布了預覽更新 雙子座2.5閃存 雙子座 2.5 Flash-Lite。預覽版帶來了更快、更有效率的輸出、更好的指令遵循和多模式能力,以及新的 -latest 別名,以便開發人員可以輕鬆測試最新版本。現在讓我們看看這兩種模型具體調整了什麼。

核心改進

雙子座 2.5 Flash-Lite

更好地遵循複雜指令:提高對複雜提示和系統命令的理解。

  • 指令遵循和詳細程度: Flash-Lite 經過調整,可以更好地遵循複雜的指示,並產生 更簡潔 輸出(有助於降低成本和提高吞吐量)。
  • 多模式和轉錄/翻譯: Flash-Lite 提高了音訊轉錄、影像理解和翻譯品質。
  • 成本最佳化:減少 50% 的輸出令牌數量。
  • 使用模型字串:gemini-2.5-flash-lite-preview-09-2025。

雙子座2.5閃存

閃光燈: 改進的代理/工具使用(更好地處理多步驟工作流程和工具呼叫),以及對大規模低延遲/代理部署很重要的品質/速度改進。

  • 多模式 I/O 和令牌限制: Flash 接受各種變體的文字、程式碼、圖像、音訊和視訊作為輸入;部分 Flash 圖像預覽支援文字+圖像輸出。 2.5 Flash 變體的代幣上限為 32,768 支援的預覽/變體中的輸入和輸出令牌。
  • 「思考」能力: Gemini 2.5 Flash 是一款 Flash 級型號,現在支持 思維 (顯示中間思路/過程資訊以提高推理能力和透明度)。
  • 代理/工具使用(Flash): Gemini 2.5 Flash 改進了其使用多步驟/代理工作流程工具的方式(注意〜增益5% 在 SWE-Bench Verified 與先前版本相比)。啟用「思考」功能後,複雜任務的成本效益更高。

雙子座2.5閃存

實際意義/推薦用途

  • 使用 Flash-Lite 預覽 對於成本敏感、高吞吐量的管道(批量匯總、即時記錄處理、翻譯),減少令牌的使用和更快的吞吐量很重要。
  • 使用 Flash 預覽 嘗試受益於「思考」模式和結構化輸出(代理、編排、多步驟助手)的代理/基於工具的流程和工作流程。
  • 為了確保生產穩定性,請繼續指向穩定的模型 ID(例如, gemini-2.5-flash, gemini-2.5-flash-lite)而不是 -preview or -latest 別名,直到您驗證了新版本。

其他更新

引入 -latest 模型別名(例如 gemini-flash-latest 和 gemini-flash-lite-latest)以自動指向最新版本,從而使開發人員免於頻繁更改程式碼。

為了保持穩定性,建議需要穩定環境的應用程式繼續使用 gemini-2.5-flash 和 gemini-2.5-flash-lite。

入門

CometAPI 是一個統一的 API 平台,它將來自領先供應商(例如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)的 500 多個 AI 模型聚合到一個開發者友好的介面中。透過提供一致的身份驗證、請求格式和回應處理,CometAPI 顯著簡化了將 AI 功能整合到您的應用程式中的過程。無論您是建立聊天機器人、影像產生器、音樂作曲家,還是資料驅動的分析流程,CometAPI 都能讓您更快地迭代、控製成本,並保持與供應商的兼容性——同時也能充分利用整個 AI 生態系統的最新突破。

開發人員可以訪問 雙子座2.5閃存  雙子座 2.5 Flash-Lite 透過 CometAPI, 最新型號版本 始終與官方網站同步更新。首先,探索該模型的功能 游乐场 並諮詢 API指南 以獲得詳細說明。造訪前請確保您已經登入CometAPI並取得API金鑰。 彗星API 提供遠低於官方價格的價格,幫助您整合。

準備出發了嗎? → 立即註冊 CometAPI !

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣