模型支援企業部落格
500+ AI 模型 API,全部整合在一個 API 中。就在 CometAPI
模型 API
開發者
快速入門說明文件API 儀表板
資源
AI模型部落格企業更新日誌關於
2025 CometAPI. 保留所有權利。隱私政策服務條款
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

輸入:$0.08/M
輸出:$0.32/M
上下文:1M
最大輸出:65K
為高成本效益與高吞吐量而優化的 Gemini 2.5 Flash 模型。最小、最具成本效益的模型,專為大規模使用而設計。
新
商業用途
Playground
概覽
功能
定價
API
版本

技術詳細資訊

  • 自適應推理:Gemini 2.5 Flash-Lite 支援按需思考,允許開發者僅在需要更深層推理時分配運算資源。
  • 工具整合:與 Gemini 2.5 原生工具完全相容,包括 Grounding with Google Search、Code Execution、URL Context 與 Function Calling,以支援無縫的多模態工作流程。
  • Model Context Protocol (MCP):利用 Google 的 MCP 擷取即時網路資料,確保回應最新且具脈絡相關性。
  • 部署選項:可透過 CometAPI、Gemini API、Vertex AI 與 Google AI Studio 使用,並提供預覽通道,供早期採用者試用與回饋。

Gemini 2.5 Flash-Lite 的基準效能

  • 延遲:相較於 Gemini 2.5 Flash,中位數回應時間最多降低 50%;在標準分類與摘要基準上,典型延遲低於 100 ms。
  • 吞吐量:為高流量工作負載最佳化,可在每分鐘持續處理數萬個請求且不降速。
  • 價格效能:相較 Flash 對應版本,每 1,000 tokens 成本降低 25%,對成本敏感部署而言是帕累托最優的選擇。
  • 產業採用:早期使用者回報能無縫整合至生產管線,效能指標與初始預期一致或更佳。

Gemini 2.5 Flash Lite


理想使用情境

  • 高頻、低複雜度任務: 自動標註、情緒分析與批量翻譯
  • 對成本敏感的流程: 從大型文件語料中抽取資料、定期批次摘要
  • 邊緣與行動情境: 當延遲至關重要但資源預算受限時

Gemini 2.5 Flash-Lite 的限制

  • 預覽狀態:在 GA 前可能發生 API 變更;整合時應考量可能的版本升級。
  • 不支援即時微調:無法上傳自訂權重;需依賴提示工程與系統訊息。
  • 創造力較弱:為確定性、高吞吐任務而調校;不太適合開放式生成或「創意」寫作。
  • 資源上限:僅能線性擴展至約 ~16 vCPU;超出後吞吐提升將趨緩。
  • 多模態限制:支援影像/音訊輸入但保真度有限;不適合重度視覺或語音轉錄任務。
  • 上下文視窗取捨:雖可接受最多 1 M tokens,但在該規模下的實際推論可能出現吞吐量下降。

Gemini 2.5 Flash Lite 的功能

探索 Gemini 2.5 Flash Lite 的核心功能,專為提升效能和可用性而設計。了解這些功能如何為您的專案帶來效益並改善使用者體驗。

Gemini 2.5 Flash Lite 的定價

探索 Gemini 2.5 Flash Lite 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Gemini 2.5 Flash Lite 如何在保持成本可控的同時提升您的專案效果。
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Gemini 2.5 Flash Lite 的範例程式碼和 API

存取完整的範例程式碼和 API 資源,以簡化您的 Gemini 2.5 Flash Lite 整合流程。我們詳盡的文件提供逐步指引,協助您在專案中充分發揮 Gemini 2.5 Flash Lite 的潛力。
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Gemini 2.5 Flash Lite的版本

Gemini 2.5 Flash Lite擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking

更多模型

A

Claude Opus 4.6

輸入:$4/M
輸出:$20/M
Claude Opus 4.6 是 Anthropic 的「Opus」級大型語言模型,於 2026 年 2 月發布。它被定位為知識工作與研究工作流程的主力,著重提升長上下文推理、多步規劃、工具使用(包括代理型軟體工作流程),以及電腦操作任務,例如自動化製作投影片與試算表。
A

Claude Sonnet 4.6

輸入:$2.4/M
輸出:$12/M
Claude Sonnet 4.6 是我們迄今為止最強大的 Sonnet 模型。它對模型在程式設計、電腦操作、長上下文推理、代理規劃、知識工作與設計等方面的能力進行了全面升級。Sonnet 4.6 亦提供 1M 詞元的上下文視窗,目前處於 Beta 階段。
O

GPT-5.4 nano

輸入:$0.16/M
輸出:$1/M
GPT-5.4 nano 專為速度與成本最為關鍵的任務而設計,例如分類、資料擷取、排序與子智能體。
O

GPT-5.4 mini

輸入:$0.6/M
輸出:$3.6/M
GPT-5.4 mini 將 GPT-5.4 的優勢帶入一個更快速、更高效、專為大量工作負載設計的模型。
A

Claude Mythos Preview

A

Claude Mythos Preview

即將推出
輸入:$60/M
輸出:$240/M
Claude Mythos Preview 是我們迄今最強大的前沿模型,與我們先前的前沿模型 Claude Opus 4.6 相比,在多項評測基準上的分數呈現出 顯著躍升。
X

mimo-v2-pro

輸入:$0.8/M
輸出:$2.4/M
MiMo-V2-Pro 是 Xiaomi 的旗艦級基礎模型,具備超過 1T 的總參數與 1M 的上下文長度,並針對 Agent 化場景進行了深度優化。它可高度適配 OpenClaw 等通用 Agent 框架。在標準的 PinchBench 與 ClawBench 基準測試中名列全球頂尖,其感知表現接近 Opus 4.6。MiMo-V2-Pro 旨在作為 Agent 系統的大腦,編排複雜工作流程、推動生產級工程任務,並可靠地交付結果。

相關部落格

Free Gemini 2.5 Pro API 是否出問題?2025 年免費配額的變更
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Free Gemini 2.5 Pro API 是否出問題?2025 年免費配額的變更

Google 已大幅收緊 Gemini API 的免費層級:Gemini 2.5 Pro 已從免費層移除,Gemini 2.5 Flash 的每日免費請求數也被大幅削減(據報:~250 → ~20/天)。這並不意味著該模型對實驗用途已永久「死亡」——但確實意味著在許多真實世界用例中,免費存取已被實質上剝奪。