Gemini 2.5 Flash 的設計旨在在不犧牲輸出品質的前提下,提供快速回應。它支援多模態輸入,包括文字、影像、音訊與視訊,適用於多元應用。該模型可透過 Google AI Studio 與 Vertex AI 等平台存取,為開發者提供無縫整合至各類系統所需的工具。
Gemini 2.5 Flash 引入多項亮點功能,使其在 Gemini 2.5 系列中脫穎而出:
Gemini 2.5 Flash 已歷經以下關鍵版本:
截至 2025 年 7 月,Gemini 2.5 Flash 已公開穩定可用(與 gemini-2.5-flash-preview-05-20 無變更)。若您使用 gemini-2.5-flash-preview-04-17,現有的預覽定價將持續至 2025 年 7 月 15 日該模型端點按計畫淘汰之時,屆時端點將關閉。您可以遷移至全面可用的模型 gemini-2.5-flash。
更快、更便宜、更聰明:
輸入上下文視窗:最多 100 萬個權杖,支援大幅度的上下文保留。
輸出權杖:單次回應可產生最多 8,192 個權杖。
支援的模態:文字、影像、音訊與視訊。
整合平台:可透過 Google AI Studio 與 Vertex AI 使用。
定價:具競爭力的權杖計費模型,有助於具成本效益的部署。
在底層實作上,Gemini 2.5 Flash 是一個以 transformer 為基礎的大型語言模型,訓練資料涵蓋網頁、程式碼、影像與視訊。關鍵技術規格包括:
多模態訓練:透過多種模態對齊訓練,Flash 可無縫混合文字與影像、視訊或音訊,適用於影片摘要或音訊描述等任務。
動態思考流程:實作內部推理循環,模型會在最終輸出前進行規劃並拆解複雜提示。
可配置的思考預算:thinking_budget 可從 0(無推理)設為最高 24,576 權杖,允許在延遲與答案品質間取捨。
工具整合:支援 Grounding with Google Search、Code Execution、URL Context 與 Function Calling,能從自然語言提示直接驅動真實世界動作。
在嚴格的評測中,Gemini 2.5 Flash 展現出業界領先的表現:
這些結果顯示 Gemini 2.5 Flash 在推理、科學理解、數學問題求解、程式設計、視覺理解與多語言能力方面具備競爭優勢:

| 彗星價格 (USD / M Tokens) | 官方價格 (USD / M Tokens) |
|---|---|
輸入:$0.24/M 輸出:$2.00/M | 輸入:$0.30/M 輸出:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)