Gemini 3.5 Flash 評測：功能、基準測試、定價及更多

Google 於 2026 年 5 月 19 日在 I/O 發布 Gemini 3.5 Flash，將其定位為一款為智能體工作流程、程式設計與多模態任務提供持續前沿表現的高智慧、速度優化模型。它在 Gemini 3 Flash 的基礎上，增強了「思考等級」，以在品質、成本與延遲之間取得平衡。

本完整指南涵蓋一切：什麼是 Gemini 3.5 Flash、其關鍵功能、詳細基準表現、定價、與 GPT-5.5、Claude 4.7/4.6 等的比較等。作為領先的 AI API 聚合平台，CometAPI 幫助開發者以統一定價、簡化整合與成本最佳化工具存取 Gemini 3.5 Flash（及其競品）。

什麼是 Gemini 3.5 Flash？

Gemini 3.5 Flash 建立在 Gemini 3 Flash 的推理基礎上，透過增強的「思考等級」（minimal、low、medium/default、high），精細調控品質—延遲—成本的取捨。它是原生多模態模型，支援文字、影像、影片、音訊與文件（含 PDF），具備 1M 代幣的上下文視窗與最高 65K 的輸出代幣。知識截止日期為 2025 年 1 月。

相較以往 Flash 模型的關鍵差異：

在智能體、程式設計與長期任務上具備「持續前沿表現」。
「思維保留」：在多輪對話中自動維持中間推理，無需額外 API 變更。
為規模而優化：面向並行智能體執行、迭代程式設計與多步驟企業工作流而設計。
尚無電腦操作（computer use）支援，但工具使用與函式呼叫能力大幅改進。

Google 將其定位為面向生產用途的「最智能的 Flash 模型」，在許多智能體與程式設計基準上超越先前的 Gemini 3.1 Pro，同時提供 Flash 級別的速度（測試中常見 >280 輸出代幣/秒）。

Gemini 3.5 Flash 在智能體工作流程與程式設計上表現出色，以最佳化的延遲與成本達到接近 Pro 的智能水準，取得如 Terminal-bench 2.1 的 76.2% 與 MCP Atlas 多步任務的 83.6% 等成績。

基準表現突破

獨立測試確認它以更高速度在程式設計/智能體任務上提供 Pro 級或更佳表現，但由於在複雜的智能體迴圈中使用更多代幣，以及相較先前 Flash 模型 3 倍的價格上漲，總體基準執行成本有所提升。

Gemini 3.5 Flash 相較前代在智能體與程式設計領域的提升尤為顯著。以下為 Google DeepMind 模型卡與獨立評測（截至 2026 年 5 月）的關鍵結果：

精選基準（Gemini 3.5 Flash 與對照）：

程式設計：

Terminal-bench 2.1（智能體終端程式設計）：76.2%（對比 Gemini 3 Flash 58.0%、Gemini 3.1 Pro 70.3%、GPT-5.5 78.2%）
SWE-Bench Pro（公開、多樣化智能體程式設計）：55.1%（對比 3 Flash 的 49.6%、3.1 Pro 的 54.2%）

智能體工具使用：

MCP Atlas（多步工作流程）：83.6%（領先）
Toolathlon（真實世界通用工具使用）：56.5%
Finance Agent v2：57.9%（較 3 Flash 大幅 +15.3%）

多模態：

CharXiv（圖表推理）：84.2%
MMMU-Pro：83.6%（領先許多競品）

推理與長上下文：

Humanity’s Last Exam：40.2%
ARC-AGI-2：72.1%
MRCR v2（128k）：77.3%；1M 上下文的單點表現強勁，達 26.6%。

Gemini 3.5 Flash 評測：功能、基準測試、定價及更多

Artificial Analysis Intelligence Index：Gemini 3.5 Flash 得分 55（高思考力），較 Gemini 3 Flash 提升 9 點。其在智能與速度的帕累托前沿上領先，在智能體任務上取得增益並降低幻覺（幻覺率降至 61%）。輸出速度達 >280 代幣/秒，但在智能體迴圈中會產生較高代幣用量。

它在長上下文（強勁的 MRCR v2 與 1M 單點表現）、多模態領域（圖表、文件）表現領先，並在持續的智能體任務中展現更少的代幣浪費（例如在某些資安基準上提升 42%，且代幣減少 72%）。

速度與智能體能力的平衡

Gemini 3.5 Flash 在「速度—智能」的權衡中表現突出。它在提供高吞吐量（>280 tokens/s）的同時，支援先進的智能體行為，如子智能體部署、並行執行與快速迭代。

預設的思考力度現在為 medium，從 Gemini 3 Flash Preview 的 high 調整而來。

「思考等級」提供精細控制：

Medium（預設）：對大多數複雜程式與智能體任務提供最佳平衡。
High：對最困難的問題實現最深度推理。
Low/Minimal：面向較簡單查詢的超低延遲。

Google 報告指出在真實世界的智能體場景中，代幣效率大幅提升（例如相較先前版本，在某些資安基準中代幣減少 72%），讓其可勝任長時間、持續運行的工作流程。

「取捨」：由於價格高於先前的 Flash 模型，在代幣密集的智能體場景中，整體成本會增加（由於定價與用量，對比 Gemini 3 Flash 的 Intelligence Index 成本為 5.5 倍）。

更強的智能體能力

Gemini 3.5 Flash 推動「智能體 Gemini 時代」。關鍵增強包括：

並行智能體執行迴圈：可部署多個子智能體解決複雜問題。
迭代式編碼與原型：結合動態工具使用，快速探索解法路徑。
長期多步工作流程：在思維保留的前提下處理延展的企業流程。
工具使用改進：嚴格的函式回應匹配、多模態函式回應，且透過更佳提示與較低思考等級減少不必要呼叫。對 OSWorld 與 UI 任務表現強勁。

它為 Google 的新資訊型智能體、自主研究與程式管線提供動力。在內部測試中，擅長構建複雜系統與管理研究專案。

對開發者而言，新推出的 Interactions API（測試版）簡化了伺服端歷史管理，類似於其他生態系中的進階模式。

CometAPI 建議：使用我們的統一 API，將 Gemini 3.5 Flash 與專項模型鏈接（例如用 Claude 進行深度程式碼審查或用 GPT 處理創意任務）以構建智能體系統。我們的路由與回退功能可確保可靠性與節省成本。

多模態領先

Google 在多模態理解上保持領先。Gemini 3.5 Flash 原生處理並推理文字 + 圖像 + 視頻 + 音訊 + 文件。在 CharXiv、MMMU-Pro 與影片理解等基準上領先或緊追競品。

應用場景：圖表/資料綜合、影片分析、多模態函式呼叫（如在工具回應中處理影像）、與豐富媒體智能體。非常適合用於電商、內容創作、科學可視化等應用。

定價：Gemini 3.5 Flash 費用是多少？

Gemini API 定價（每 100 萬代幣，全球近似價格）：

輸入（文字/影像/影片/音訊）：$1.50
輸出：$9.00
上下文快取：$0.15（對重複提示可大幅節省）

這相較 Gemini 3 Flash Preview（$0.50/$3）約增加 3 倍，但就能力躍升而言仍具競爭力。定價接近 Gemini 3.1 Pro（$2/$12），但在許多工作負載上提供更佳速度。

免費層：可透過 Google AI Studio/Gemini 應用取得有限存取；生產用途需付費。

Cometapi 優勢：透過 Gemini 3.5 Flash API 與 100+ 模型以具競爭力的費率存取，並提供使用分析與最佳化工具以最小化代幣支出。我們的平台常透過智慧路由與批次處理提供更佳的有效價格。API 價格通常較官方價低 20%。

Gemini 3.5 Flash 與 GPT-5.5、Claude 4.7/4.6 等對比

Gemini 3.5 Flash 的優勢：

速度 + 智能體平衡：較多數前沿模型推理更快，同時縮小智能差距。
多模態與長上下文：原生 1M 上下文與視覺領先。
大規模成本：對許多工作負載而言，單位代幣成本較頂級 Claude/GPT 更低，尤其搭配快取。
Google 生態：與 Search、Workspace、Cloud 無縫整合。

競品具優勢之處：

GPT-5.5 常在純推理（如 ARC-AGI）上領先，且在創意/通用能力上可能更強。
Claude Opus 4.7/Sonnet 4.6 在謹慎編碼（某些情境的 SWE-Bench 更高）與細緻寫作/安全性上表現突出。
代幣效率不一；智能體迴圈可能使 3.5 Flash 的整體成本更高。

高層級比較（近似/精選指標；請隨時驗證最新榜單）：

Benchmark / Metric	Gemini 3.5 Flash	GPT-5.5	Claude Opus 4.7 / Sonnet 4.6	Gemini 3.1 Pro	Notes
Terminal-bench 2.1 (Coding)	76.2%	78.2%	~66%	70.3%	Agentic coding
MCP Atlas (Agentic)	83.6%	75.3%	79.1% / 69.5%	78.2%	Multi-step workflows
GDPval-AA (Agentic Knowledge)	1656 Elo	1769	1753	1314	Economic value
MMMU-Pro (Multimodal)	83.6%	81.2%	~75%	80.5%	Strong Gemini lead
Intelligence Index (AA)	55	High (varies)	Competitive	Lower	Pareto speed/intel
Speed (tokens/s)	>280	Lower	Variable	Slower	Flash advantage
Input/Output Price ($/1M)	1.50 / 9.00	Higher	Higher (esp. Opus)	2/12	Cost-effective frontier
Context Window	1M	Competitive	Strong	1M+	All frontier-level

權衡總結：

Gemini 3.5 Flash 在速度 + 多模態 + 智能體效率方面對大規模應用更具優勢。
GPT-5.5 常在純推理/編碼峰值上略勝。
Claude 4.7 Opus 在謹慎、高可靠性編碼上表現優秀，但成本/延遲更高。

Gemini 經常在多模態與特定智能體套件中領先或持平，同時對高量使用更快且更實惠。

如何存取與整合 Gemini 3.5 Flash

可透過以下方式存取：

Gemini App / Google AI Studio
Gemini API（gemini-3.5-flash）
Google Cloud Vertex AI / Enterprise Agent Platform
第三方聚合商，獲得多供應商彈性。

Cometapi.com 建議：生產應用可在 Cometapi.com 上以單一 API Key 整合一次，即可存取 Gemini 3.5 Flash（以及來自 OpenAI、Anthropic、xAI 等的 500+ 模型），有效價格降低 20–40%，無供應商綁定，且易於更換模型。

對你的專案的好處：

僅更改模型名稱即可即時對比測試 Gemini 3.5 Flash 與 GPT-5.5 或 Claude 4.7。
統一計費、回退路由與最佳化延遲。
非常適合需要跨供應商可靠性的智能體應用。
免費註冊 API Key，提供寬鬆的測試配額。

透過官方 SDK 或 CometAPI 的統一端點整合十分簡單——非常適合擴展程式設計

使用案例與最佳實踐

智能體自動化：為研究、資料分析或客戶支援構建穩健的多智能體系統。
程式設計與開發：在 Antigravity 或 IDE 中進行迭代原型、除錯與完整管線生成。
多模態應用：影像/影片分析、圖表理解、內容生成。
企業工作流程：透過快取與思考等級控管成本的長期流程。

提示：提供完整對話歷史以利思維保留。以 medium 思考等級起步。優化提示以減少工具呼叫。監控代幣用量以提高成本效率。

限制與注意事項

價格上漲需要在高量應用中仔細優化。
暫無電腦操作（computer use），請持續關注更新。
安全評估顯示在語氣等方面表現穩健，但自動化指標仍有差異。
幻覺減少顯著，但對關鍵輸出務必驗證。
價格上漲：高於先前 Flash 模型；可透過思考等級與快取最佳化。
知識截止：2025 年 1 月—對於時事請搭配檢索/搜尋工具進行錨定。

結論：Gemini 3.5 Flash 值得嗎？

值得——對優先考量速度、智能體可靠性、多模態能力與可擴展表現的開發者與企業而言尤甚。它推動了帕累托前沿，使前沿 AI 更易於用於生產工作負載。

準備好開始構建了嗎？ 立即前往 CometAPI 在同一儀表板中測試 Gemini 3.5 Flash 與其他頂級模型。最佳化你的 AI 技術棧、降低成本、加速上線。

Gemini 3.5 Flash 評測：功能、基準測試、定價及更多

什麼是 Gemini 3.5 Flash？

基準表現突破

精選基準（Gemini 3.5 Flash 與對照）：

速度與智能體能力的平衡

更強的智能體能力

多模態領先

定價：Gemini 3.5 Flash 費用是多少？

Gemini 3.5 Flash 與 GPT-5.5、Claude 4.7/4.6 等對比

Gemini 3.5 Flash 的優勢：

競品具優勢之處：

如何存取與整合 Gemini 3.5 Flash

對你的專案的好處：

使用案例與最佳實踐

限制與注意事項

結論：Gemini 3.5 Flash 值得嗎？

準備好將 AI 開發成本降低 20% 了嗎？

閱讀更多