人工智慧已進入以推理為中心的模型新階段,而此領域最重要的發佈之一是具備先進 Deep Think 模式 的 Gemini 3.1 Pro,由 Google DeepMind 開發。該系統於 2026 年初推出,在推理效能、多模態理解與基於代理的任務執行方面皆有重大飛躍。
與先前的 Gemini 世代相比,Gemini 3.1 引入了更長的上下文視窗、更強的工具使用能力,以及在推理、程式設計與科學任務上的更高基準分數。此模型迅速成為開發者、研究人員與企業追求進階 AI 能力的首選。
同時,存取 Gemini 3.1 Deep Think 並非總是那麼直觀。一些能力僅限於特定的訂閱層級、地區或企業 API。對於開發者與組織而言,第三方平台如 CometAPI 正成為將該模型整合至應用程式的實用方式。
什麼是 Gemini 3.1 Deep Think?
Gemini 3.1 Deep Think 是建立在 Gemini AI 模型架構之上的專用推理模式。與標準對話模型的快速回覆不同,Deep Think 會投入額外的計算資源來分析複雜任務、驗證中間結果,並產生更準確的結論。
使用名為 Aletheia 的 Deep Think 驅動代理所做的研究實驗顯示,其在 FirstProof 挑戰中的10 道高階數學研究問題裡解出 6 道,展現 AI 輔助科學發現的潛力。
核心能力(新特性)
- 可配置的思考層級 — 對淺層/快速回覆與高深度 Deep Think 模式進行分層控制(明確的「thinking」原語)。
- 超長上下文視窗 — 某些變體支援約 1,048,576 個輸入 tokens 與最多 65,536 個輸出 tokens,能在單次會話中對超大型文件或程式碼庫進行推理。
- 多模態輸入 — 在單次會話中同時處理文字 + 影像 + 視訊/PDF,以進行跨模態推理(於支援之處)。
- 代理/工具使用 — 結構化函式呼叫、自訂工具端點與程式碼執行掛鉤,支援代理式工作流程。
Gemini 3.1 Deep Think 如何運作?
認識 Deep Think 模式
Gemini Deep Think 是一種進階推理模式,旨在透過多步分析、驗證與反覆推理來解決複雜問題。
Deep Think 模型不會立即產生單一回應,而是遵循一個結構化的推理流程:
- 問題詮釋
- 假設生成
- 候選解法產生
- 驗證與校核
- 迭代精修
此架構使模型更像一位研究助理或解題代理,能分析困難的科學、數學與工程挑戰。
Google DeepMind 的最新研究展示了 Deep Think 如何驅動 Aletheia:該研究代理會在回傳最終答案前先生成解法並加以驗證。
Deep Think 推理流程
Problem │ ▼Generator → Candidate Solution │ ▼Verifier ├── Correct → Final Answer ├── Minor Error → Reviser → Candidate └── Critical Error → Generator
相較於一次性輸出的 AI,這個推理循環能提升可靠性。
Gemini 3.1 Deep Think 的關鍵特性
1. 多步推理
Deep Think 擅長需要結構化推理的問題:
- 數學證明
- 科學假設驗證
- 演算法設計
- 複雜除錯
不同於標準 LLM 的輸出,該模型會在提供答案前系統性地分析每一步。
2. 進階科學研究支援
Deep Think 專為協助解決物理、數學與電腦科學中的研究級問題而設計。
範例包括:
- 數學定理探索
- 數據分析流程
- 模擬邏輯生成
3. 長上下文理解
Gemini 3.1 模型在某些配置中支援極大的上下文視窗(最高 100 萬個 tokens),能處理整篇研究論文、大型程式碼庫或長資料集。
這大幅改善以下任務的 AI 表現:
- 完整儲存庫分析
- 企業文件推理
- 大規模知識綜整。
4. 可調整的思考層級
Gemini 3.1 引入了三種推理強度等級,讓使用者能控制模型解題所投入的計算資源。
典型等級包括:
- 快速推理(基本回應)
- 中等推理(結構化分析)
- Deep Think(最高推理深度)
5. 多模態智能
Gemini 3.1 支援多種資料型態:
- 文字
- 影像
- 音訊
- 視訊
- 程式碼
這使 Deep Think 能分析如軟體儲存庫結合文件與圖表等複雜工作流程。
Gemini 3.1 Deep Think 的效能基準
基準概覽
Gemini 3.1 Pro 在多項推理基準上取得最先進的表現。
主要指標
| 基準 | 分數 |
|---|---|
| ARC-AGI-2 | 77.1% |
| Expert Science | 94.3% |
| LiveCodeBench Pro | 2887 Elo |
| Financial Spreadsheet QA | 82.4% |
該模型相較於 Gemini 3 Pro,在 ARC-AGI-2 上的分數提高了兩倍以上。
ARC-AGI-2 推理基準
ARC-AGI-2 測試類似於人類問題解決的抽象推理。
Gemini 3.1 結果:
- Gemini 3.1 Pro → 77.1%
- Claude Opus 4.6 → 68.8%
- GPT-5.2 Codex → 52.9%
這些分數顯示 Gemini 在抽象推理方面具有顯著優勢。
科學研究基準
在科學推理基準中,Gemini 3.1 Pro 於 Expert Science 取得 94.3%,顯示其在研究所層級的 STEM 任務上表現出色。
此外,Deep Think 系統在國際科學奧林匹克層級的問題上達到金牌水準的表現。
程式設計表現
Gemini 3.1 Pro 展現強大的程式能力:
- LiveCodeBench Elo:2887
- 在演算法任務上表現優於許多競爭模型
使其適用於進階的軟體開發工作流程。
Gemini 3.1 與 Deep Think:差異解讀
許多使用者會把 Gemini 3.1 Pro 與 Deep Think 混淆。
| 功能 | Gemini 3.1 Pro | Gemini Deep Think |
|---|---|---|
| 模型類型 | 基礎模型 | 推理模式 |
| 速度 | 快 | 較慢但更深入 |
| 目的 | 一般任務 | 複雜推理 |
| 典型用途 | 聊天、寫作、程式設計 | 研究、工程 |
Deep Think 本質上是疊加在 Gemini 模型之上的高運算量推理層,而非完全獨立的模型。
如何取得 Gemini 3.1 Deep Think
由於執行推理引擎所需的計算成本很高,目前存取 Gemini Deep Think 仍有限制。依據你是個人使用者、開發者/研究人員或企業,主要有三種途徑:
1) 消費者/高階使用者(Gemini app 與 Google AI Ultra)
- Gemini app:Deep Think 模式已隨消費者推廣提供給 Google AI Ultra 訂閱用戶。若你是付費個人訂閱者,請在 app 的模型設定與「思考等級」控制中啟用 Deep Think 以用於你的對話。
2) 研究人員與開發者(Gemini API / Google AI Studio)
- 表達興趣/申請搶先體驗:Google 的 Deep Think 公告邀請研究人員與企業表達 API 存取意願;開發者也可使用 Google AI Studio 中的 Gemini API 與相關開發工具(Gemini CLI、Antigravity),其中已發佈
gemini-3.1-pro-preview端點。若你隸屬研究機構或研發組織,請遵循 Google 的搶先體驗流程與 AI Studio 的導入步驟。 - 使用已文件化的預覽模型 ID:開發者文件列出
gemini-3.1-pro-preview與-customtools變體以支援自訂工具整合。你可以在 CometAPI 上存取 Gemini 3.1 Pro API。CometAPI 能為希望以單一 API 門戶整合多模型的團隊簡化整合流程,且常提供更低的定價。
1. 訂閱 Google AI Ultra
最直接的方式是透過 Google AI Ultra,這是 Gemini 服務的最高階訂閱。
主要福利包括:
- 存取 Deep Think 模式
- 更高的 AI 使用上限
- 實驗性功能
- 新模型的搶先使用。
Google AI Ultra 也包含如視訊生成與擴增儲存整合等進階能力。
此層級主要面向:
- 研究人員
- 企業開發者
- 專業 AI 使用者。
2. 使用 Gemini App
Gemini App 透過 Google 的消費者 AI 平台提供進階模型存取。
使用步驟:
- 建立或登入 Google 帳戶
- 升級至符合資格的 Gemini 訂閱
- 啟用進階推理功能
- 選擇 Deep Think 或進階推理模式
Gemini 助理也正擴展至 Chrome 與行動裝置 等平台,可摘要網頁、管理任務並整合 Google 服務。
3. 透過 Gemini API 存取(開發者)
開發者可透過 Gemini API 存取進階的 Gemini 模型。
典型步驟:
- 在 Google AI Studio 建立專案
- 啟用 Gemini API
- 申請 Deep Think 的搶先體驗
- 透過 API 將推理能力整合至應用程式。
此方法特別適合:
- AI 新創
- SaaS 平台
- 研究實驗室。
透過 CometAPI 存取 Gemini 3.1 Pro(逐步)
CometAPI 是一個統一的 API 市集,透過 OpenAI 相容的閘道或 Gemini 格式,提供 Gemini 3.1 Pro 與相關變體。對於想快速試驗、又不想管理 Google 原生憑證或希望以單一 API key 切換多家供應商的團隊來說,這通常是最快的路徑。
為什麼使用 CometAPI?
- 單一 API key 對應多款模型 — CometAPI 提供 OpenAI 風格的相容層,讓你可用熟悉的 SDK 呼叫 Gemini 模型。
- Playground 與模型型錄 — 可在網頁 Playground 進行快速測試以確認行為與成本。
- 成本概況 — CometAPI 對部分等級宣稱相較官方牌價有折扣(例如文件中列示於上線時的每百萬 token 較低價格)。請將市集價格視為促銷,並在你的帳戶中重新驗證。
快速 CometAPI 上手(具體)
- 於 cometapi.com 註冊並建立帳戶。開啟 Comet 主控台並產生 API token(妥善保存)。
- 在 Comet 型錄確認模型 ID(例如
gemini-3.1-pro)。 - 使用 OpenAI 相容的基底 URL
https://api.cometapi.com/v1(Comet 文件顯示提供 OpenAI 風格的chat/completions端點)。以你的 token 取代YOUR_API_KEY。
範例:Curl 與 Python(複製/貼上)
Curl(CometAPI OpenAI 相容):
curl https://api.cometapi.com/v1/chat/completions \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "gemini-3.1-pro-preview", "messages": [ {"role":"system","content":"You are a concise programming assistant."}, {"role":"user","content":"Write a Python function to fetch CSV from a URL and return pandas DataFrame."} ], "max_tokens": 800 }'
Python(Gemini SDK 模式):
from google import genai
import os
# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Explain how AI works in a few words",
)
print(response.text)
(這些範例遵循 CometAPI 文件,並在那裡提供可直接複製貼上使用。)
定價快照(示例,請以你的帳戶為準)
CometAPI 的定價(示意)顯示相較官方牌價有折扣:例如,Comet 輸入 $1.6 / 百萬 tokens,相較官方 $2 / 百萬,Comet 輸出 $9.6 / 百萬,相較官方 $12 / 百萬(約—20% 上線折扣)。
使用 Gemini 3.1 Deep Think 的最佳實踐
提示工程與任務框架
- 系統 + 思維鏈提示:使用明確的系統訊息設定角色、精度、所需輸出與允許的來源。對 Deep Think 任務,將提示拆分為子任務,並要求證據引用或步驟編號,以促成可追溯的推理。
- 迭代精修:將大型問題拆解為可驗證的小步驟。要求模型產出中間結果(如符號計算步驟、程式碼骨架、實驗計畫),並在繼續前驗證每一步。這可降低長任務的連鎖錯誤。
深度推理模型在結構化提示下表現最佳。範例:
Problem:Explain why the algorithm fails.Steps:1. Identify the bug2. Suggest fixes3. Provide optimized code
2. 策略性調整思考層級
使用:
| 等級 | 使用場景 |
|---|---|
| LOW | 聊天機器人 |
| MEDIUM | 分析 |
| HIGH | 科學研究 |
高推理模式能提升準確度,但也會增加延遲。
3. 高效使用長上下文
由於 Gemini 支援 1M token 上下文,可分析大型資料集。
範例:
- 完整儲存庫
- 研究論文
- 財務模型
4. 結合工具與代理
當結合工具使用時,Deep Think 表現最佳:
- 程式碼執行
- 搜尋 API
- 向量資料庫
範例架構:
User Query
│
▼
Gemini 3.1 Pro
│
├── Search Tool
├── Code Interpreter
└── Database
Gemini 3.1 Deep Think 的限制
儘管功能強大,Deep Think 仍有其限制。
1. 高計算成本
深度推理相較標準 AI 回應需要顯著更多的運算資源。
2. 可用性受限
目前限於:
- 高階訂閱
- 開發者預覽。
3. 延遲
複雜推理會增加回應時間。由於內部推理流程,推理模型可能在約 29 秒後才開始產生輸出。
結論——如何看待今日的 Gemini 3.1 Deep Think
Gemini 3.1 Pro 及其 Deep Think 模式明確展現業界正從短文本生成轉向穩健的多步推理與代理式工作流程。Google 與 DeepMind 發佈的基準顯示在推理任務(ARC-AGI-2、程式設計/競賽基準與專業科學測試)上有實質提升;同時,像 CometAPI 這樣的市集為想快速試驗的團隊提供了實用、低阻力的存取途徑。話雖如此,該系列模型仍複雜且依變體而異;在進入生產前需謹慎沙盒測試、控管 token 預算、加強驗證與治理。
開發者可透過 CometAPI 立即存取 Gemini 3.1 pro。開始前,請在 Playground 探索其能力,並參考 API guide 取得詳細指引。存取前請先登入 CometAPI 並取得 API key。CometAPI 提供遠低於官方的價格,協助你整合——準備好了嗎?
