技術規格 — Gemini 3.1 Pro
| 項目 | gemini-3-pro(公開摘要) |
|---|---|
| 提供商 | |
| 規範模型 ID | gemini-3-pro(公開預覽) |
| 輸入類型 | 文字、影像、影片、音訊、PDF |
| 輸出類型 | 文字(自然語言、結構化輸出、函式呼叫負載) |
| 輸入 token 限制(上下文) | 1,048,576 tokens |
| 輸出 token 限制 | 65,536 tokens |
| 函式呼叫/工具使用 | 支援(函式呼叫、結構化輸出、工具整合) |
| 多模態能力 | 完整多模態支援(影像、影片、音訊、文件) |
| 程式碼執行與代理式流程 | 支援(代理模式、程式碼助理、工具編排) |
| 知識截止日期 | 2025 年 1 月 |
什麼是 Gemini 3.1 Pro?
Gemini 3.1 Pro 是 Google 在 Gemini 3 系列中的公開旗艦,定位為最先進的多模態推理模型,具備先進的代理式與開發者工具能力。該模型強調高容量上下文處理(支援超過 1M token 的輸入)、廣泛的媒體支援(影像、影片、音訊、PDF),以及對工具使用、函式呼叫與以程式碼為中心的工作流程(例如 Gemini Code Assist 與代理模式)的深度整合。
Google 表示,Gemini 3 Pro 同時針對互動式開發者體驗(低延遲編碼與代理工作流程)以及高保真的多模態理解(對混合媒體輸入的解讀與推理)進行了最佳化。
Gemini 3.1 Pro 的主要功能
Gemini-3.1 Pro(透過其預覽版)引入以下功能:
多模態整合
可處理下列類型的輸入:
- 自然語言
- 影像
- 語音/音訊
- 影片
並以統一的 token 表示進行跨模態推理。
擴展的上下文視窗
高達約 100 萬個 token 的超大上下文容量,可支援:
- 長篇文件
- 多文件綜合
- 程式碼庫與逐字稿。
這超越了許多競品模型(通常僅支援約 32K–262K token)。
稀疏專家混合(MoE)擴展
稀疏 MoE 路由可在不成比例增加計算成本的情況下擴展模型內部容量,從而在大規模下提升推理能力。
進階推理/規劃
透過思維鏈訓練、基於人類回饋的強化學習及專門基準等創新,使其在邏輯與數學任務上表現出色。
據稱的基準測試:
AIME 2025:100%(啟用程式碼執行)
SWE-Bench Verified:83.9%
ARC-AGI-2:71.8%
LiveCodeBench Pro:2844 Elo
Terminal-Bench 2.0:63.5%
MMMLU:93.6%
代表性企業用例
- 端到端媒體管線: 將影片、逐字稿與影像匯入,批量產出同步化摘要、中繼資料與結構化洞見。
- 大規模程式碼生成與審查: 在 IDE 與 CI 管線中,用於自動生成程式碼、重構多檔案專案,並為大型程式碼庫產出測試建議。
- 代理式自動化: 透過結構化函式呼叫,協調與雲端服務、編排系統與內部 API 互動的多工具 Agent。
- 研究與內容生產: 撰寫長篇內容(報告、書籍),結合文字與內嵌多媒體,並保留內部交叉參照。
如何存取 Gemini 3.1 Pro API
步驟 1:註冊取得 API 金鑰
登入 cometapi.com。如果您尚未成為我們的使用者,請先註冊。登入您的 CometAPI 主控台。取得介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊“Add Token”,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 Gemini 3.1 Pro API 發送請求
選擇 “gemini-3.1-pro” 端點以發送 API 請求並設定請求本文。請求方法與請求本文可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以供您使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。基本 URL 為 Gemini Generating Content 與 Chat。
將您的問題或請求插入 content 欄位—模型將回應此內容。處理 API 回應以取得產生的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得產生的答案。處理完成後,API 會回傳任務狀態與輸出資料。
另請參閱 Gemini 3 Pro API