技術規格 — Gemini 3.1 Pro
| 項目 | gemini-3-pro(公開摘要) |
|---|---|
| 供應商 | |
| 標準模型 ID | gemini-3-pro(公開預覽) |
| 輸入類型 | 文字、圖片、影片、音訊、PDF |
| 輸出類型 | 文字(自然語言、結構化輸出、函式呼叫負載) |
| 輸入 token 上限(上下文) | 1,048,576 tokens |
| 輸出 token 上限 | 65,536 tokens |
| 函式呼叫/工具使用 | 支援(函式呼叫、結構化輸出、工具整合) |
| 多模態能力 | 完整多模態支援(圖片、影片、音訊、文件) |
| 程式碼執行與代理流程 | 支援(代理模式、程式碼協助、工具編排) |
| 知識截止時間 | 2025 年 1 月 |
什麼是 Gemini 3.1 Pro?
Gemini 3.1 Pro 是 Google 在 Gemini 3 系列中的公開旗艦機型,定位為最先進的多模態推理模型,具備進階代理與開發者工具能力。該模型強調高容量的上下文處理能力(支援超過 1M token 的輸入)、廣泛的媒體支援(圖片、影片、音訊、PDF),以及與工具使用、函式呼叫與以程式碼為中心的工作流程(例如 Gemini Code Assist 與代理模式)的深度整合。
Google 表示,Gemini 3 Pro 同時針對互動式開發者體驗(低延遲編碼與代理工作流程)以及高保真多模態理解(跨多種媒體輸入的解讀與推理)進行了最佳化。
Gemini 3.1 Pro 的主要功能
Gemini-3.1 Pro(透過其預覽版)帶來以下功能:
多模態整合
可處理以下輸入:
- 自然語言
- 圖片
- 語音/音訊
- 影片
並以統一的 token 表徵支援跨模態推理。
擴大的上下文視窗
高達 ~1 million tokens 的超大上下文容量,可支援處理:
- 長篇文件
- 多文件綜合
- 程式碼庫與逐字稿。
這超越了許多競爭模型(通常僅支援約 ~32 K–262 K tokens)。
稀疏專家混合(MoE)擴展
稀疏 MoE 路由可在不按比例增加計算成本的情況下擴充模型內部容量,從而在大規模下提升推理能力。
進階推理/規劃
透過思維鏈訓練、人類回饋強化學習以及專門基準等創新,使其在邏輯與數學任務上表現出色。
據稱的基準成績:
AIME 2025:100%(啟用程式碼執行)
SWE-Bench Verified:83.9%
ARC-AGI-2:71.8%
LiveCodeBench Pro:2844 Elo
Terminal-Bench 2.0:63.5%
MMMLU:93.6%
代表性企業用例
- 端到端媒體流程: 將影片、逐字稿與圖片匯入,於大規模下產出同步摘要、中繼資料與結構化洞見。
- 大規模程式碼生成與審查: 在 IDE 與 CI 流程中,用於自動產生程式碼、重構多檔案專案,並為大型程式碼庫提供測試建議。
- 代理式自動化: 透過結構化函式呼叫協調多工具代理,與雲端服務、編排系統與內部 API 互動。
- 研究與內容製作: 起草長篇內容(報告、書籍),結合文字與嵌入式多媒體,並保留內部交叉參照。
如何存取 Gemini 3.1 Pro API
步驟 1:申請 API 金鑰
登入 cometapi.com。若您尚未成為我們的用戶,請先註冊。登入您的 CometAPI 控制台。取得該介面的存取憑證 API 金鑰。在個人中心的 API token 處點擊 “Add Token”,取得 token 金鑰:sk-xxxxx 並提交。
步驟 2:向 Gemini 3.1 Pro API 發送請求
選擇 “gemini-3.1-pro” 端點發送 API 請求並設定請求本文。請求方法與請求本文可從我們網站的 API 文件取得。我們的網站也提供 Apifox 測試以便您使用。將 <YOUR_API_KEY> 替換為您帳戶中的實際 CometAPI 金鑰。基礎 URL 為 Gemini Generating Content 與 Chat。
將您的問題或請求填入 content 欄位——模型會對此作出回應。處理 API 回應以取得生成的答案。
步驟 3:擷取並驗證結果
處理 API 回應以取得生成的答案。處理完成後,API 會回傳任務狀態與輸出資料。
另請參見 Gemini 3 Pro API