Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
輸入:$1.60/M
輸出:$9.60/M
上下文:200.0k
最大輸出:200.0k
Gemini 3 Pro Preview 是 Gemini 系列中的通用模型,以預覽形式提供,用於評估與原型製作。它支援指令遵循、多輪推理,以及程式碼與資料任務,並提供結構化輸出與工具/函式呼叫以實現工作流程自動化。典型用例如聊天助理、摘要與改寫、檢索增強型問答、資料擷取,以及在各類應用與服務中的輕量級程式協助。技術亮點包括基於 API 的部署、串流回應、安全控制與整合就緒,並可依預覽設定提供多模態能力。
概覽
Playground
功能
定價
API
版本

Gemini 3 Pro (Preview) 是 Google/DeepMind 最新的 Gemini 3 系列旗艦級多模態推理模型。其定位為「迄今最智慧的模型」,專為深度推理、代理式工作流程、高階程式設計,以及長上下文的多模態理解(文字、影像、音訊、影片、程式碼與工具整合)而設計。

關鍵功能

  • 模態: 文字、影像、影片、音訊、PDF(以及結構化工具輸出)。
  • 代理/工具: 內建函式呼叫、將搜尋作為工具、程式碼執行、URL 脈絡,並支援協調多步驟代理。Thought-signature 機制可在多次呼叫之間保留多步推理。
  • 程式設計與「vibe coding」: 針對前端生成、互動式 UI 生成與代理式程式設計進行最佳化(據 Google 報告在相關排行榜名列前茅)。被宣稱為迄今最強的「vibe-coding」模型。
  • 新的開發者控制項: thinking_level (low|high) 可在成本/延遲與推理深度間取捨,media_resolution 可控制每張圖片或影片影格的多模態保真度。這些控制項有助於平衡效能、延遲與成本。

基準測試表現

  • Gemini3Pro 在 LMARE 以 1501 分獲得第一名,超過 Grok-4.1-thinking 的 1484 分,並領先 Claude Sonnet 4.5 與 Opus 4.1。
  • 亦在 WebDevArena 程式設計擂台以 1487 分獲得第一名。
  • 在 Humanity’s Last Exam 學術推理中,取得 37.5%(無工具);在 GPQA Diamond 科學測試中,達 91.9%;在 MathArena Apex 數學競賽中,23.4%,創下新紀錄。
  • 在多模態能力方面,於 MMMU-Pro 達 81%;在 Video-MMMU 影片理解中,達 87.6%。

img

技術細節與架構

  • 「Thinking level」參數: Gemini 3 提供 thinking_level 控制,讓開發者在內部推理深度與延遲/成本間取捨。模型將 thinking_level 視為內部多步推理的相對配額,而非嚴格的權杖保證。對 Pro 而言,預設通常為 high。這為開發者提供了明確的新控制項,以調整多步規劃與思考鏈深度。
  • 結構化輸出與工具: 模型支援結構化 JSON 輸出,並可結合內建工具(Google Search grounding、URL 脈絡、程式碼執行等)。部分結構化輸出與工具組合的功能僅在 gemini-3-pro-preview 提供預覽。
  • 多模態與代理式整合: Gemini 3 Pro 明確為代理式工作流程打造(工具 + 多代理,跨程式碼/終端機/瀏覽器)。

限制與已知注意事項

  1. 事實準確性並非完美——仍可能出現幻覺。儘管 Google 宣稱事實性有所提升,但在高風險場景(法律、醫療、金融)仍需落地驗證與人工審查。
  2. 長上下文表現依任務而異。雖然支援 1M 輸入視窗是明確能力,但在極端長度上一些基準上實證效果會下降(在部分長上下文測試中於 1M 長度時可觀察到表現下滑)。
  3. 成本與延遲取捨。更大的脈絡與較高的 thinking_level 設定會增加運算、延遲與費用;定價依 token 用量分級。請使用 thinking_level 與切分策略控管成本。
  4. 安全與內容過濾。Google 仍套用安全政策與稽核層;某些內容與行為受限制或會觸發拒絕模式。

Gemini 3 Pro Preview 與其他頂尖模型的比較

高層次比較(預覽 → 定性):

相較於 Gemini 2.5 Pro: 在推理、代理式工具使用與多模態整合上有躍升式改進;更大脈絡處理與更佳長篇理解。DeepMind 在學術推理、程式設計與多模態任務上顯示一致性增益。

相較於 GPT-5.1 與 Claude Sonnet 4.5(據報告): 在 Google/DeepMind 的基準測試版圖上,Gemini 3 Pro 被呈現為在多項代理、多模態與長上下文指標上領先(見 Terminal-Bench、MMMU-Pro、AIME)。實際比較結果因任務而異。


典型與高價值使用情境

  • 大型文件/書籍摘要與問答:長上下文支援對法律、研究與合規團隊具吸引力。
  • 以 repo 規模進行程式碼理解與生成:與開發工具鏈整合與改良推理,有助於大型程式碼庫重構與自動化程式碼審查工作流程。
  • 多模態產品助理:影像 + 文字 + 音訊工作流程(客服可匯入螢幕截圖、通話片段與文件)。
  • 媒體生成與編輯(照片 → 影片):早期 Gemini 系列功能現已涵蓋 Veo / Flow 風格的照片→影片能力;預覽顯示於原型與媒體工作流程中具備更深入的多媒體生成能力。

Gemini 3 Pro Preview 的 Playground

探索 Gemini 3 Pro Preview 的 Playground — 一個互動式環境,可測試模型並即時執行查詢。嘗試提示、調整參數,並立即迭代以加速開發並驗證使用案例。

Gemini 3 Pro Preview 的功能

* **模型 ID(預覽):** `gemini-3-pro-preview`. * **輸入類型:** 文字、圖片、影片、音訊、PDF。輸出:文字 * **上下文 / 權杖限制:** 輸入 ≈ **1,048,576 個權杖**;輸出 ≤ **65,536 個權杖**。 * **知識截止時間:** **2025 年 1 月**(使用 Search Grounding 以取得較新的資訊)。 * **能力(部分):** 函式呼叫、程式碼執行、檔案搜尋、結構化輸出、Search Grounding。不支援:音訊生成、圖片生成、即時 API、影像分割、Google Maps grounding(部分功能與 Gemini 2.5 不同)。
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Gemini 3 Pro Preview 的定價

探索 Gemini 3 Pro Preview 的競爭性定價,專為滿足各種預算和使用需求而設計。我們靈活的方案確保您只需為實際使用量付費,讓您能夠隨著需求增長輕鬆擴展。了解 Gemini 3 Pro Preview 如何在保持成本可控的同時提升您的專案效果。
彗星價格 (USD / M Tokens)官方價格 (USD / M Tokens)
輸入:$1.60/M
輸出:$9.60/M
輸入:$2.00/M
輸出:$12.00/M

Gemini 3 Pro Preview 的範例程式碼和 API

Gemini 3 Pro 是 Google/DeepMind 在 Gemini 3 系列中最新的旗艦多模態推理模型。它被定位為他們「迄今最智慧的模型」,旨在用於深度推理、代理式工作流程、進階程式設計,以及長脈絡的多模態理解(文字、圖片、音訊、影片、程式碼與工具整合)。
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Pro Preview的版本

Gemini 3 Pro Preview擁有多個快照的原因可能包括:更新後輸出結果存在差異需保留舊版快照以確保一致性、為開發者提供適應與遷移的過渡期,以及不同快照對應全球或區域端點以優化使用者體驗等潛在因素。各版本間的具體差異請參閱官方文件說明。