Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
入力:$1.60/M
出力:$9.60/M
文脈:200.0k
最大出力:200.0k
Gemini 3 Pro Preview は Gemini ファミリーに属する汎用モデルで、評価およびプロトタイピング向けのプレビューとして提供されています。指示追従、マルチターン推論、コードおよびデータ関連のタスクをサポートし、構造化出力やワークフロー自動化のためのツール/関数呼び出しに対応しています。主なユースケースには、チャットアシスタント、要約および書き換え、検索拡張型QA、データ抽出、アプリやサービス横断の軽量なコーディング支援などが含まれます。技術的な特長として、APIベースのデプロイ、ストリーミング応答、安全対策、統合準備性が挙げられ、プレビュー構成に応じてマルチモーダル機能にも対応します。
概要
Playground
機能
料金プラン
API
バージョン

Gemini 3 Pro(プレビュー) は、Gemini 3 ファミリーにおける Google/DeepMind の最新フラッグシップ多モーダル推論モデルです。「これまでで最もインテリジェントなモデル」と位置づけられ、深い推論、エージェント的ワークフロー、高度なコーディング、長文コンテキストの多モーダル理解(テキスト、画像、音声、動画、コードおよびツール統合)を念頭に設計されています。

主な機能

  • モダリティ: テキスト、画像、動画、音声、PDF(および構造化ツール出力)。
  • エージェント性/ツール: 組み込みの関数呼び出し、ツールとしての検索、コード実行、URL コンテキスト、複数ステップのエージェントをオーケストレーションするためのサポート。思考シグネチャ機構により、呼び出し間での多段推論を保持。
  • コーディングと“vibe coding”: フロントエンド生成、インタラクティブな UI 生成、エージェント的コーディングに最適化(Google の報告する関連リーダーボードで首位)。現時点で最も強力な“vibe-coding”モデルとして打ち出されています。
  • 新しい開発者向けコントロール: コスト/レイテンシと推論の深さをトレードオフするための thinking_level(low|high)、および画像や動画フレームごとの多モーダルな忠実度を制御する media_resolution。これらにより性能・レイテンシ・コストのバランス調整が可能。

ベンチマーク性能

  • Gemini3Pro は LMARE でスコア 1501 を獲得し、Grok-4.1-thinking の 1484 点を上回り、Claude Sonnet 4.5 や Opus 4.1 も凌駕しました。
  • また、WebDevArena のプログラミングアリーナでも 1487 のスコアで首位を獲得しました。
  • Humanity’s Last Exam の学術推論では 37.5%(ツールなし)、GPQA Diamond の科学では 91.9%、MathArena Apex の数学競技では 23.4% を達成し、新記録を樹立しました。
  • 多モーダル能力では MMMU-Pro で 81%、Video-MMMU の動画理解で 87.6% を記録しました。

画像

技術詳細とアーキテクチャ

  • “Thinking level” パラメータ: Gemini 3 は、内部推論の深さとレイテンシ/コストのトレードオフを可能にする thinking_level コントロールを公開しています。モデルは thinking_level を、厳密なトークン保証ではなく、内部の多段推論に対する相対的な許容量として扱います。Pro のデフォルトは通常 high。これは、開発者が多段計画や思考連鎖の深さを調整できる明示的な新コントロールです。
  • 構造化出力とツール: このモデルは 構造化 JSON 出力 をサポートし、組み込みツール(Google 検索によるグラウンディング、URL コンテキスト、コード実行など)と組み合わせて利用できます。構造化出力+ツールの一部機能は gemini-3-pro-preview でのみプレビュー提供です。
  • 多モーダルとエージェント統合: Gemini 3 Pro は、エージェント的ワークフロー(ツール群+コード/ターミナル/ブラウザ上の複数エージェント)に明確に対応して設計されています。

制限事項と既知の注意点

  1. 完全な正確性ではありません—幻覚の可能性は残ります。Google が主張する事実性の大幅な改善があっても、高リスク領域(法務、医療、金融)では、根拠に基づく検証と人手レビューが依然として必要です。
  2. 長文コンテキストでの性能はタスクによってばらつきます。1M の入力ウィンドウ対応はハードな能力ですが、極端な長さでは一部ベンチマークで実効性能が低下することがあります(長文コンテキスト試験の一部で 1M 時に個別箇所での低下が観測)。
  3. コストとレイテンシのトレードオフ。コンテキストが大きいほど、また thinking_level を高くするほど、計算量・レイテンシ・コストが増加します。料金はトークン量に応じた階層制。コスト管理には thinking_level とチャンク分割戦略を活用してください。
  4. 安全性とコンテンツフィルタ。Google は安全ポリシーとモデレーション層を適用し続けており、特定のコンテンツやアクションは引き続き制限されるか、拒否モードが発動します。

Gemini 3 Pro Preview と他のトップモデルの比較

ハイレベル比較(プレビュー → 定性的):

Gemini 2.5 Pro 対比: 推論、エージェント的ツール活用、多モーダル統合が段階的に向上。はるかに大きなコンテキスト処理と長文理解の改善。DeepMind は学術推論、コーディング、多モーダルの各タスクで一貫した向上を示しています。

GPT-5.1 および Claude Sonnet 4.5 との比較(報告ベース): Google/DeepMind のベンチマーク群では、Gemini 3 Pro はエージェント性、多モーダル、長文コンテキストの複数指標で優位と提示されています(Terminal-Bench、MMMU-Pro、AIME など)。比較結果はタスクにより異なります。


代表的かつ高付加価値のユースケース

  • 大規模文書/書籍の要約と Q&A: 長文コンテキスト対応により、法務・リサーチ・コンプライアンスの各チームに有用。
  • リポジトリ規模でのコード理解と生成: コーディングツールチェーンとの統合と推論の向上により、大規模コードベースのリファクタリングや自動コードレビューのワークフローを支援。
  • 多モーダル製品アシスタント: 画像+テキスト+音声のワークフロー(スクリーンショット、通話スニペット、ドキュメントを取り込むカスタマーサポート)。
  • メディア生成と編集(写真 → 動画): これまでの Gemini ファミリーの機能に、Veo / Flow スタイルの写真→動画機能が含まれるようになりました。プレビューでは、プロトタイプやメディアのワークフロー向けに、より深いマルチメディア生成が示唆されています。

Gemini 3 Pro PreviewのPlayground

Gemini 3 Pro PreviewのPlaygroundを探索 — モデルをテストし、リアルタイムでクエリを実行するインタラクティブな環境。プロンプトを試し、パラメータを調整し、即座に反復して開発を加速し、ユースケースを検証します。

Gemini 3 Pro Previewの機能

* **モデル ID (プレビュー):** `gemini-3-pro-preview`. * **入力タイプ:** テキスト、画像、動画、音声、PDF。出力: テキスト * **コンテキスト / トークン制限:** 入力 ≈ 1,048,576 トークン; 出力 ≤ 65,536 トークン。 * **ナレッジカットオフ:** 2025年1月 (新しい情報には Search Grounding を使用)。 * **対応機能 (選択):** 関数呼び出し、コード実行、ファイル検索、構造化出力、Search Grounding。非対応: 音声生成、画像生成、ライブ API、画像セグメンテーション、Google Maps grounding (一部の機能は Gemini 2.5 と異なります)。
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Gemini 3 Pro Previewの料金

Gemini 3 Pro Previewの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Gemini 3 Pro Previewがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)
入力:$1.60/M
出力:$9.60/M
入力:$2.00/M
出力:$12.00/M

Gemini 3 Pro PreviewのサンプルコードとAPI

Gemini 3 Pro は、Google/DeepMind の Gemini 3 ファミリーにおける最新のフラッグシップ・マルチモーダル推論モデルです。彼らの「これまでで最もインテリジェントなモデル」と位置づけられ、深い推論、エージェント駆動のワークフロー、高度なコーディング、そして長いコンテキストにおけるマルチモーダル理解(テキスト、画像、音声、動画、コード、ツール統合)向けに設計されています。
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Pro Previewのバージョン

Gemini 3 Pro Previewに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。