Gemini 3 Pro(プレビュー) は、Gemini 3 ファミリーにおける Google/DeepMind の最新フラッグシップのマルチモーダル推論モデルです。深い推論、エージェント的ワークフロー、高度なコーディング、長文脈のマルチモーダル理解(テキスト、画像、音声、動画、コードおよびツール統合)を目的として設計され、「これまでで最もインテリジェントなモデル」と位置付けられています。
主な機能
- モダリティ: テキスト、画像、動画、音声、PDF(および構造化されたツール出力)。
- エージェント/ツール: 組み込みの関数呼び出し、検索のツール化、コード実行、URL コンテキスト、複数ステップのエージェントをオーケストレーションするためのサポート。Thought-signature の仕組みにより、呼び出し間で多段の推論を保持します。
- コーディングと“vibe coding”: フロントエンド生成、インタラクティブな UI 生成、エージェント的コーディングに最適化(Google の報告による関連リーダーボードで首位)。同社史上最強の“vibe-coding”モデルとしてマーケティングされています。
- 新しい開発者向けコントロール:
thinking_level(low|high)でコスト/レイテンシと推論深度のトレードオフを調整、media_resolutionで画像や動画フレームごとのマルチモーダルの忠実度を制御。これらにより、性能・レイテンシ・コストのバランス調整が可能になります。
ベンチマーク性能
- Gemini3Pro は LMARE でスコア 1501 を記録し、Grok-4.1-thinking の 1484 点を上回り、Claude Sonnet 4.5 や Opus 4.1 も凌駕しました。
- WebDevArena のプログラミング競技でも 1487 点で首位を獲得。
- Humanity’s Last Exam の学術的推論では 37.5%(ツールなし)、GPQA Diamond の科学では 91.9%、MathArena Apex の数学競技では 23.4% を達成し、新記録を樹立。
- マルチモーダル性能では MMMU-Pro が 81%、Video-MMMU の動画理解では 87.6%。

技術詳細とアーキテクチャ
- 「Thinking level」パラメータ: Gemini 3 は
thinking_levelコントロールを公開し、内部推論の深さとレイテンシ/コストのトレードオフを開発者が調整可能。モデルはthinking_levelを、厳密なトークン保証ではなく内部の多段推論に対する相対的な許容として扱います。Pro のデフォルトは通常high。これは多段の計画や思考連鎖の深さをチューニングするための明示的な新コントロールです。 - 構造化出力とツール: 本モデルは 構造化 JSON 出力 をサポートし、組み込みツール(Google 検索のグラウンディング、URL コンテキスト、コード実行 など)と組み合わせ可能。構造化出力+ツールの一部機能は
gemini-3-pro-previewのみのプレビュー提供。 - マルチモーダルおよびエージェント統合: Gemini 3 Pro は、エージェント的ワークフロー(ツール+コード/ターミナル/ブラウザ上の複数エージェント)向けに明確に設計されています。
制限事項と既知の注意点
- 事実性が完全ではない—幻覚が残る可能性。Google による大幅な事実性の向上が謳われているものの、高リスク領域(法務、医療、金融)では、根拠に基づく検証と人によるレビューがなお必要。
- 長文脈での性能はタスクにより変動。1M の入力ウィンドウ対応はハードな能力だが、極端な長さでは一部ベンチマークで実効性が低下(長文脈テストの一部で 1M での点ごとの低下が観測)。
- コストとレイテンシのトレードオフ。大きなコンテキストや高い
thinking_level設定は計算量・レイテンシ・コストを増加;価格体系はトークン量に基づき適用。コスト管理にはthinking_levelとチャンク化戦略を活用。 - セーフティとコンテンツフィルタ。Google は引き続きセーフティポリシーとモデレーション層を適用;特定のコンテンツやアクションは制限されるか、拒否モードを誘発。
Gemini 3 Pro Preview が他のトップモデルと比較してどうか
ハイレベルな比較(プレビュー → 定性的):
Gemini 2.5 Pro と比較: 推論、エージェント的ツール利用、マルチモーダル統合で段階的な飛躍的改善。はるかに大きなコンテキストの処理と長文理解の向上。DeepMind は学術的推論、コーディング、マルチモーダル課題で一貫した向上を示しています。
GPT-5.1 および Claude Sonnet 4.5 と比較(報告ベース): Google/DeepMind のベンチマーク群では、Gemini 3 Pro は複数のエージェント、マルチモーダル、長文脈指標で優位と提示(Terminal-Bench、MMMU-Pro、AIME を参照)。比較結果はタスクにより異なります。
典型的および高付加価値のユースケース
- 大規模文書/書籍の要約と Q&A: 長いコンテキストへの対応により、法務・リサーチ・コンプライアンスのチームに適しています。
- リポジトリ規模でのコード理解・生成: コーディングツールチェーンとの統合と推論の改善により、大規模コードベースのリファクタや自動コードレビューのワークフローを支援。
- マルチモーダルな製品アシスタント: 画像+テキスト+音声のワークフロー(スクリーンショット、通話スニペット、文書を取り込むカスタマーサポート)。
- メディア生成・編集(写真 → 動画): 既存の Gemini ファミリーの機能に、Veo / Flow スタイルの写真→動画機能が含まれるように。プレビューでは、プロトタイプやメディアのワークフロー向けに、より深いマルチメディア生成が示唆されています。