ジェミニ 3 ディープシンク Google / DeepMindの最新基盤モデルファミリーであるGemini 3における、新たな特化型推論モードです。難解で多段階、かつマルチモーダルな問題に対し、より多くの時間と内部的な「熟考」を費やすように設計されています。これは、最先端の推論技術とエージェントによる問題解決を以前のリリースよりもさらに推し進めたGeminiのバージョンとして宣伝されています。
Gemini 3 Deep Think とは何でしょうか?
定義と位置付け
ジェミニ3ディープシンクは、独立してリリースされた全く異なるニューラルネットワークアーキテクチャという意味での独立したモデルファミリーではなく、 強化された推論モード Googleが「知能の限界をさらに押し広げる」と表現するGemini 3シリーズ。Deep Thinkは、モデルがより深い思考の連鎖を追求し、複数の仮説を検討し、応答前に代替案を評価する必要がある場合に選択するモードとして明確に提示されています。これにより、システムは遅延を犠牲にして、より高品質でより熟慮された出力を得ることができます。GoogleはDeep Thinkを、最も複雑で斬新な、多段階の推論タスク向けに最適化されたエディションと位置付けています(当初は安全性テストとGoogle AI Ultraのサブスクリプション契約者のみに提供されます)。
Deep Thinkが標準のGemini 3 Proとどう違うのか
Gemini 3 Proは、一般的なエージェント利用や開発者向け統合(新しいAntigravity IDEやVertex AIとの統合など)に適した、バランスの取れた低レイテンシのエクスペリエンスを実現することを目指しています。Deep Thinkも同じファミリーですが、以下の構成となっています。
- 推論優先のデコードと思考連鎖の内面化。 Googleは、Gemini 3は改良された内部「思考」プロセスを採用しており、モデルが複数段階の計画と内部審議をより確実に実行できると説明しています。Deep Thinkは、このプロセスをさらに強化し、より多くの内部計算リソースを割り当て、内部審議チェーンを長くし、生成時の検証ヒューリスティックをより厳密にすることで、このプロセスを強化できるようです。これらの変更は、脆弱な単一段階の応答を減らし、新しいタスクにおける問題解決能力を向上させることを目的としています。
- より大きな推論範囲 (ツール + シミュレーション)。 Deep Thinkは、ツールシミュレーション(シミュレートされたブラウザ、計算機、コードランナー、または外部API)を呼び出すように最適化されており、エージェントワークフローをモデルの推論ループの一部として扱います。つまり、モデルは計画、仮説立案、テスト(シミュレートされたツールを使用)、修正を行うことができ、これは複雑なコーディング、数学、または研究クエリに役立つ内部実験の一種です。
- より高いコンピューティング/レイテンシのトレードオフ。 このより深い推論を実現するために、Deep ThinkはProよりも高コストで高レイテンシの推論環境で動作します。Googleはこれまで、モデルにプレミアム「エキスパート」モードを提供することで、このようなトレードオフを提供してきました。Deep Thinkもこのパターンに従い、品質と信頼性を優先しています。
Gemini 3 Deep Think はどのように機能しますか?
「どのように」動作するかを理解するには、製品モード(Deep Think)と基盤となるモデルファミリー(Gemini 3)を分離する必要があります。Deep Thinkは、ダウンロードする独立したスタンドアロンのモデルファイルではなく、トレーニング済みの機能層と推論スタックから構成される構成です。これにより、より多くのコンピューティング能力、内部推論ルーチン、そしてレイテンシやコストよりも深度と正確性を優先する特殊なデコード動作が可能になります。
より緊密なツール統合
Deep Think は、Gemini 3 Pro と同じエージェント ツール呼び出しとサンドボックス化のプリミティブを活用しますが、より保守的なポリシーと、各ツール呼び出しに対する追加の検証手順を備えています (研究ワークフローの安全性にとって重要)。
Deep Thinkのトレードオフと推論戦略
Deep Thinkは、取引として明確に説明されている 待ち時間 の 深さ: クエリあたりの計算量が多く(内部検討時間が長くなる、または候補となる推論パスの探索がより徹底的になる)、新しい問題を解決するために選択的なコード実行や多段階検証といった補助的なメカニズムに依存します。そのため、「フロンティア」ベンチマーク(新しい、創造的な、または多段階の問題)では強力ですが、実稼働環境では速度とコストが高くなる可能性があります。
思考の連鎖、スクラッチパッド、反復的な改良
Deep Thinkアプローチは、研究コミュニティや企業が効果的に活用してきたメカニズム、すなわち思考連鎖型の推論、内部スクラッチパッド、そして統合前にサブ問題を解決・検証する段階的推論といったメカニズムに基づいています。このモデルは、問題を分解し、中間ステップを確認し、解決策を再構成して堅牢な最終出力を生成する手法を用いています。
Gemini 3 Deep Think はどのようなパフォーマンスベンチマークを達成していますか?
Google は、Gemini 3、特に Deep Think 構成で得られるとされる性能向上の規模を示すベンチマーク数値を大量に公開しました。Gemini 3 Deep Think に関する最も強力な公式の主張は次のとおりです。
- ARC-AGI (抽象視覚推論、コード実行バリアント): Gemini 3 Proは約31.1%を達成したと報告されているが、 ジェミニ3ディープシンクは約45.1%に達する ARC-AGI-2 では、これまで高いパフォーマンスを達成できなかったベンチマークで劇的な飛躍を遂げました。
- GPQA ダイヤモンド(上級質問回答): Gemini 3 Proは約91.9%、Deep Thinkは約93.8%と報告されています。これらは高いパフォーマンスレベルであり、Gemini 3は発売当初から複数のリーダーボードで上位または上位に近い位置を占めています。
- 人類最後の試験(ツールフリーチャレンジ): Google の資料によると、Gemini 3 Deep Think はツールを使わずに大幅に高いパフォーマンス (Google は約 41.0% という数値を挙げています) を達成し、最も要求の厳しい試験形式のプロンプトで Gemini 3 Pro を上回りました。
これらの数字がなぜ重要なのか。 これらのベンチマークでの向上は、すべてのタスクで均一ではありません。特に、多段階の推論を必要とする問題、抽象的な視覚的問題解決、そしてモデルが大量のコンテキストを保持・操作しなければならない状況で顕著です。これは、Deep Thinkの機能的意図、つまり表面的なテキスト予測の改善ではなく、堅牢で高次の推論を示すことと一致しています。
Gemini 3 Deep Think vs Gemini 2.5 Pro
Deep ThinkがGemini 2.xから改善された点
推論と問題解決: 最も顕著な向上は、推論ベンチマークと、拡張された内部ロジックチェーンを必要とするタスクにおいて見られます。ARC-AGI、Humanity's Last Exam、その他の推論スイートにおいて、Gemini 3 Deep ThinkはGemini 2.5 Proと比較して大幅に高いスコアを記録しました。この飛躍は、アルゴリズム(異なるトレーニング/微調整)と運用面(Deep Thinkの推論時における熟考)の両方によるものと思われます。

マルチモーダル理解: Gemini 3は、より豊富なマルチモーダル入力(ビデオ分析、手書きと音声の融合、より繊細な画像とテキストの推論)のサポートを拡張し、Deep Thinkは、メディアタイプを混在させるタスクにおいてその能力を強化します。Gemini 2.xはマルチモーダルタスクをうまく処理していましたが、Gemini 3のDeep Thinkは、より正確で、より状況に応じた対応力を備えているとされています。
エージェントとツールの使用: Gemini 3では、エージェントワークフロー(エディタ、ターミナル、ブラウザ、API呼び出しを横断して動作するエージェントの作成)に重点が置かれており、これは質的な変化を示しています。Deep Thinkは、内部シミュレーションとツールオーケストレーションを強化することで、外部ツールとの連携における計画と検証を向上させます。これは、以前のGemini世代では初期段階にあった機能です。GoogleのAntigravity IDEは、これを実証する具体的な初期統合です。
コーディングと開発者の人間工学: Gemini 3 Proでは、ワンショットコーディングと「バイブコーディング」(高レベル仕様 → スキャフォールディングされたアプリ生成)が既に改善されています。Deep Thinkは、モデルの能力を強化し、より大規模なプロジェクトの計画、より一貫性のある複数ファイルコードの生成、そして複数のコンテキストをまたいだデバッグを可能にします。初期のベンチマークとパートナーからのフィードバックでは、2.xと比較して開発者の生産性が明らかに向上していることが報告されています。
アーキテクチャと動作の違い(H3)
Gemini 2.x に比べて向上した点の実際的な理由は複数あり、相互に補強し合っています。
- MoEバックボーンの改善とエキスパートルーティングチューニングより効率的な専門化と拡張が可能になります。
- 統合マルチモーダルスタック これにより、クロスモーダル推論がより適切に融合されます (ARC-AGI の視覚サブ問題にとって重要)。
- Deep Thinkのような動作モード 計算/レイテンシを犠牲にして精度を高め、意図的に内部審議と仮説テストを延長します。
ユーザーにとっての実用的な成果
開発者や研究者にとって、それは次のことを意味します。
- 以前の Gemini 世代では成功が限られていた、より価値の高いワークフロー (科学文献の統合、アーキテクチャ設計、高度なデバッグなど) を自動化する機能が向上しました。
- 幻覚が少なくなり、複雑なプロンプトに対する段階的な推論の連鎖がより防御可能になります。
- 長いドキュメント、コードベース、または混合メディアにわたる推論が必要なタスクのパフォーマンスが向上します。
ジェミニ3ディープシンクへのアクセス方法
オプションA - 一般消費者/パワーユーザー向けルート: Geminiアプリ + Google AI
Googleの公式発表によると、Gemini 3 Deep Thinkは まだ広く利用可能ではない 一般リリースレベルでは、まず安全性テスター向けに展開され、その後「Ultra」サブスクリプションレベルに展開されます。
Google AI ウルトラ: 月額249.99米ドル (米国) Ultra レベルには、「Deep Think、Gemini Agent (米国のみ、英語のみ)、最高限度額」が含まれます。
購読先: お住まいの地域のGeminiアプリ / Google One / Google AIプランページからお申し込みください。サブスクリプションコンソールに、Deep Thinkがアカウントで既に有効になっているかどうかが表示されます。
オプションB - 開発者/エンタープライズルート: API
APIアクセスをご希望の開発者様へ:Gemini 3 APIは既に「Pro」向けプレビュー版として公開されています。「Deep think」バージョンをご利用の場合は、そのバリアントAPIをご利用ください。APIアクセスは従量課金制で、100万入出力トークンごとに課金されます。
良いニュース — CometAPIは、 Gemini 3 Pro プレビュー API最新のChatGPT 5.1にもアクセスできます。API価格は公式価格よりも安価です。
| モデル | gemini-3-pro-preview | gemini-3-pro-preview-thinking |
| 入力トークン | $1.60 | $1.60 |
| 出力トークン | $9.60 | $9.60 |
準備はいいですか?→ 今すぐCometAPIに登録しましょう !
AIに関するヒント、ガイド、ニュースをもっと知りたい方は、フォローしてください。 VK, X および Discord!
結論
ジェミニ3ディープシンクは、意図的かつ実用的な製品化の試みを表しています。 より深い 機械推論: 一部のタスクでは、単発の反応ではなく、内部の段階的な熟考と統合的なツールの使用によってメリットが得られるという考え方。



