Gemini 3 Pro(プレビュー) Google/DeepMindのGemini 3ファミリーにおける最新のフラッグシップ・マルチモーダル推論モデルです。「これまでで最もインテリジェントなモデル」と位置付けられ、ディープリーディング、エージェント型ワークフロー、高度なコーディング、そしてロングコンテキスト・マルチモーダル理解(テキスト、画像、音声、動画、コード、ツールの統合)のために設計されています。
主な特徴
- モダリティ: テキスト、画像、ビデオ、オーディオ、PDF(および構造化ツール出力)。
- エージェント/ツール: 組み込み関数呼び出し、ツールとしての検索、コード実行、URLコンテキスト、そしてマルチステップエージェントのオーケストレーションのサポート。思考シグネチャメカニズムにより、呼び出し間でマルチステップ推論が保持されます。
- **コーディングと「バイブコーディング」**フロントエンド生成、インタラクティブUI生成、そしてエージェントコーディング(Googleが報告する関連リーダーボードでトップを獲得)に最適化されています。同社史上最強の「バイブコーディング」モデルとして売り出されています。
- 新しい開発者向けコントロール:
thinking_level(低|高)コスト/レイテンシと推論の深さをトレードオフし、media_resolution画像またはビデオフレームごとにマルチモーダル忠実度を制御します。これにより、パフォーマンス、レイテンシ、コストのバランスをとることができます。
ベンチマークパフォーマンス
- Gemini3Pro は LMARE で 1501 点を獲得して 1 位を獲得し、Grok-4.1-thinking の 1484 ポイントを上回り、Claude Sonnet の 4.5 と Opus 4.1 も上回りました。
- また、WebDevArena プログラミング アリーナでも 1487 点を獲得し、1 位を獲得しました。
- Humanity's Last Exam の学術的推論では 37.5% (ツールなし)、GPQA Diamond の科学では 91.9%、MathArena Apex 数学コンテストでは 23.4% を達成し、新記録を樹立しました。
- マルチモーダル機能では、MMMU-Pro は 81% を達成し、Video-MMMU ビデオ理解では 87.6% を達成しました。

技術的な詳細とアーキテクチャ
- 「思考レベル」パラメータ: ジェミニ3号は
thinking_level開発者が内部推論の深さとレイテンシ/コストのバランスをとることができる制御。このモデルはthinking_level厳密なトークン保証ではなく、内部的な多段階推論に対する相対的な許容範囲として。デフォルトは通常highPro向け。これは、開発者が複数ステップの計画と思考の連鎖の深さを調整するための明確な新しいコントロールです。 - 構造化された出力とツール: このモデルは 構造化されたJSON出力 組み込みツール(Google検索グラウンディング、URLコンテキスト、コード実行など)と組み合わせることもできます。一部の構造化出力+ツール機能はプレビュー版のみとなります。
gemini-3-pro-preview. - マルチモーダルおよびエージェント統合: Gemini 3 Pro は、エージェント ワークフロー (ツール + コード/ターミナル/ブラウザー上の複数のエージェント) 向けに明示的に構築されています。
- テキスト、画像、ビデオ、オーディオ、PDF の入力とテキスト出力を受け入れます。
制限事項と既知の注意事項
- 完全な事実ではありません。幻覚が起こる可能性は残ります。 Google は事実関係の大幅な改善を主張していますが、法的、医療的、金融的といった重要な場面では、根拠のある検証と人間によるレビューが依然として必要です。
- 長期コンテキストのパフォーマンスはタスクによって異なります。 1M の入力ウィンドウのサポートは確実な機能ですが、極端な長さでは一部のベンチマークで実験的有効性が低下する可能性があります (一部の長いコンテキストのテストでは、1M でポイントごとの低下が観測されています)。
- コストとレイテンシーのトレードオフ。 大規模コンテキスト以上
thinking_level設定により、コンピューティング、レイテンシ、コストが増加します。トークンの量に基づいて価格帯が適用されます。thinking_levelコストを管理するためのチャンキング戦略。 - 安全性とコンテンツ フィルター。 Google は引き続き安全ポリシーとモデレーション レイヤーを適用しており、特定のコンテンツとアクションは制限されたままになるか、拒否モードがトリガーされます。
Gemini 3 Pro Previewと他のトップモデルの比較
高レベルの比較(プレビュー → 定性的):
Gemini 2.5 Proに対して: 推論、エージェントツールの使用、マルチモーダル統合において飛躍的な改善が見られ、より大規模なコンテキスト処理と長文理解が向上しました。DeepMindは、学術的な推論、コーディング、マルチモーダルタスクにおいて、一貫した成果を示しています。
GPT-5.1およびClaude Sonnet 4.5に対する反論(報告通り): Google/DeepMindのベンチマークでは、Gemini 3 Proは、エージェント、マルチモーダル、およびロングコンテキストの複数の指標においてトップに立つとされています(Terminal-Bench、MMMU-Pro、AIMEを参照)。比較結果はタスクによって異なります。
典型的な高価値ユースケース
- 大規模な文書/書籍の要約とQ&A: 長いコンテキストのサポートにより、法務、調査、コンプライアンス チームにとって魅力的になります。
- リポジトリ規模でのコードの理解と生成: コーディング ツールチェーンとの統合と推論の改善により、大規模なコードベースのリファクタリングと自動化されたコード レビュー ワークフローが実現します。
- マルチモーダル製品アシスタント: 画像 + テキスト + 音声ワークフロー (スクリーンショット、通話スニペット、ドキュメントを取り込むカスタマー サポート)。
- メディア生成と編集(写真→ビデオ): 以前の Gemini ファミリーの機能に、Veo / Flow スタイルの写真→ビデオ機能が含まれるようになりました。プレビューでは、プロトタイプとメディア ワークフローのためのより高度なマルチメディア生成が示唆されています。
CometAPIからgemini-3-pro-preview APIを呼び出す方法
CometAPIでのGemini 3 Proプレビュー価格、公式価格より20%オフ:
| 入力トークン | $1.60 |
| 出力トークン | $9.60 |
必要な手順
- ログインする コムタピまだユーザーでない方は、まずはご登録をお願いいたします。
- あなたにサインインします CometAPIコンソール.
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。

使用方法
- "を選択します。
gemini-3-pro-preview” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行を実現する完全な互換性のあるREST APIを提供します。Chatの主な詳細:
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名:
gemini-3-pro-preview - 認証:
Bearer YOUR_CometAPI_API_KEYヘッダ - コンテンツタイプ:
application/json.
参照 GPT-5.1 API
