Gemini 3 Pro (Preview) は、Google/DeepMind の Gemini 3 ファミリーにおける最新のフラッグシップ多モーダル推論モデルです。同社が「これまでで最もインテリジェントなモデル」と位置づけており、深い推論、エージェンティックなワークフロー、高度なコーディング、長コンテキストのマルチモーダル理解(テキスト、画像、音声、動画、コードおよびツール統合)に向けて設計されています。
主な特長
- モダリティ: テキスト、画像、動画、音声、PDF(および構造化ツール出力)。
- エージェント/ツール: ビルトインの関数呼び出し、search-as-tool、コード実行、URL コンテキスト、マルチステップエージェントのオーケストレーションをサポート。Thought-signature 機構により、呼び出し間で多段の推論プロセスを保持。
- コーディングと「vibe coding」: フロントエンド生成、インタラクティブな UI 生成、エージェント的コーディングに最適化(Google が報告する関連リーダーボードでトップ)。同社史上最強の「vibe-coding」モデルとして訴求。
- 新しい開発者向けコントロール:
thinking_level(low|high)でコスト/レイテンシと推論の深さをトレードオフ、media_resolutionで画像や動画フレームごとのマルチモーダル忠実度を制御。これらによりパフォーマンス、レイテンシ、コストのバランス調整が容易に。
ベンチマーク性能
- Gemini3Pro は LMARE で 1501 を記録し 1 位を獲得。Grok-4.1-thinking の 1484 を上回り、Claude Sonnet 4.5 や Opus 4.1 を凌駕。
- WebDevArena のプログラミング競技でも 1487 で 1 位。
- Humanity’s Last Exam の学術推論では 37.5%(ツール未使用);GPQA Diamond の科学で 91.9%;MathArena Apex の数学競技で 23.4% と新記録を樹立。
- マルチモーダル能力では MMMU-Pro が 81%;Video-MMMU の動画理解で 87.6%。

技術詳細とアーキテクチャ
- 「Thinking level」パラメータ: Gemini 3 は
thinking_levelコントロールを公開し、内部推論の深さとレイテンシ/コストをトレードオフ可能。モデルはthinking_levelを、厳密なトークン保証ではなく内部の多段推論に対する相対的な許容量として扱う。Pro のデフォルトは概ねhigh。これは開発者が多段プランニングやチェーン・オブ・ソートの深さを調整できる新たな明示的コントロール。 - 構造化出力とツール: 構造化 JSON 出力 に対応し、ビルトインツール(Google Search によるグラウンディング、URL コンテキスト、コード実行など)と組み合わせ可能。構造化出力+ツールの一部機能は
gemini-3-pro-previewでプレビュー提供。 - マルチモーダルおよびエージェンティック統合: Gemini 3 Pro は明確にエージェンティックなワークフロー(ツール+コード/ターミナル/ブラウザ上の複数エージェント)向けに設計。
- テキスト、画像、動画、音声、PDF 入力に対応;テキスト出力。
制限事項と既知の注意点
- 事実性は完全ではなく—幻覚は依然として起こり得る。 Google の改善主張にもかかわらず、高リスク領域(法務、医療、金融)ではグラウンディング検証と人手レビューが依然必要。
- 長コンテキスト性能はタスクにより変動。 1M の入力ウィンドウはハード能力だが、極端な長さでは一部ベンチマークで実効性能が低下するケースあり(1M 時点でのポイントごとの低下が観測)。
- コストとレイテンシのトレードオフ。 大きなコンテキストや高い
thinking_level設定は計算量・レイテンシ・コストを増大;トークン量に基づく価格階層が適用。thinking_levelとチャンク分割戦略でコスト管理を。 - 安全性とコンテンツフィルタ。 Google は安全ポリシーとモデレーション層を継続適用;特定のコンテンツやアクションは制限/拒否モードをトリガー。
Gemini 3 Pro Preview が他のトップモデルと比較してどうか
ハイレベル比較(プレビュー → 定性的):
Gemini 2.5 Pro と比較: 推論、エージェント的ツール利用、マルチモーダル統合で段階的な飛躍。より大きなコンテキスト処理と長文理解の改善。DeepMind は学術推論、コーディング、マルチモーダル課題で一貫した向上を示す。
GPT-5.1 と Claude Sonnet 4.5(報告ベース)と比較: Google/DeepMind の提示するベンチマーク群では、エージェンティック、マルチモーダル、長コンテキスト指標のいくつかで Gemini 3 Pro がリード(Terminal-Bench、MMMU-Pro、AIME を参照)。タスクにより比較結果は変動。
代表的で高付加価値なユースケース
- 大規模文書/書籍の要約と Q&A: 長コンテキスト対応により、法務、リサーチ、コンプライアンスに適する魅力的な選択肢。
- リポジトリ規模でのコード理解・生成: コーディングツールチェーン統合と推論強化により、大規模コードベースのリファクタや自動コードレビューのワークフローを支援。
- マルチモーダル製品アシスタント: 画像+テキスト+音声のワークフロー(スクリーンショット、通話スニペット、文書を取り込むカスタマーサポート)。
- メディア生成と編集(写真 → 動画): 既存の Gemini ファミリー機能により、Veo / Flow スタイルの写真→動画機能を包含;プレビューではプロトタイピングやメディアワークフロー向けに、より深いマルチメディア生成を示唆。
CometAPI から gemini-3-pro-preview API を呼び出す方法
CometAPI における Gemini 3 Pro Preview の料金(公式価格より 20% オフ):
| 入力トークン | $1.60 |
| 出力トークン | $9.60 |
必要な手順
- cometapi.com にログインします。未登録の場合は、まず登録してください。
- CometAPI コンソール にサインインします。
- インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー(sk-xxxxx)を取得して送信します。

使用方法
- エンドポイント「
gemini-3-pro-preview」を選択して API リクエストを送信し、リクエストボディを設定します。リクエスト方法とボディは当社サイトの API ドキュメントで確認できます。Apifox を用いたテストも提供しています。 - <YOUR_API_KEY> を、アカウントの実際の CometAPI キーに置き換えます。
- content フィールドに質問またはリクエストを挿入します—モデルはこの内容に応答します。
- . API レスポンスを処理して、生成された回答を取得します。
CometAPI は完全互換の REST API を提供—シームレスな移行が可能です。Chat に関するキー情報:
- ベース URL: v1/chat/completions
- モデル名:
gemini-3-pro-preview - 認証:
Bearer YOUR_CometAPI_API_KEYヘッダー - Content-Type:
application/json.
こちらも参照 GPT-5.1 API
