Google は 2026 年 5 月 19 日の I/O で Gemini 3.5 Flash を公開し、エージェント型ワークフロー、コーディング、マルチモーダルタスクにおいて、最先端性能を持続的に発揮できる「高知能・速度最適化」モデルとして位置づけました。Gemini 3 Flash の基盤を踏まえつつ、品質・コスト・レイテンシのバランスを取るための強化された「思考レベル」を備えています。
本ガイドでは、Gemini 3.5 Flash とは何か、主要機能、詳細なベンチマーク性能、価格、GPT-5.5 や Claude 4.7/4.6 などとの比較までを包括的に解説します。主要な AI API アグリゲーターとして、CometAPI は、Gemini 3.5 Flash(および競合モデル)へのアクセスを統一料金・簡素な統合・コスト最適化ツールとともに提供します。
Gemini 3.5 Flash とは?
Gemini 3.5 Flash は、Gemini 3 Flash の推論基盤をベースに、品質・レイテンシ・コストのトレードオフを微調整するための強化された「思考レベル」(minimal、low、medium/default、high)を追加したモデルです。テキスト、画像、動画、音声、ドキュメント(PDF を含む)をサポートするネイティブなマルチモーダルモデルで、コンテキストウィンドウは 1M トークン、出力は最大 65K トークンです。知識カットオフは 2025 年 1 月です。
従来の Flash モデルとの主な差別化要素:
- エージェント型・コーディング・長期(ロングホライズン)タスクにおける 最先端性能の持続
- 思考の保持(Thought preservation):追加の API 変更なしで、マルチターン会話における中間推論を自動的に維持
- スケール最適化:並列エージェント実行、反復的コーディング、多段のエンタープライズ・ワークフロー向けに設計
- コンピュータ操作(computer use)には未対応(現時点)だが、ツール利用と関数呼び出しが強化
Google はこれを、プロダクション用途向けの「最も知的な Flash モデル」と位置づけ、前世代の Gemini 3.1 Pro を多くのエージェント型/コーディング系ベンチマークで上回りつつ、Flash レベルの速度(テストではしばしば出力 >280 トークン/秒)を提供するとしています。
Gemini 3.5 Flash は、最適化されたレイテンシとコストで Pro に近い知能を実現し、エージェント型ワークフローとコーディングで優れた性能を発揮します。Terminal-bench 2.1 で 76.2%、MCP Atlas のマルチステップタスクで 83.6% といったスコアを達成しています。
ベンチマーク性能のブレークスルー
独立テストにより、より高い速度でコーディング/エージェント型タスクにおいて Pro 級またはそれ以上の性能を発揮することが確認されています。一方で、複雑なエージェントループではトークン消費が増え、旧 Flash モデル比で 3 倍の価格上昇もあり、総ベンチマーク実行コストは増加します。
Gemini 3.5 Flash は、特にエージェント型およびコーディング領域で先代を大きく上回る改善を示しています。以下は Google DeepMind のモデルカードおよび独立評価(2026 年 5 月時点)の主要結果です。
選定ベンチマーク(Gemini 3.5 Flash と比較対象):
コーディング:
- Terminal-bench 2.1(エージェント型ターミナルコーディング):76.2%(Gemini 3 Flash 58.0%、Gemini 3.1 Pro 70.3%、GPT-5.5 78.2%)
- SWE-Bench Pro(Public、多様なエージェント型コーディング):55.1%(3 Flash 49.6%、3.1 Pro 54.2%)
エージェント型ツール利用:
- MCP Atlas(マルチステップ・ワークフロー):83.6%(大きくリード)
- Toolathlon(実世界の一般的ツール利用):56.5%
- Finance Agent v2:57.9%(3 Flash 比 +15.3% の大幅増)
マルチモーダル:
- CharXiv(チャート推論):84.2%
- MMMU-Pro:83.6%(多くの競合をリード)
推論・長文脈:
- Humanity’s Last Exam:40.2%
- ARC-AGI-2:72.1%
- MRCR v2(128k):77.3%;1M コンテキストは pointwise で 26.6% と強い

Artificial Analysis Intelligence Index:Gemini 3.5 Flash は(high thinking で)55 を記録し、Gemini 3 Flash から 9 ポイント上昇。知能 vs 速度のパレート最前線をリードし、エージェント型タスクでの改善と幻覚(ハルシネーション)の低減(幻覚率 61% まで低下)を示します。出力 >280 トークン/秒を達成する一方、エージェントループでのトークン使用量は増える傾向があります。
長文脈(MRCR v2 と 1M pointwise が強い)、マルチモーダル(チャート、ドキュメント)でのリーダーシップ、持続的なエージェント性能に強みがあり、一部ワークフローではトークン無駄を削減(例:サイバーベンチマークで 42% 改善、トークン 72% 削減)しています。
速度とエージェント性能のバランス
Gemini 3.5 Flash は 速度と知能のトレードオフで際立ちます。高スループット(>280 トークン/秒)を維持しながら、サブエージェントの展開、並列実行、迅速な反復といった高度なエージェント挙動をサポートします。
デフォルトの思考努力は medium となり、Gemini 3 Flash Preview の high から変更されています。
思考レベルにより精密な制御が可能です:
- Medium(デフォルト):ほとんどの複雑なコード/エージェント型タスクに最適なバランス
- High:最難関問題で深い推論を最大化
- Low/Minimal:単純な問い合わせ向けに超低レイテンシ
Google は、実運用のエージェント・シナリオで顕著なトークン効率向上(例:一部サイバーベンチマークで 72% 削減)を報告しており、長時間の継続実行ワークフローにも適用可能としています。
トレードオフ:旧 Flash モデルより高価格のため、トークンを多用するエージェント・シナリオでは全体コストが増加(価格 + 使用量により、Gemini 3 Flash 比で Intelligence Index コストが 5.5 倍)。
インテリジェントエージェントの強化機能
Gemini 3.5 Flash は「エージェント型 Gemini 時代」を前進させます。主な強化点:
- 並列エージェント実行ループ:複雑な問題解決のため複数サブエージェントを展開
- 反復的コーディングとプロトタイピング:動的ツール利用で解法を高速に探索
- 長期のマルチステップ・ワークフロー:思考保持により、拡張されたエンタープライズ工程を処理
- ツール利用の改善:厳格な関数レスポンス整合、マルチモーダル関数レスポンス、より良いプロンプトと低い思考レベルによる不要呼び出し削減。OSWorld や UI タスクでも強い
Google の新しい情報エージェント、自律リサーチ、コーディングパイプラインを支えます。内部テストでは、複雑システムの構築や研究プロジェクト管理で優れた結果を示します。
開発者向けには、新しい Interactions API(ベータ)がサーバーサイドの履歴管理を簡素化し、他エコシステムの高度パターンに近い運用を可能にします。
CometAPI 推奨:統一 API を使い、Gemini 3.5 Flash を特化モデル(例:深いコードレビューに Claude、創造系タスクに GPT)とチェーンしてエージェントシステムを構築してください。ルーティングとフォールバック機能により信頼性とコスト削減を実現します。
マルチモーダルのリーダーシップ
Google はマルチモーダル理解でのリーダーシップを維持しています。Gemini 3.5 Flash はテキスト+画像+動画+音声+ドキュメントをネイティブに処理し推論します。CharXiv、MMMU-Pro、動画理解タスクなどのベンチマークでリード、または僅差で競合します。
ユースケース:チャート/データの統合、動画解析、マルチモーダル関数呼び出し(例:ツール応答内の画像処理)、リッチメディア・エージェント。EC、コンテンツ制作、科学可視化などに最適です。
価格:Gemini 3.5 Flash のコストは?
Gemini API 価格(1M トークンあたり、概算のグローバルレート):
- 入力(テキスト/画像/動画/音声):$1.50
- 出力:$9.00
- コンテキストキャッシュ:$0.15(繰り返しプロンプトで大幅節約)
これは Gemini 3 Flash Preview($0.50/$3)から約 3 倍の増加ですが、能力向上を踏まえると競争力があります。Gemini 3.1 Pro($2/$12)に近い価格帯に接近しつつ、多くのワークロードでより良い速度を提供します。
Enterprise/Agent Platform のティアは、ボリュームディスカウントや追加オプションにより変動する場合があります。キャッシュ入力や効率的なプロンプト(低い思考レベル、最適化された履歴)によりコストは大きく抑えられます。
これは Gemini 3 Flash Preview($0.50/$3)から約 3 倍の増加ですが、能力向上を踏まえると競争力があります。Gemini 3.1 Pro($2/$12)に近い価格帯に接近しつつ、多くのワークロードでより良い速度を提供します。
Free Tier:Google AI Studio/Gemini アプリ経由で限定利用可能;本番運用は有料。
Cometapi の優位性:100+ モデルと並んで Gemini 3.5 Flash API にアクセスでき、競争力のあるレート、利用分析、トークン支出を最小化する最適化ツールを提供します。当社プラットフォームはスマートルーティングとバッチングにより、実効価格をより良くできることが多いです。API 価格は通常、公式価格より 20% 低くなります。
Gemini 3.5 Flash vs. GPT-5.5、Claude 4.7/4.6 ほか
Gemini 3.5 Flash の強み:
- 速度 + エージェントバランス:多くの最先端モデルより推論が速く、知能差を縮小
- マルチモーダル & 長文脈:ネイティブ 1M コンテキストと視覚領域の強さ
- ボリューム時のコスト:トップクラスの Claude/GPT よりトークン単価が安いケースが多く、特にキャッシュで有利
- Google エコシステム:Search、Workspace、Cloud とのシームレス統合
競合が上回る点:
- GPT-5.5 は生の推論力(例:ARC-AGI)で優位なことが多く、創造性/汎用性が強い可能性
- Claude Opus 4.7/Sonnet 4.6 は慎重なコーディング(場合によって SWE-Bench が高い)や繊細な文章/安全性で優位
- トークン効率はケース次第で、エージェントループにより 3.5 Flash の総コストが高くなる場合がある
高レベル比較(概算/抜粋メトリクス。最新リーダーボードは常に確認してください):
| ベンチマーク / 指標 | Gemini 3.5 Flash | GPT-5.5 | Claude Opus 4.7 / Sonnet 4.6 | Gemini 3.1 Pro | 備考 |
|---|---|---|---|---|---|
| Terminal-bench 2.1(コーディング) | 76.2% | 78.2% | ~66% | 70.3% | エージェント型コーディング |
| MCP Atlas(エージェント) | 83.6% | 75.3% | 79.1% / 69.5% | 78.2% | マルチステップワークフロー |
| GDPval-AA(エージェント知識) | 1656 Elo | 1769 | 1753 | 1314 | 経済価値 |
| MMMU-Pro(マルチモーダル) | 83.6% | 81.2% | ~75% | 80.5% | Gemini が強いリード |
| Intelligence Index(AA) | 55 | High(変動) | 競争的 | 低い | 速度/知能のパレート |
| 速度(トークン/秒) | >280 | 低い | 変動 | 遅い | Flash の優位 |
| 入力/出力価格($/1M) | 1.50 / 9.00 | 高い | 高い(特に Opus) | 2/12 | 最先端として費用対効果 |
| コンテキストウィンドウ | 1M | 競争的 | 強い | 1M+ | いずれも最先端レベル |
トレードオフの要約:
- Gemini 3.5 Flash は、スケールにおける速度 + マルチモーダル + エージェント効率で優位
- GPT-5.5 は、最高峰の推論/コーディングで上回ることが多い
- Claude 4.7 Opus は、慎重で高信頼のコーディングに強いが、コスト/レイテンシが高い
Gemini はマルチモーダルや特定のエージェント系スイートでしばしば首位または同等であり、より高速かつ高ボリュームでの費用対効果が高い傾向があります。
Gemini 3.5 Flash へのアクセスと統合方法
アクセス方法:
- Gemini アプリ / Google AI Studio
- Gemini API(
gemini-3.5-flash) - Google Cloud Vertex AI / Enterprise Agent Platform
- マルチプロバイダーの柔軟性を得るためのサードパーティ・アグリゲーター
CometAPI 推奨:Cometapi.com 上のプロダクションアプリでは、単一の API キーで一度統合するだけで、Gemini 3.5 Flash(および OpenAI、Anthropic、xAI などの 500+ モデル)に、実効価格 20–40% 低下、ベンダーロックインなし、容易なモデル切り替えでアクセスできます。
プロジェクトにおける利点:
- モデル名を変えるだけで、Gemini 3.5 Flash を GPT-5.5 や Claude 4.7 と即時比較
- 統一請求、フォールバックルーティング、最適化されたレイテンシ
- プロバイダー横断の信頼性が必要なエージェント型アプリに最適
- 十分なテスト上限付きの無料 API キー登録
公式 SDK または CometAPI の統一エンドポイントでの統合例はシンプルで、コーディングのスケールに最適です
ユースケースとベストプラクティス
- エージェント型自動化:リサーチ、データ分析、カスタマーサポート向けの堅牢なマルチエージェントシステムを構築
- コーディング & 開発:Antigravity や IDE での反復プロトタイピング、デバッグ、フルパイプライン生成
- マルチモーダルアプリケーション:画像/動画解析、チャート理解、コンテンツ生成
- エンタープライズ・ワークフロー:キャッシュと思考レベルによるコスト制御を伴う長期プロセス
ヒント:思考保持のため会話履歴をフルに使用。medium 思考から開始。ツール呼び出しを減らすようプロンプトを最適化。コスト効率のためトークン使用量を監視。
制約と注意点
- 価格上昇により、高ボリュームアプリでは慎重な最適化が必要
- コンピュータ操作は未対応(更新を監視)
- 安全性評価はトーン面の改善など堅調だが、自動指標は変動
- 幻覚の低減は顕著だが、重要出力は常に検証が必要
- 価格上昇:旧 Flash モデルより高い;思考レベルとキャッシュで最適化
- 知識カットオフ:2025 年 1 月—最新情報はグラウンディング/Search ツールを利用
結論:Gemini 3.5 Flash は導入する価値があるか?
はい。速度、エージェントの信頼性、マルチモーダル能力、スケーラブルな性能を重視する開発者や企業にとって有力です。パレート最前線を押し広げ、プロダクション用途で最先端 AI をより利用しやすくします。
構築を始める準備はできましたか? CometAPI へ今すぐアクセスして、Gemini 3.5 Flash を他のトップモデルと同一ダッシュボードでテストしてください。AI スタックを最適化し、コストを削減し、より速くリリースしましょう。
