Gemini 3.5 Flash の技術仕様
| 項目 | Gemini 3.5 Flash |
|---|---|
| Provider | |
| Model family | Gemini 3.5 |
| Official model ID | gemini-3.5-flash |
| Input types | Text, image, video, audio, PDF |
| Output types | Text |
| Context window | 1 million tokens |
| Max output tokens | ~65K output tokens |
| Primary strengths | Agentic workflows, coding, multimodal reasoning |
| Tool support | Function calling, code execution, search grounding, structured outputs, URL context, file search |
| Thinking support | Adjustable thinking/reasoning levels |
| Safety framework | Google Frontier Safety Framework |
Gemini 3.5 Flash とは?
Google Gemini 3.5 Flash は、エージェント型実行、コーディング、長期的ワークフローに最適化された、Google のフラッグシップ高速マルチモーダル推論モデルです。低レイテンシー推論という特性を維持しつつ、推論力とソフトウェアエンジニアリング能力を大幅に強化し、Gemini Flash シリーズを拡張しています。
従来の軽量推論に主眼を置いた Flash モデルと異なり、Gemini 3.5 Flash は永続的な AI エージェント、マルチステップのコーディング システム、エンタープライズの自動化パイプライン向けに設計されています。Google は、これを現時点で最も強力なエージェント型の Flash ティア モデルとして位置付けています。
Gemini 3.5 Flash の主な機能
- 1M token の長コンテキスト対応: 非常に大規模なリポジトリ、長大なドキュメント、PDF、トランスクリプト、マルチセッションのワークフローを単一のプロンプト コンテキストで処理します。
- 強力なエージェント型実行: マルチステップの自律ワークフロー、ツールのオーケストレーション、ターミナル作業、長時間稼働の AI エージェントに最適化。
- 先進的なコーディング性能: Terminal-Bench や MCP Atlas を含む複数のコーディング/エージェント系ベンチマークで Gemini 3.1 Pro を上回ります。
- ネイティブなマルチモーダル推論: テキスト、画像、音声、動画、PDF を受け付け、統合的に推論します。
- プロダクション水準のツール群: 構造化出力、関数呼び出し、コード実行、Google 検索や Google マップによるグラウンディング、ファイル検索をサポート。
- 推論/思考モードの設定が可能: 思考レベルの制御により、レイテンシーと推論深度のトレードオフを調整できます。
Gemini 3.5 Flash のベンチマーク性能
Google 公表のベンチマーク結果では、Gemini 3.5 Flash は現在入手可能なエージェント型 Flash ティア モデルの中でも最上位クラスに位置付けられています。
| ベンチマーク | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
これらのスコアは、従来の Gemini Flash 系列と比べて、自律実行、マルチモーダル推論、ソフトウェアエンジニアリングの信頼性において大幅な向上を示しています。
Gemini 3.5 Flash と他モデルの比較
| 機能 | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| コンテキスト ウィンドウ | 1M tokens | 大規模コンテキスト | 大規模コンテキスト |
| エージェント型ワークフロー | 優秀 | 強力 | 強力 |
| コーディング性能 | 非常に強力 | 強力 | 優秀 |
| 推論速度 | 最適化された Flash レイテンシー | より遅い | 中程度 |
| マルチモーダル入力 | ネイティブなマルチモーダル | ネイティブなマルチモーダル | ビジョン + テキスト |
| ツール エコシステム | 充実した Google ツール群 | 充実 | 強力な API ツール群 |
主な違い
- vs Gemini 3.1 Pro: Gemini 3.5 Flash は、推論速度を大幅に向上させつつ、コーディングと自律タスク実行でより優れた性能を発揮します。
- vs Claude Sonnet 4: 長文の微妙な推論や文章品質では Claude が優位な場面もありますが、Gemini 3.5 Flash は速度、エージェント実行、Google エコシステムとの統合を重視しています。
- vs GPT-series reasoning models: Gemini 3.5 Flash は特に、エンタープライズ自動化ユースケースにおけるマルチモーダルなエージェント ワークフローや大規模コンテキストのオーケストレーションで競争力があります。
Gemini 3.5 Flash の既知の制限事項
- 現時点では、画像や音声のネイティブ生成出力をサポートしていません。
- このモデル階層ではライブ会話 API はサポートされていません。
- コミュニティのベンチマークでは、一部の特化評価タスク、特にビジョン依存度の高いニッチなワークフローにおいて、性能がまちまちであることが示されています。
Gemini 3.5 Flash API へのアクセス方法
ステップ 1: API アクセスを取得
cometAPI にログインします。まだユーザーでない場合は、まず登録してください。CometAPI console にサインインします。インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API token で “Add Token” をクリックし、トークンキー sk-xxxxx を取得して送信します。

ステップ 2: Gemini 3.5 Flash API にリクエストを送信
“` gemini-3.5-flash” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。当社サイトでは利便性のため Apifox のテストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。base url is Gemini Generating Content
content フィールドに質問またはリクエストを挿入します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。
ステップ 3: レスポンスを処理
API は、生成テキスト、出典、セーフティ メタデータ、オプションのツール出力を含む構造化された候補レスポンスを返します。