Gemini 3.5 Flash の技術仕様
| Item | Gemini 3.5 Flash |
|---|---|
| Provider | |
| Model family | Gemini 3.5 |
| Official model ID | gemini-3.5-flash |
| Input types | テキスト、画像、動画、音声、PDF |
| Output types | テキスト |
| Context window | 100万トークン |
| Max output tokens | ~65K 出力トークン |
| Primary strengths | エージェント型ワークフロー、コーディング、マルチモーダル推論 |
| Tool support | 関数呼び出し、コード実行、検索グラウンディング、構造化出力、URL コンテキスト、ファイル検索 |
| Thinking support | 思考/推論レベルの調整可能 |
| Safety framework | Google Frontier Safety Framework |
Gemini 3.5 Flash とは?
Google Gemini 3.5 Flash は、エージェント実行、コーディング、長期的なワークフローに最適化された、Google の高速マルチモーダル推論のフラッグシップモデルです。低遅延の推論特性を維持しながら、より強力な推論能力とソフトウェア工学能力を備えて Gemini Flash シリーズを拡張します。
初期の Flash モデルが主に軽量な推論に焦点を当てていたのとは異なり、Gemini 3.5 Flash は、永続的な AI エージェント、マルチステップのコーディングシステム、エンタープライズの自動化パイプライン向けに設計されています。Google は、同社のエージェント型 Flash ティアにおける最強のモデルとして位置付けています。
Gemini 3.5 Flash の主な機能
- 1M トークンの長文脈サポート: 巨大なリポジトリ、長大なドキュメント、PDF、文字起こし、複数セッションにまたがるワークフローを単一のプロンプトコンテキストで扱えます。
- 強力なエージェント実行: マルチステップの自律ワークフロー、ツールのオーケストレーション、ターミナル作業、長時間稼働する AI エージェント向けに最適化。
- 高度なコーディング性能: Terminal-Bench や MCP Atlas を含む複数のコーディング/エージェント系ベンチマークで Gemini 3.1 Pro を上回ります。
- ネイティブなマルチモーダル推論: テキスト、画像、音声、動画、PDF を受け付け、統合的な推論タスクに対応。
- プロダクション級のツール群: 構造化出力、関数呼び出し、コード実行、Google Search や Maps によるグラウンディング、ファイル検索をサポート。
- 設定可能な推論/思考モード: 開発者は思考レベルの制御により、レイテンシと推論の深さのトレードオフを調整可能。
Gemini 3.5 Flash のベンチマーク性能
Google の報告によるベンチマーク結果では、Gemini 3.5 Flash は現在入手可能なエージェント型 Flash ティアモデルの中でも最強クラスと位置付けられています。
| Benchmark | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
これらのスコアは、旧来の Gemini Flash 系列と比べて、自律実行、マルチモーダル推論、ソフトウェア工学の信頼性において大幅な向上を示しています。
Gemini 3.5 Flash と他モデルの比較
| Capability | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| Context window | 1M トークン | 大規模コンテキスト | 大規模コンテキスト |
| Agentic workflows | 非常に優れた | 強力 | 強力 |
| Coding performance | 非常に強力 | 強力 | 優れた |
| Inference speed | Flash に最適化された低遅延 | より遅い | 中程度 |
| Multimodal inputs | ネイティブなマルチモーダル | ネイティブなマルチモーダル | ビジョン+テキスト |
| Tool ecosystem | 豊富な Google ツール | 豊富 | 強力な API ツール群 |
主要な違い
- vs Gemini 3.1 Pro: Gemini 3.5 Flash は、推論速度を大幅に高速なまま保ちつつ、コーディングと自律的タスク実行でより高い性能を発揮します。
- vs Claude Sonnet 4: Claude は長文の微妙な推論や文章品質で優位なことが多い一方、Gemini 3.5 Flash は速度、エージェント実行、Google エコシステムとの統合を重視しています。
- vs GPT シリーズの推論モデル: Gemini 3.5 Flash は、マルチモーダルなエージェントワークフローや大規模コンテキストのオーケストレーションで特に競争力があり、とりわけエンタープライズの自動化ユースケースに適しています。
既知の制限事項
- 現在、ネイティブな画像・音声生成の出力をサポートしていません。
- このモデルティアでは、ライブの会話型 API をサポートしていません。
- コミュニティベンチマークでは、特定の専門的評価タスク、特にビジョン中心のニッチなワークフローにおいて、性能がまちまちであることが示されています。
Gemini 3.5 Flash API へのアクセス方法
ステップ 1: API アクセスを取得
cometAPI にログインします。まだユーザーでない場合は、まず登録してください。自分の CometAPI console にサインインします。インターフェースのアクセス用 API キーを取得します。パーソナルセンターの API トークンで “Add Token” をクリックし、トークンキー: sk-xxxxx を取得して送信します。

ステップ 2: Gemini 3.5 Flash API へリクエストを送信
API リクエストを送信するために “` gemini-3.5-flash” エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。当社サイトは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> を、あなたのアカウントの実際の CometAPI キーに置き換えてください。ベース URL は Gemini Generating Content です。
質問やリクエストを content フィールドに挿入します—モデルが応答する対象はこのフィールドです。API レスポンスを処理して生成された回答を取得します。
ステップ 3: レスポンスの処理
API は、生成テキスト、引用、セーフティメタデータ、オプションのツール出力を含む構造化された候補レスポンスを返します。