Gemini 3.1 Flash Image Preview の技術仕様
| Item | Gemini 3.1 Flash Image Preview |
|---|---|
| Provider | |
| Model family | Gemini 3.1 (Flash ティア) |
| Primary focus | 画像プレビュー対応の高速マルチモーダル生成 |
| Input types | Text, Image |
| Output types | Text, Image (preview generation) |
| Context window | 最大 1M tokens(Gemini 3.x Flash ティア標準) |
| Latency tier | 低レイテンシ・高スループット |
| Streaming support | 対応 |
| Tool calling | 対応(Gemini API tools framework) |
| Version | 3.1 |
Nano Banana 2 とは
Nano Banana 2 は、新たにリリースされた Gemini-3.1-Flash-Image モデルに対して、報道や開発者コミュニティで広く使われている愛称です。Google はこれを、より低いレイテンシとコストでほぼ Pro レベルの視覚的忠実度を実現する “Flash” ティアの画像エンジンとして位置づけています。大規模生成、高頻度の反復編集、Google サービス横断の統合プロダクトワークフローに適しています。Gemini 3.1 のマルチモーダル推論を継承し、画像中心の機能(画像内テキストの可読性、マルチイメージ合成、極端なアスペクト比のサポート、ネイティブ 4K)を追加しています。
主な機能
- 高速・多解像度生成: Flash ティアの速度で、0.5K / 1K / 2K / 4K 出力および新しい極端なアスペクト比(1:4、4:1、1:8、8:1)に対応。
- リアルタイム Web グラウンディング: “Thinking” または検索グラウンディングが有効な場合、テキストと画像の検索結果を統合して生成内容を最新の Web 情報に基づかせます。最新リファレンスやファクトを伴うインフォグラフィックに有用。
- テキストレンダリングの改善: 以前の Flash モデルよりも短いテキストやグラフィックテキスト(フォント、サイズ)の描画が向上。長文や極小テキストでは完全ではありません。
- マルチ入力編集とマルチターン・ワークフロー: 複数画像の入力や、複数ターンにわたる反復編集に強力に対応。
📊 ベンチマーク性能 — 画像生成 & 編集(Elo スコア)
| Capability | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Text-to-Image — Overall Preference | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Text-to-Image — Visual Quality | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Text-to-Image — Infographics (Factuality) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Editing — General | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Editing — Character | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Editing — Creative | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Editing — Object/Environment | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Editing — Multi-Input | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Editing — Stylization | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
このベンチマーク表からの主なポイント:
- テキストから画像の生成 および 画像編集 のカテゴリ全般で、Gemini 3.1 Flash Image は Flash ティアおよび多くの競合画像モデルの中で、最高水準に並ぶか上回るスコアを一貫して示しています。
- 特に Visual Quality と Infographic(Factuality) ベンチマークで強みが顕著であり、審美性だけでなく構造的に正確なコンテンツの描画にも優れていることが示唆されます。
- マルチ入力編集 においても、Nano Banana 2 は前世代の Flash モデルより高いスコアで、堅牢な汎化性能を示しています。
これらの評価は、多様なベンチマークスイートにおける人手のサイドバイサイド Elo 比較により実施され、一般的な画像生成・編集タスクにおける嗜好と忠実度の両面を反映しています。
Nano Banana 2 と Nano Banana、Nano Banana Pro の比較
| Model | Positioning | Representative benchmark/notes |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Flash ティア:スピード + 高い画質(2K–4K) | 全体の嗜好スコア 1079.0 ± 7.0、画質 1140 ± 6.0(社内 GenAI-Bench)。 |
| Gemini 2.5 Flash Image (Nano Banana) | 先行する Flash リリース(忠実度はやや低め) | 3.1 と比べ嗜好/画質スコアがわずかに低い。 |
| Gemini 3 Pro Image (Nano Banana Pro) | Pro ティア:複雑タスクでより高い知覚上の忠実度、コスト/レイテンシ高 | トレードオフが異なる。特定タスクでは相対的順位が異なるメトリクスもあり。 |
| GPT-Image 1.5 / other commercial models | 競合(オープン/クローズド) | Google の社内ベンチマークでは、報告された評価において画質と全体嗜好で GPT-Image などは Gemini 3.1 を下回る結果。第三者の比較では見解が分かれる場合あり。 |
Flash Image Preview を選ぶべき場面:
- アプリ内のリアルタイム画像プレビュー
- コスト重視の大規模画像生成
- インタラクティブなデザインアシスタント
Nano Banana 2 の利用と統合方法
Step 1: API キーを取得
cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。CometAPI console にサインインします。インターフェースのアクセス認証用 API キーを取得します。パーソナルセンターの API トークンで「Add Token」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
Step 2: Nano Banana 2 API にリクエストを送信
“gemini-3.1-flash-image-preview8” エンドポイントを選択し、API リクエストを送信してリクエストボディを設定します。リクエストメソッドおよびリクエストボディは当社サイトの API ドキュメントから取得できます。利便性のため、当社サイトでは Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。Where to call it: Gemini generates image
Nano Banana 2 は、画像編集、画像生成、マルチ画像ワークフローをサポートします。画像編集の場合は、画像 URL をアップロードする必要があります。その他のパラメータについてはドキュメントを参照してください。
Step 3: 結果の取得と検証
API レスポンスを処理して生成結果を取得します。処理後、API はタスクステータスと出力データを返します。プレイグラウンドで画像をローカルに直接ダウンロードできます(通常は PNG 形式)。API 処理中に画像 URL が生成されますので、速やかにダウンロードしてください。



