Nano Banana 2 Lite API 概要
Nano Banana 2 Lite API(正式名: gemini-3.1-flash-lite-image)は、高ボリュームな画像生成と編集のために効率性に特化した Google の Gemini 3.1 画像モデルです。Google はこれを Gemini 3.1 Flash Lite Image とも呼称しています。CometAPI 上では、開発者は Gemini ネイティブの generateContent ルートを通じて本モデルにアクセスでき、最高解像度よりも速度とコスト管理を重視する 1K の高速ドラフト、簡易な画像編集、インタラクティブなクリエイティブツール、サムネイル、ソーシャル向けアセット、プロダクションワークフローに実用的です。
技術仕様
| 項目 | 仕様 |
|---|---|
| モデル名 | Nano Banana 2 Lite / Gemini 3.1 Flash Lite Image |
| API モデル ID | gemini-3.1-flash-lite-image |
| CometAPI モデルコード | gemini-3-1-flash-lite-image |
| プロバイダ | |
| モデルタイプ | 画像生成と編集 |
| CometAPI カタログ機能 | text-to-image |
| 入力モダリティ | テキストと画像 |
| 出力モダリティ | 画像とテキスト |
| CometAPI のエンドポイント | POST /v1beta/models/{model}:generateContent |
| 安定モデル ID | gemini-3.1-flash-lite-image |
| 入力トークン上限 | 65,536 tokens |
| 出力トークン上限 | 4,096 tokens |
| 出力解像度 | 1K / 1024px のみ |
| サポート比率 | 1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9 を含む 14 種類 |
| Thinking | 対応(minimal と high) |
Nano Banana 2 Lite とは?
Nano Banana 2 Lite は、Google の Gemini 画像モデルファミリーにおける速度と効率のメンバーです。Google のモデルページでは、超低レイテンシかつコスト効率の高い画像生成・編集向けに設計された効率特化モデルとして説明されています。
トレードオフは意図的です。Nano Banana 2 Lite は、最大忠実度ではなく 1K 出力と高頻度のインタラクティブ用途を狙っています。Google はこの Lite モデルでは 2K および 4K 出力が非対応であり、画像生成ガイドでは複数参照入力やマルチターンの逐次編集には最適化されていないと明記しています。そのため高速ドラフトと軽量編集には適しており、高解像度や多参照のプロダクション作業には Gemini 3.1 Flash Image や Nano Banana Pro がより適合します。
Nano Banana 2 Lite API の主な機能
1. インタラクティブな画像ワークフロー向けの超低レイテンシ
Google は、Nano Banana 2 Lite を Gemini 画像ファミリーの効率スペシャリストとして位置づけています。公式モデルカードでは、エンドツーエンドで2秒未満のレイテンシを目標に掲げ、ローンチ投稿では実用的な高速ドラフトとしてテキストから画像まで約 4 秒の出力を強調しています。実運用では、レイテンシはプロンプトの複雑さ、画像入力サイズ、ネットワーク経路、レスポンスのモダリティ、CometAPI のルーティング条件などに依存しますが、最大解像度のオフラインレンダリングよりも高速なフィードバックループを志向しているのは明らかです。
これにより、Nano Banana 2 Lite は特にインタラクティブなビルダーに有用です。入力中にビジュアルを生成するアプリ UI、高頻度サムネイル生成、ゲームやアバタープレビュー、広告バリアント探索、EC のプレースホルダー生成、承認までに小さな反復を多数行うクリエイティブツールなどに適しています。
2. ネイティブな Text-to-Image および Image-to-Image 生成
Nano Banana 2 Lite はテキストと画像の両入力に対応し、画像とテキストの両出力を返せます。CometAPI の Gemini ルートを通じ、テキストプロンプトのみでネイティブなテキストから画像生成ができるほか、入力画像にテキスト指示を加えて画像から画像への編集も可能です。
Gemini のネイティブ画像ワークフローを利用するため、単純な「プロンプト入力 → 画像出力」に限定されません。ユーザーの視覚コンテキストを読み取り、ローカル編集を適用し、新しい画像を生成し、必要に応じてテキストをレスポンスに含められます。これは、プロダクトのモックアップツール、背景置換、簡易スタイル転送、ローカライズ済みキャンペーンバリアント、コンシューマーアプリ内のプレビュー画像などに適した形です。
3. 高速なマルチターンのローカル画像編集
Google のモデルカードは、色の入れ替え、ステッカー作成、背景調整などを含む高速なマルチターンのローカル編集を主要能力として挙げています。実際には、最初の画像を生成した後、「ジャケットを赤にして」「ステッカー化して」「背景をクリーンなスタジオ壁に差し替えて」といった追加入力を続けることができます。
制約は重要です。Google の画像生成ガイドでは、Nano Banana 2 Lite は複数の参照入力やマルチターンの逐次編集には最適化されていないとしています。軽量なローカル編集や会話型の探索には Lite、より重い参照処理、長い編集チェーン、プロフェッショナルなレイアウト制御が必要な場合は Nano Banana 2 または Nano Banana Pro を使い分けてください。
4. 強力なプロンプト遵守とキャラクター整合性
Google によれば、Nano Banana 2 Lite は、体験を加速させつつも Nano Banana に期待される制御性と正確性を維持します。公式資料では、プロンプト遵守の信頼性、キャラクターの一貫性、オリジナルの Nano Banana 基準に合致する高いキャラクターアラインメントが強調されています。
これは汎用の高速画像生成器以上の有用性をもたらします。繰り返しのクリエイティブ探索においては、意図した被写体、色の方向性、ポーズ、設定、ブランドキュー、キャラクターのアイデンティティをバリエーション間で保持する必要があります。Nano Banana 2 Lite は「アイデアを失わずに素早く反復する」用途を狙って設計されています。
5. 画像内テキストレンダリングの改善
Google のローンチ投稿では、速度を優先しつつも Nano Banana 2 Lite が判読性のある画像内テキストレンダリングを維持していると述べています。これは、サムネイル、簡易ポスター、UI コンセプト、ラベル、ステッカー、軽量なマーケティンググラフィックなど、生成画像に短い単語やフレーズを配置する必要がある場合に重要です。
テキスト量が多いインフォグラフィック、多言語レイアウト、雑誌風ページ、製品パッケージ、精緻なタイポグラフィには、Nano Banana 2 および Nano Banana Pro が適任です。Google の画像生成ガイドは、Nano Banana 2 をテキストレンダリングが信頼できるジェネラリスト、Nano Banana Pro を正確なテキストと複雑なレイアウトに対応するプロフェッショナルな選択肢として位置づけています。
6. 幅広いアスペクト比に対応した 1K 出力
Nano Banana 2 Lite は 1K 出力に最適化されており、公式モデルカードには 1024px / 1K がサポートサイズで、2K および 4K が非対応と記載されています。スクエア、ポートレート、ランドスケープ、縦長ソーシャル、ウルトラワイドなど一般的なアスペクト比をサポートします。
プロダクションでは、imageConfig.aspectRatio と imageConfig.imageSize を明示的に設定し、1K(大文字)またはサポートされている 1024px の値を使用してください。ワークフローで 2K、4K、0.5K のユーティリティプレビュー、あるいはより高忠実度の印刷・デザイン出力が必要な場合は、Nano Banana 2 または Nano Banana Pro を使用してください。
Nano Banana 2 Lite のベンチマーク性能
Arena.ai のパブリックリーダーボード(2026 年 6 月 29 日時点)によると、gemini-3.1-flash-lite-image は単なる「安価なドラフト」モデルではなく、高効率モデルとして上位に位置しています。生成ではより重い Gemini 画像モデルに近いスコアを示し、シングル画像編集でも低レイテンシを優先しながら競争力を維持しています。
| ベンチマーク | Nano Banana 2 Lite スコア | Arena.ai ランク指標 | 投票数 | 意味するところ |
|---|---|---|---|---|
| Text-to-Image Arena, Overall | 1251 +/- 8 | 70 モデル中 5 位 | 5,462 | Lite モデルとして強力な公開生成品質。このスナップショットでは mai-image-2.5 と Nano Banana 2 に次ぎ、2K の Nano Banana Pro プレビューを上回る水準 |
| Image Edit Arena, Single-Image Edit | 1308 +/- 7 | 49 モデル中 15 位 | 9,320 | 編集品質はフラッグシップ級モデルに劣るものの、多くの汎用画像エディタを上回り、競合上位グループに位置 |
選び方:Nano Banana 2 Lite vs Nano Banana 2 vs Nano Banana Pro
Google の Nano Banana 画像ファミリーは、速度・品質・制御性で階層化されています。Nano Banana 2 Lite は高ボリュームな 1K 生成向けの高速・効率モデル。Nano Banana 2 は、より高品質な画像生成と編集、強力な参照処理、最大 4K 出力に対応するジェネラリスト。Nano Banana Pro は、複雑なデザイン、ブランド正確性、高度なローカリゼーション、精密なクリエイティブ制御に向けたプレミアムモデルです。
テキストから画像のリーダーボードでは、gemini-3.1-flash-lite-image (nano-banana-2-lite) は複数のプレミアム競合に肉薄しています。gemini-3.1-flash-image-preview (nano-banana-2) は 1270 +/- 4、mai-image-2.5 は 1257 +/- 5、gemini-3-pro-image-preview-2k (nano-banana-pro) は 1245 +/- 4、gpt-image-1.5-high-fidelity は 1241 +/- 3 を記録。画像編集のリーダーボードは Lite にとってより厳しく、gpt-image-2 (medium) が 1464 +/- 4 で首位、Nano Banana 2 Lite の 1308 +/- 7 はフラッグシップ層の下ながら、依然として競合上位グループに位置します。
| モデル | プロバイダ | 最適なワークロード | 公開ベンチマーク指標 |
|---|---|---|---|
| Nano Banana 2 Lite (gemini-3.1-flash-lite-image) | 高速 1K 画像生成、軽量編集、大量ドラフト、インタラクティブなプロダクト体験 | Arena.ai Text-to-Image Overall で 1251 +/- 8;Arena.ai Single-Image Edit で 1308 +/- 7 | |
| Nano Banana 2 / Gemini 3.1 Flash Image | 高品質な Gemini 3.1 画像生成、強力なマルチリファレンス、2K/4K ワークフロー | Arena.ai Text-to-Image Overall で 1270 +/- 4;Arena.ai Single-Image Edit で 1387 +/- 4 | |
| Nano Banana Pro / Gemini 3 Pro Image | より要求の高い構図、豊富なコンテキスト、高解像度のプロダクション作業 | 2K プレビューで Arena.ai Text-to-Image Overall が 1245 +/- 4;Arena.ai Single-Image Edit が 1388 +/- 3 | |
| GPT Image 2 | OpenAI | 最高のベンチマーク品質を重視し、Lite クラスのレイテンシより品質を優先する生成・編集 | 引用スナップショットで Text-to-Image 1387 +/- 5、Single-Image Edit 1464 +/- 4 でリード |
次のような場合は Nano Banana 2 Lite を選択してください: プロダクト体験が速度・コスト管理・頻繁な反復に依存する場合。ほぼリアルタイムの UX、ドラフト生成、1K の軽量編集に最適です。
次のような場合は Nano Banana 2 を選択してください: 画像品質の安全なデフォルト、4K 出力、複数参照、より強力なテキストレンダリング、品質とレイテンシのバランスが必要な場合。多くのプロダクション画像ワークフローにおける汎用的な第一選択です。
次のような場合は Nano Banana Pro を選択してください: クイック生成よりデザイン制作に近いタスク(ブランド広告、製品モックアップ、多要素コンポジション、ローカリゼーション、精緻なタイポグラフィ、複雑な図版、最高レベルの知識とクリエイティブ制御が必要なアセット)に適しています。
CometAPI で Nano Banana 2 Lite API を使う方法
手順 1: API キーを取得
cometapi.com にログインします。未登録の場合はまず登録し、CometAPI コンソールのトークンページを開きます。パーソナルセンターの API トークン管理で Add Token をクリックし、アクセス資格情報を生成して、sk-xxxxx 形式のトークンキーをコピーします。
この API キーは秘密にし、バックエンドサービスまたはローカルの環境変数から使用してください。以下の例では、<YOUR_API_KEY> または $COMETAPI_KEY を実際のアカウントの CometAPI キーに置き換えてください。
手順 2: Nano Banana 2 Lite API にリクエストを送信
Nano Banana 2 Lite 用に gemini-3.1-flash-lite-image モデルのエンドポイントを選択します。リクエストは CometAPI の Gemini 画像ルート経由で送信します:
POST https://api.cometapi.com/v1beta/models/gemini-3.1-flash-lite-image:generateContent
リクエストメソッドとリクエストボディは CometAPI の Gemini 画像ドキュメントに従ってください。呼び出し場所: Gemini で画像を生成。同じルートでテキストから画像生成、画像編集、マルチ画像ワークフローをサポートしますが、Nano Banana 2 Lite 自体は 2K/4K や複雑な長鎖編集ではなく、高速な 1K 出力に最適化されています。
テキストから画像の場合は、contents.parts.text にテキストプロンプトを送信し、generationConfig.responseModalities に IMAGE を含めてください。画像編集の場合は、CometAPI ガイドに従って入力画像を指定します(Google Gen AI SDK 経由でローカル画像を渡す、またはドキュメント化された Gemini 形式で生データを送るなど)。そのうえで編集指示をテキストで追加します。マルチ画像ワークフローでは、まずソース画像をアップロードまたは準備し、サポートされる画像入力とモデル固有の制限について現行ドキュメントに従ってください。
手順 3: 結果の取得と検証
API レスポンスを処理して生成画像を取得します。Gemini の画像レスポンスにはテキストパート、最終画像パート、thought: true とマークされた中間画像パートが含まれる場合があります。最初の画像を盲目的に保存せず、thought: true のパートをスキップし、inlineData が存在し thought が true でない最後の画像パートを保存してください。
CometAPI のプレイグラウンドでは、通常 PNG 形式で生成画像を直接ダウンロードできます。API ワークフローでは、返却された inlineData の画像をデコード・保存するか、選択した CometAPI ワークフローが生成結果 URL を返す場合はその URL からダウンロードします。生成アセットは速やかにダウンロードまたは永続化し、解像度、プロンプト遵守、可視アーティファクト、安全要件、最終出力(中間の思考画像でないこと)の観点で検証してください。
Nano Banana 2 Lite に CometAPI を使う理由
CometAPI は、複数の画像モデルに対して 1 つのアカウントと 1 つのルーティングレイヤーを用意したいチームに有用です。CometAPI 上の Nano Banana 2 Lite を使えば、高速な 1K の Gemini 画像生成を実行し、Gemini 3.1 Flash Image、Nano Banana Pro、Imagen、Flux、Midjourney スタイルのルート、その他の画像モデルと出力を比較し、品質・レイテンシ・コストプロファイルに応じてジョブをルーティングできます。
また、CometAPI のモデルカタログでは、最新のモデル ID、プロバイダ、機能フラグ、可用性、エンドポイントパスが公開されます。これは、モデル切り替え、フォールバック、使用状況トラッキング、一貫した認証情報管理が必要なプロダクションアプリにおける統合の曖昧さを軽減します。