Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

入力:$1.5616/M
出力:$9.3696/M
Nano Banana Pro は、テキスト中心のワークフローにおける汎用支援向けのAIモデルです。制御可能な構造でコンテンツを生成・変換・分析するためのインストラクション型プロンプトに適しています。典型的な用途には、チャットアシスタント、文書要約、ナレッジQA、ワークフロー自動化が含まれます。公開されている技術的詳細は限られていますが、統合は構造化出力、検索拡張型プロンプト、ツールまたは関数呼び出しといった一般的なAIアシスタントのパターンに整合します。
新着
商用利用
Playground
概要
機能
料金プラン
API
バージョン

基本機能

  • テキスト → 画像:高いプロンプト追従性を備えた、完全なプロンプト駆動生成。
  • 画像 → 画像(編集):複数回の編集でも被写体/キャラクターの一貫性を維持しながら、細かく狙いを絞った編集が可能。
  • 最大出力解像度: 最大 4K(例およびサポートされる正確なピクセルサイズはアスペクト比によって異なります。API では 1K / 2K / 4K のプリセットを提供)
  • 反復的な計画と自己修正:一般的な視覚的ミス(遠近法、文字、細かな幾何形状)を検出して修正する内部の「マルチステージ」パイプライン。
  • 画像内テキストの高度なレンダリング:ポスター、モックアップ、インフォグラフィックに適した、明瞭で読みやすい多言語テキスト(短いキャプションから長い段落まで)。
  • 5 人のキャラクターに対応し、単一のワークフローで最大 14 個のオブジェクト/参照画像まで忠実性を維持。
  • ウォーターマーク/来歴情報: 生成されたすべての画像には SynthID ウォーターマークが含まれ、一部の製品統合では来歴情報のために C2PA メタデータが埋め込まれます。

Gemini 3 Pro Image のバージョンと命名

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

技術詳細

アーキテクチャ

  • 系譜 / バックボーン:Nano Banana Pro は Google の進化する Gemini 画像スタック、具体的には新しい Gemini 3 Pro Image / GEMPIX 2 アーキテクチャ(より大規模なマルチモーダル画像+テキストフレームワーク)上に構築されています。これは Gemini 2.5 Flash Image(元の「nano-banana」)から進化したもので、視覚と言語の推論能力を拡張したネイティブなマルチモーダル画像モデルです。
  • モデルの挙動:ネイティブなマルチモーダリティ(画像 + テキスト + 世界知識)、複数画像の融合のための明示的なパイプライン、そして単一の静的サンプルを生成するのではなく複数回のパスで出力を洗練する内部の段階的プランナーを備えています。初期レポートでは、以前のバージョンと比べて幾何学的/光学的推論(ガラス、屈折)がより強いことが示されています。
  • Thinking / 内部リファイン:モデルは構図を洗練するために内部で可視の「thinking」プロセスを使用します(API ドキュメントではこの挙動が記載されており、それらの内部ステップは最終画像トークンとして課金されないことが示されています)。
  • グラウンディングとツール:Search grounding をサポートしており、図表/インフォグラフィック生成にウェブ上の事実を取り込むことができます。また、より決定論的な制御のために system instructions もサポートしています。

主要な API パラメータ:

  • thinking_level(low / high):レイテンシと推論の深さのトレードオフを調整;
  • media_resolution(low/medium/high):画像 OCR/細部読み取りトークンを制御;
  • generationConfig.imageConfig:画像出力のアスペクト比/解像度を制御。

画像の制限:

  • 対応する入力モダリティ: テキストおよび画像(このモデルは画像生成入力として音声や動画を受け付けません)。
  • プロンプトあたりの最大画像数: 14(Gemini 3 Pro Image preview の場合)。
  • 最大画像サイズ(アップロード): 入力画像 1 枚あたり 7 MB。
  • 対応アスペクト比: 1:1、3:2、16:9、9:16、21:9 など。

出力画像 / トークン: 上限は高く、4K/4096px をサポート。

ベンチマーク性能

要約: 現時点の公開/初期ベンチマークの多くは定性的/コミュニティ主導のものですが、元の nano-banana(Gemini 2.5 Flash Image)と比較して、解像度、アーティファクト低減、物理的忠実性において大幅な改善が一貫して報告されています。特定の有名な「チャレンジ」では明確な視覚的向上が見られますが、Google から v1 → v2 を標準的な画像生成指標で比較した公開の数値ベンチマーク表はまだありません。

  • 定性的なコミュニティテスト:よりきれいな輪郭、よりシャープな微細ディテール、より正確な色、そしてより忠実なプロンプト追従(幻覚的な小道具の減少、より一貫したキャラクター)。人気の非公式テストには、いわゆる「Wine Glass Test」や「Glass Burger Challenge」があり、GEMPIX2(Nano Banana Pro)は透明性と屈折の処理で以前のビルドより著しく優れています。
  • テキスト処理:Nano Banana Pro は画像内のタイポグラフィとテキスト配置が目に見えて改善されています(これは多くの画像モデルにとって継続的な弱点でした)。コミュニティ比較では、文字の崩れが少ないことが示されています。
  • スループット / UX:反復速度が速く、バックエンドでマルチステージのリファインを行う UX により、ユーザーはより信頼できる初回結果を得やすくなっています(手動での再生成を減らせます)。

制限とリスク

  • コンテンツフィルターと検出:モデルを統合するプラットフォーム(例:Whisk / サードパーティアプリ)は、厳格な有名人または肖像検出を有効化し、特定の出力をブロックする場合があります。これは、リアルな有名人の肖像に依存するクリエイティブワークフローに影響します。
  • ハルシネーション / 推論のエッジケース:改善されているとはいえ、特に画像内に高密度の記号的テキストがある場合や高度に技術的な図表では、依然として物理的に不自然なアーティファクトを生成することがあります。ただし NB2 は以前のバージョンよりこれらのエラーを減らしているようです。
  • 安全性と悪用: 生成画像モデルは問題のある、または有害なコンテンツの作成に悪用される可能性があります。Google は来歴情報の補助として制約、コンテンツフィルター、SynthID ウォーターマークを適用していますが、それでも悪用事例は発生しており(政治的にセンシティブな状況で Nano Banana により生成された画像に関連する大きな論争がありました)。

Nano Banana Pro と他モデルの比較

  • Nano Banana Pro(GEMPIX 2 / Gemini 3 Pro Image) — 強力なモバイル統合、複数画像融合、反復的自己修正、2K ネイティブ / 4K アップスケーリング、Google アプリ(Search、Photos、Workspace/Gemini)との緊密な統合が特徴です。信頼性の高い編集、連続性、Google サービスとの統合を必要とするワークフローに最適です。
  • Midjourney — スタイライズされた芸術的出力とコミュニティ主導のプロンプトエンジニアリングに優れています。通常、写真精度の高い複数画像融合や深いマルチモーダル編集パイプラインを主目的としていません。
  • Stable Diffusion / オープンウェイト — 完全にオープンで、高いカスタマイズ性があり、ローカルでホスト可能です。チェックポイントやファインチューニングのエコシステムは、研究やオフライン用途において決定的な利点です。Nano Banana Pro と比べると、「ワンクリック」のモバイル統合や、初期状態での複数画像編集の一貫性はやや劣ります。
  • Seedream 4.0(ByteDance) — 最近、Nano Banana の競合として明確に位置付けられており、超高速レンダリング、2K 出力、多数の参照画像(最大 6 枚)対応を強調しています。プロ向け/クリエイター向けの代替として位置付けられています。

(これらの比較は高レベルなものです。最適な選択はワークフローに合わせて行ってください:オープン性/カスタマイズ性 → Stable Diffusion、スタイライズアート → Midjourney、統合性が高く一貫したモバイル編集と積極的な反復 → Nano Banana Pro / Gemini 3 Pro image ファミリー。)

実際のユースケース

  • モバイル写真編集とクリエイティブフィルター(Google Photos 統合 — スタイル変更、背景融合、ポートレート再構成)。
  • マーケティングおよび広告アセット — 複数のフレーム/角度にわたって一貫したブランドキャラクターを保ちながら、コンセプトを迅速に生成。
  • コンセプトアートとストーリーボード — 複数画像の融合により、パネル間でキャラクターの一貫性を維持しやすくなります。
  • E コマース / 製品モックアップ — 異なる文脈や照明条件で一貫した製品ショットを生成。
  • AR/VR アセットの迅速なプロトタイピング — 高品質な 2K/4K 出力は、没入型用途向けにアップスケール可能です。
  • gemini-3-pro-image(Nano Banana Pro)API へのアクセス方法

必要な手順

  • cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。
  • インターフェースのアクセス認証情報である API キーを取得します。パーソナルセンターの API token で「Add Token」をクリックし、トークンキー sk-xxxxx を取得して送信します。
  • このサイトの URL を取得します: https://api.cometapi.com/

利用方法

  1. API リクエストを送信するには「gemini-3-pro-image」エンドポイントを選択し、リクエストボディを設定します。リクエストメソッドおよびリクエストボディは当社ウェブサイトの API ドキュメントで確認できます。当社ウェブサイトでは利便性のために Apifox テストも提供しています。
  2. <YOUR_API_KEY> を、アカウントで取得した実際の CometAPI キーに置き換えます。
  3. content フィールドに質問またはリクエストを入力します。これがモデルの応答対象になります。
  4. API レスポンスを処理して、生成された回答を取得します。

CometAPI はシームレスな移行のために、完全互換の REST API を提供しています。主要な詳細 :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY ヘッダー
  • Content-Type: application/json .

よくある質問

Can Gemini 3 Pro Image generate 4K resolution images?

はい、Nano Banana Pro(Gemini 3 Pro Image)は、1:1、3:2、16:9、9:16、21:9 などのアスペクト比で、最大 4K 解像度のネイティブ出力に対応しています。また、imageConfig パラメータを通じて 1K および 2K のプリセットにも対応しています。

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro は、画像内テキストの高度なレンダリング機能を備えており、短いキャプションから長文の段落まで、明瞭で読みやすい多言語テキストをサポートします。そのため、ポスター、インフォグラフィック、UI モックアップ、マーケティング素材に最適です。

Can I edit images conversationally with Gemini 3 Pro Image?

はい、Nano Banana Pro はマルチターンの対話型編集に対応しています。たとえば「背景を夕焼けにして」のように変更を依頼するだけで、モデルはターン間で Thought Signatures を通じて視覚的コンテキストを維持します。

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro は、反復的な自己修正、複数回の編集にわたる一貫したキャラクター保持、そして Google エコシステムとの緊密な統合に優れています。複雑なマルチ画像融合ワークフローにおいて、最大 14 枚の参照画像を扱えます。

Does Nano Banana Pro use Google Search for grounded image generation?

はい、Nano Banana Pro は画像生成前に事実を確認するため、Search grounding を利用できます。たとえば、最新の天気データを取得して、正確な東京の天気インフォグラフィックを作成できます。

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro は、1 プロンプトあたり最大 14 枚の入力画像をサポートし、画像 1 枚あたりの最大サイズは 7MB です。複雑なマルチ画像融合シナリオでも、最大 5 人のキャラクターにわたって被写体とキャラクターの一貫性を維持します。

Nano Banana Proの機能

Nano Banana Proのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

Nano Banana Proの料金

Nano Banana Proの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Nano Banana Proがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Nano Banana ProのサンプルコードとAPI

Nano Banana Proの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでNano Banana Proの潜在能力を最大限に活用できるよう支援します。
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Nano Banana Proのバージョン

Nano Banana Proに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
Model id説明Availabilityリクエスト
nano-banana-pro-all使用されている技術は非公式であり、生成は不安定ですなど、Chat 形式✅Chat 形式
gemini-3-pro-image推奨、最新モデルを指しています✅Gemini generates image
gemini-3-pro-image-preview公式プレビュー✅Gemini generates image

その他のモデル