ModellePreiseUnternehmen
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Unternehmen
Über unsUnternehmen
Ressourcen
KI-ModelleBlogÄnderungsprotokollSupport
NutzungsbedingungenDatenschutzrichtlinie
© 2026 CometAPI · All rights reserved
Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Eingabe:$1.5616/M
Ausgabe:$9.3696/M
Nano Banana Pro ist ein KI-Modell für allgemeine Unterstützung in textzentrierten Workflows. Es eignet sich für anweisungsbasiertes Prompting, um Inhalte mit kontrollierbarer Struktur zu erzeugen, zu transformieren und zu analysieren. Typische Anwendungsfälle umfassen Chat-Assistenten, Dokumentenzusammenfassungen, wissensbasiertes Question Answering (QA) und Workflow-Automatisierung. Öffentlich verfügbare technische Details sind begrenzt; die Integration orientiert sich an gängigen Mustern von KI-Assistenten wie strukturierten Ausgaben, retrieval-augmentierten Prompts sowie Tool- oder Funktionsaufrufen.
Neu
Kommerzielle Nutzung
Playground
Überblick
Funktionen
Preisgestaltung
API
Versionen

Grundfunktionen

  • Text → Bild: vollständige promptgesteuerte Generierung mit starker Prompt-Treue.
  • Bild → Bild (Bearbeitungen): feine, gezielte Bearbeitungen bei gleichbleibender Motiv-/Charakterkonsistenz über mehrere Bearbeitungsschritte hinweg.
  • Maximale Ausgabauflösung: bis zu 4K (Beispiele und unterstützte exakte Pixelgrößen hängen vom Seitenverhältnis ab; die API bietet 1K-/2K-/4K-Presets)
  • Iterative Planung & Selbstkorrektur: eine interne „mehrstufige“ Pipeline, die häufige visuelle Fehler (Perspektive, Text, feine Geometrie) erkennt und korrigiert.
  • Erweiterte Textdarstellung im Bild: klarer, gut lesbarer mehrsprachiger Text (von kurzen Bildunterschriften bis zu langen Absätzen), geeignet für Poster, Mockups und Infografiken.
  • 5 Charaktere und hohe Treue für bis zu 14 Objekte/Referenzbilder in einem einzelnen Workflow.
  • Wasserzeichen / Herkunftsnachweis: Alle generierten Bilder enthalten ein SynthID-Wasserzeichen; das Modell bettet in einigen Produktintegrationen C2PA-Metadaten für die Herkunft ein.

Versionen & Benennung von Gemini 3 Pro Image

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Technische Details

Architektur

  • Abstammung / Backbone: Nano Banana Pro basiert auf Googles sich weiterentwickelndem Gemini-Bild-Stack — insbesondere auf der neuen Architektur Gemini 3 Pro Image / GEMPIX 2 (ein multimodales Bild+Text-Framework mit höherer Kapazität). Dies ist eine Weiterentwicklung von Gemini 2.5 Flash Image (dem ursprünglichen „nano-banana“) hin zu einem nativ multimodalen Bildmodell mit erweiterten Vision-Language-Reasoning-Fähigkeiten.
  • Modellverhalten: native Multimodalität (Bild + Text + Weltwissen), explizite Pipelines für Multi-Bild-Fusion und ein interner stufenweiser Planer, der Ausgaben über mehrere Durchläufe verfeinert, anstatt ein einzelnes statisches Sample zu erzeugen. Frühe Berichte deuten auf stärkeres geometrisches/optisches Reasoning (Glas, Brechung) im Vergleich zu früheren Versionen hin.
  • Thinking / interne Verfeinerung: Das Modell verwendet intern einen sichtbaren „Thinking“-Prozess, um die Komposition zu verfeinern (die API dokumentiert dieses Verhalten und weist darauf hin, dass diese internen Schritte nicht als endgültige Bild-Token berechnet werden).
  • Grounding & Tools: Unterstützt Search Grounding (kann Web-Fakten in die Diagramm-/Infografik-Generierung einbeziehen). Es unterstützt außerdem Systemanweisungen für eine deterministischere Steuerung.

Wichtige API-Parameter:

  • thinking_level (low / high), um Latenz gegen Reasoning-Tiefe abzuwägen;
  • media_resolution (low/medium/high), um Bild-OCR-/Detail-Lese-Token zu steuern;
  • generationConfig.imageConfig, um Seitenverhältnis/Auflösung in Bildausgaben zu steuern.

Bildlimits:

  • Unterstützte Eingabemodalitäten: Text und Bilder (das Modell akzeptiert weder Audio noch Video als Eingaben für die Bildgenerierung).
  • Max. Bilder pro Prompt: 14 (für die Gemini 3 Pro Image Preview).
  • Max. Bildgröße (Upload): 7 MB pro Eingabebild.
  • Unterstützte Seitenverhältnisse: 1:1, 3:2, 16:9, 9:16, 21:9 usw.

Ausgabebilder / Tokens: hohe Limits, mit Unterstützung für 4K/4096 px.

Benchmark-Leistung

Kurze Zusammenfassung: Öffentliche/frühe Benchmarks sind bislang überwiegend qualitativ bzw. communitygetrieben, berichten aber durchweg von deutlichen Verbesserungen bei Auflösung, Artefaktreduktion und physikalischer Treue gegenüber dem ursprünglichen nano-banana (Gemini 2.5 Flash Image). Spezifische benannte „Challenges“ haben klare visuelle Zugewinne gezeigt, aber es gibt bislang noch keine (öffentlichen) standardisierten numerischen Benchmark-Tabellen von Google, die v1 → v2 anhand standardisierter Bildgenerierungsmetriken vergleichen.

  • Qualitative Community-Tests: sauberere Kanten, schärfere Mikrodetails, realistischere Farben und treuere Prompt-Befolgung (weniger halluzinierte Requisiten, konsistentere Charaktere). Beliebte informelle Tests umfassen den sogenannten „Wine Glass Test“ und die „Glass Burger Challenge“, bei denen GEMPIX2 (Nano Banana Pro) Transparenz und Brechung deutlich besser verarbeitet als frühere Builds.
  • Textverarbeitung: Nano Banana Pro zeigt sichtbar verbesserte Typografie und Textplatzierung innerhalb von Bildern (eine anhaltende Schwäche vieler Bildmodelle). Community-Vergleiche deuten auf weniger verstümmelte gerenderte Glyphen hin.
  • Durchsatz / UX: schnellere Iterationsgeschwindigkeit und eine UX, die im Hintergrund mehrstufige Verfeinerung durchführt, sodass Benutzer zuverlässigere Ergebnisse beim ersten Durchlauf sehen (wodurch manuelle Re-Rolls reduziert werden).

Einschränkungen & Risiken

  • Inhaltsfilter & Erkennung: Plattformen, die das Modell integrieren (z. B. Whisk/Apps von Drittanbietern), können strenge Prominenten- oder Ähnlichkeitserkennung aktivieren und bestimmte Ausgaben blockieren, was kreative Workflows beeinträchtigt, die auf realistischen Prominentenähnlichkeiten basieren.
  • Halluzination / Reasoning-Grenzfälle: Obwohl verbessert, kann das Modell weiterhin physikalisch unrealistische Artefakte erzeugen, insbesondere bei dichtem symbolischem Text innerhalb von Bildern oder hochgradig technischen Diagrammen — obwohl NB2 diese Fehler im Vergleich zu früheren Versionen offenbar reduziert.
  • Sicherheit & Missbrauch: Generative Bildmodelle können zur Erstellung problematischer oder schädlicher Inhalte verwendet werden. Google setzt Einschränkungen, Inhaltsfilter und das SynthID-Wasserzeichen ein, um beim Herkunftsnachweis zu helfen; dennoch ist es zu Missbrauch gekommen (eine öffentlichkeitswirksame Kontroverse im Zusammenhang mit einem von Nano Banana generierten Bild in einem politisch sensiblen Kontext).

Wie sich Nano Banana Pro im Vergleich zu anderen Modellen einordnet

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — starke mobile Integration, Multi-Bild-Fusion, iterative Selbstkorrektur, natives 2K/4K-Upscaling, eng in Google-Apps (Search, Photos, Workspace/Gemini) integriert. Am besten für Workflows geeignet, die zuverlässige Bearbeitungen, Kontinuität und Integration mit Google-Diensten benötigen.
  • Midjourney — hervorragend für stilisierte künstlerische Ausgaben und communitygetriebenes Prompt Engineering; in der Regel nicht auf fotorealistische Multi-Bild-Fusion oder tiefe multimodale Bearbeitungspipelines ausgerichtet.
  • Stable Diffusion / Open Weights — vollständig offen, hochgradig anpassbar und lokal hostbar; das Ökosystem aus Checkpoints und Fine-Tuning ist ein klarer Vorteil für Forschung und Offline-Nutzung. Weniger „One-Click“-Mobile-Integration und weniger konsistente Kohärenz bei der Multi-Bild-Bearbeitung out-of-the-box als Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — kürzlich explizit als Konkurrent zu Nano Banana positioniert, mit Fokus auf ultraschnelles Rendering, 2K-Ausgabe und Unterstützung für viele Referenzbilder (bis zu sechs). Positioniert als professionelle Creator-Alternative.

(Diese Vergleiche sind allgemein gehalten; wählen Sie den besten Kandidaten, indem Sie das Tool auf Ihren Workflow abstimmen: Offenheit/Anpassbarkeit → Stable Diffusion; stilisierte Kunst → Midjourney; integrierte, konsistente mobile Bearbeitung mit aggressiver Iteration → Nano Banana Pro / Gemini 3 Pro Image-Familie.)

Praxisnahe Anwendungsfälle

  • Mobile Fotobearbeitung & kreative Filter (Google-Photos-Integrationen — Restyling, Hintergrundfusion, Neukomposition von Porträts).
  • Marketing- & Werbemittel — schnelle Konzeptgenerierung, konsistente Markencharaktere über mehrere Frames/Winkel hinweg.
  • Concept Art & Storyboarding — Multi-Bild-Fusion hilft, die Charakterkontinuität über Panels hinweg zu bewahren.
  • E-Commerce / Produkt-Mockups — konsistente Produktaufnahmen in unterschiedlichen Kontexten/Lichtbedingungen generieren.
  • Schnelles Prototyping für AR/VR-Assets — hochwertige 2K-/4K-Ausgaben, die für immersive Anwendungen hochskaliert werden können.
  • So greifen Sie auf die API von gemini-3-pro-image(Nano Banana Pro) zu

Erforderliche Schritte

  • Melden Sie sich bei cometapi.com an. Wenn Sie noch kein Nutzer sind, registrieren Sie sich bitte zuerst.
  • Holen Sie sich die Zugangsdaten in Form des API-Schlüssels für die Schnittstelle. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, holen Sie sich den Token-Schlüssel: sk-xxxxx und übermitteln Sie ihn.
  • Rufen Sie die URL dieser Website ab: https://api.cometapi.com/

Verwendungsmethode

  1. Wählen Sie den Endpunkt „gemini-3-pro-image“, um die API-Anfrage zu senden, und legen Sie den Request-Body fest. Die Request-Methode und der Request-Body sind in unserer API-Dokumentation auf der Website zu finden. Unsere Website bietet zu Ihrer Bequemlichkeit auch Apifox-Tests.
  2. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto.
  3. Fügen Sie Ihre Frage oder Anfrage in das Feld content ein — darauf wird das Modell antworten.
  4. Verarbeiten Sie die API-Antwort, um die generierte Antwort zu erhalten.

CometAPI bietet eine vollständig kompatible REST-API — für eine nahtlose Migration. Wichtige Details:

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Modellnamen: gemini-3-pro-image
  • Authentifizierung: Header Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json

FAQ

Kann Gemini 3 Pro Image Bilder in 4K-Auflösung generieren?

Ja, Nano Banana Pro (Gemini 3 Pro Image) unterstützt native Ausgabe mit bis zu 4K-Auflösung bei Seitenverhältnissen wie 1:1, 3:2, 16:9, 9:16 und 21:9. Außerdem werden 1K- und 2K-Voreinstellungen über den Parameter imageConfig unterstützt.

Wie geht Nano Banana Pro mit der Textdarstellung innerhalb von Bildern um?

Nano Banana Pro bietet fortschrittliche In-Image-Textdarstellung mit klarer, gut lesbarer mehrsprachiger Textunterstützung – von kurzen Bildunterschriften bis hin zu langen Absätzen. Dadurch eignet es sich ideal für Poster, Infografiken, UI-Mockups und Marketingmaterialien.

Kann ich Bilder mit Gemini 3 Pro Image dialogbasiert bearbeiten?

Ja, Nano Banana Pro unterstützt mehrstufige dialogbasierte Bearbeitung. Bitten Sie einfach um Änderungen wie „Machen Sie den Hintergrund zu einem Sonnenuntergang“, und das Modell behält den visuellen Kontext zwischen den Durchgängen mithilfe von Thought Signatures bei.

Wodurch unterscheidet sich Nano Banana Pro von FLUX 2 Pro oder Midjourney?

Nano Banana Pro zeichnet sich durch iterative Selbstkorrektur, konsistente Beibehaltung von Charakteren über mehrere Bearbeitungen hinweg und die enge Integration in das Google-Ökosystem aus. Es verarbeitet bis zu 14 Referenzbilder für komplexe Multi-Image-Fusion-Workflows.

Verwendet Nano Banana Pro Google Search für fundierte Bildgenerierung?

Ja, Nano Banana Pro kann Search Grounding verwenden, um Fakten vor der Bildgenerierung zu überprüfen. So kann es beispielsweise aktuelle Wetterdaten abrufen, um eine präzise Wetterinfografik für Tokio zu erstellen.

Wie viele Referenzbilder kann Nano Banana Pro in einer Anfrage verarbeiten?

Nano Banana Pro unterstützt bis zu 14 Eingabebilder pro Prompt mit maximal 7 MB pro Bild. Es bewahrt Motiv- und Charakterkonsistenz über bis zu 5 Charaktere hinweg in komplexen Multi-Image-Fusion-Szenarien.

Preise für Nano Banana Pro

Entdecken Sie wettbewerbsfähige Preise für Nano Banana Pro, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Nano Banana Pro Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Beispielcode und API für Nano Banana Pro

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für Nano Banana Pro zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von Nano Banana Pro in Ihren Projekten zu nutzen.
POST
/v1beta/models/{model}:generateContent
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Python Code Example

from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

JavaScript Code Example

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
import * as path from "node:path";
import { fileURLToPath } from "node:url";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com";

const __filename = fileURLToPath(import.meta.url);
const __dirname = path.dirname(__filename);

async function main() {
  const ai = new GoogleGenAI({
    apiKey: COMETAPI_KEY,
    httpOptions: { baseUrl: BASE_URL },
  });

  const prompt =
    "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English.";
  const aspectRatio = "1:1"; // "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
  const resolution = "4K"; // "1K", "2K", "4K"

  const response = await ai.models.generateContent({
    model: "gemini-3-pro-image-preview",
    contents: prompt,
    config: {
      responseModalities: ["TEXT", "IMAGE"],
      imageConfig: {
        aspectRatio: aspectRatio,
        imageSize: resolution,
      },
    },
  });

  // Output directory
  const outputDir = path.join(__dirname, "..", "output");
  if (!fs.existsSync(outputDir)) {
    fs.mkdirSync(outputDir, { recursive: true });
  }

  for (const part of response.candidates[0].content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const outputPath = path.join(outputDir, "butterfly_4k.png");
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync(outputPath, buffer);
      console.log(`Image saved to: ${outputPath}`);
    }
  }
}

main();

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here

# Output directory
SCRIPT_DIR="$(cd "$(dirname "$0")" && pwd)"
OUTPUT_DIR="$SCRIPT_DIR/../output"
mkdir -p "$OUTPUT_DIR"

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."}]}],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {"aspectRatio": "1:1", "imageSize": "4K"}
    }
  }' | jq -r '.candidates[0].content.parts[] | select(.inlineData) | .inlineData.data' | head -1 | base64 --decode > "$OUTPUT_DIR/butterfly_4k.png"

echo "Image saved to: $OUTPUT_DIR/butterfly_4k.png"

Versionen von Nano Banana Pro

Der Grund, warum Nano Banana Pro mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.
Modell-IDBeschreibungVerfügbarkeitAnfrage
nano-banana-pro-allDie verwendete Technologie ist inoffiziell und die Generierung ist instabil usw., Chat Format✅Chat Format
gemini-3-pro-imageEmpfohlen, verweist auf das neueste Modell✅Gemini generiert Bilder
gemini-3-pro-image-previewOffizielle Vorschau✅Gemini generiert Bilder