So verwenden Sie die Nano Banana 2 API

Nano Banana 2 — die Kurzbezeichnung, die die Community für Googles neuestes Bildgenerationsmodell aus der Gemini-Familie verwendet — hat die Erwartungen an schnelle, hochfidele Bildgenerierung und -bearbeitung rasch neu definiert. Ende Februar 2026 gestartet, richtet sich diese “Flash Image”-Variante (Gemini 3.1 Flash Image / Nano Banana 2) an Entwickler und Produktteams, die Pro-Level-Ausgaben bei hoher Durchsatzrate und niedriger Latenz benötigen. In diesem Artikel bündele ich die neuesten Berichte und Dokumentationen, um zu erklären, was Nano Banana 2 ist, wie es in Benchmarks abschneidet, wie man darauf zugreift und es aufruft (einschließlich über Drittanbieter-Gateways wie CometAPI), sowie praktische Prompt- und Nutzungsmuster, die Sie in der Produktion übernehmen können.

CometAPI stellt eine einheitliche HTTP-ähnliche Schnittstelle bereit, die viele Modelle (einschließlich Bildmodelle) unter konsistenten Endpunkten verfügbar macht. Das kann den Wechsel zwischen Anbietern oder das Kombinieren von Ausgaben mehrerer Modelle vereinfachen. Nano Banana 2 (Gemini 3.1 Image) ist in CometAPI live.

Was ist Nano Banana 2?

Nano Banana 2 (intern mit Gemini 3.1 Flash Image ausgerichtet) ist ein fokussiertes, hocheffizientes Bildgenerationsmodell von Google, das Geschwindigkeit, niedrigere Kosten pro Bild und stärkeres Befolgen von Anweisungen für kreative und redaktionelle Bildaufgaben priorisiert. Es ist dafür konzipiert, neben höherfideleren “Pro”-Varianten zu bestehen: Nano Banana 2 für hohen Durchsatz und Nano Banana Pro (Gemini 3 Pro Image) für Premium-, Asset-Grade-Ausgaben.

Es soll liefern:

Schnelle Inferenz (mit sehr niedriger Latenz, sodass Bildgenerierung und -bearbeitung nahezu sofort erfolgen).
Hohe visuelle Qualität nahe der “Pro”-Familie, jedoch bei geringerer Rechenleistung/Kosten.
Besseres Befolgen von Anweisungen (präzisere Darstellung der angeforderten Motive, Text im Bild und Szenen mit mehreren Charakteren).
Breite Unterstützung für Auflösung und Seitenverhältnis, von schnellen kleinen Vorschauen bis hin zu nativen 2K/4K-Pipelines für finale Assets.

Worin unterscheidet sich Nano Banana 2 vom ursprünglichen Nano Banana / Pro?

Architektur / Engine: Auf Geminis Flash-Inferenz-Stack (Gemini 3.1 Flash Image) aufgebaut, sodass es einige Maximalqualitäts-Einstellungen gegen drastische Geschwindigkeits- und Kostenvorteile eintauscht.
Anwendungsfälle: Ideal für großskalige Automatisierung (Marketing-Assets, Thumbnails, UIs), nahezu Echtzeit-Bearbeitung und Workflows, bei denen Latenz und Kosten zählen, aber dennoch Pro-Level-Motivtreue benötigt wird.

Benchmark-Leistung von Nano Banana 2

So verwenden Sie die Nano Banana 2 API

Konsistent über Kategorien hinweg

Gemini 3.1 Flash Image zeigt gegenüber Gemini 2.5 Flash in jeder berichteten Kategorie eine messbare Verbesserung.

Größte Zugewinne

Visuelle Qualität
Kompositorische Bearbeitung mit mehreren Eingaben
Allgemeine Bearbeitungsrobustheit

Wettbewerbliche Positionierung

Führt die interne GenAI-Bench-Gesamtpräferenz an.
Übertrifft GPT-Image 1.5 in Gesamt- und visuellen Metriken.
Schmale inkrementelle Verbesserungen deuten auf architektonische Verfeinerung statt eines radikalen Wandels hin.

Wie kann ich auf Nano Banana 2 zugreifen?

Wo es verfügbar ist

Nano Banana 2 ist über Googles Gemini-Tools (Gemini-App), die Gemini API (in den Google AI Developer Docs dokumentiert) zugänglich und wird über Cloud-Enterprise-Produkte wie Vertex AI für Vorschau/Enterprise-Integrationen bereitgestellt. CometAPI hat ebenfalls Unterstützung und Wrapper angekündigt, um die Integration zu erleichtern.

Nutzung der Nano Banana 2 API (cometapi): welche Optionen gibt es?

CometAPI’s guide uses a Gemini-style generateContent shape and returns images as Base64 in candidates[0].content.parts[].inline_data.data. You must decode that Base64 to save a file client-side.，You only need to replace https: //generativelanguage.googleapis.com with https://api.cometapi.com . The returned image is usually provided as Base64-encoded inline_data. You will need to decode it on the client side and save it as a file. CometAPI provides discounts helps you use Use Nano Banana 2 API.

CometAPI stellt einen einheitlichen REST-Wrapper und explizite Endpunkte für Gemini-Modelle bereit — ideal, wenn Sie eine einzige Anmeldeinformation bevorzugen und Anbieter wechseln möchten, ohne Ihren Anwendungscode zu ändern. Für Nano Banana 2 enthält die CometAPI-Seite ein direktes curl-Snippet für ihren gemini-3.1-flash-image-preview:generateContent-Endpunkt. Nachfolgend ein bereinigtes curl-Beispiel basierend auf den CometAPI-Dokumenten.

Voraussetzungen für die Nutzung von Nano Banana 2 über CometAPI

CometAPI-Konto & API-Schlüssel: Erstellen Sie ein Konto bei CometAPI und generieren Sie Ihren API-Zugriffsschlüssel (sk-…). Dieser Schlüssel wird zur Authentifizierung aller API-Anfragen an die CometAPI-Endpunkte verwendet.

Programmiersprachen & Runtimes:

Node.js 18+ (für JavaScript/TypeScript)
Python 3.10+
(Oder jede Sprache, die HTTP-Anfragen ausführen kann)

HTTP-Tools oder SDKs:

Für JavaScript: fetch, axios, oder der OpenAI-kompatible Client
Für Python: requests, httpx, oder der OpenAI-Client
Diese Tools helfen Ihnen, API-Aufrufe zu senden und Antworten zu verarbeiten.

Kurzübersicht über das Anfrage-Muster

Basis-URL: https://api.cometapi.com (CometAPI-Basis).
Modellnamen: gemini-3.1-flash-image-preview (Nano Banana 2 / Gemini 3.1 Flash Image) oder gemini-2.5-flash-image, abhängig von der Verfügbarkeit.
Auth: Authorization: sk-xxxx Header — CometAPI verwendet typischerweise einen Schlüssel im sk--Stil.
Response: Bilder werden als Base64 unter response.candidates[0].content.parts[].inline_data.data zurückgegeben. Dekodieren und auf die Festplatte schreiben.

Beispiel-Workflow (High-Level)

Holen Sie sich einen API-Schlüssel von CometAPI.
Wählen Sie Ihre Modellkennung (z. B. gemini-3.1-flash-image oder ähnlich, abhängig von der Verfügbarkeit).
Senden Sie eine POST-Anfrage an den Generate-Endpunkt des Modells mit Ihrem Prompt.
Verarbeiten Sie die zurückgegebenen Bilddaten in Ihrer App (Base64 dekodieren, als PNG bereitstellen etc.).
Für Bildbearbeitung fügen Sie die bestehenden Bilddaten und Bearbeitungsanweisungen in Ihre Anfrage ein.

Verwendung der offiziellen Gemini API (Text → Bild)

Nachfolgend ein kurzes Node.js-Beispiel, das zeigt, wie der Gemini generateContent Endpunkt für gemini-3.1-flash-image-preview aufgerufen wird (dies spiegelt offizielle Snippets in den Docs wider). Ersetzen Sie YOUR_API_KEY durch Ihre Zugangsdaten und fügen Sie für die Produktion Fehlerbehandlung hinzu.

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

CometAPI provides SDKs and OpenAI-compatible client wrappers, so some teams can switch providers with minimal code changes, let you request Base64-encoded image outputs or hosted URLs depending on your configuration. Always check the official generateContent schema for the exact payload fields.

Bild→Bild (Bearbeitung) Ablauf

Um ein bestehendes Bild zu bearbeiten:

Konvertieren Sie Ihr Quellbild in Base64 (ohne das Präfix data:image/...;base64,).
Senden Sie eine POST-Anfrage mit einem Payload, der inline_data.data mit dieser Base64-Zeichenkette und einen Bearbeitungsprompt enthält (z. B. „Hintergrund in Dämmerungshimmel ändern, Wasserzeichen entfernen“).
Die Antwort enthält eine neue Base64-Ausgabe, die Sie dekodieren und speichern.

curl 
--location 
--request POST 'https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent' \ 
--header 'Authorization: ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "contents": 
[ { "role": "user", "parts": 
[ { "text": "Blend three images to output a high-resolution image" }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_first_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_second_image_base64_data_here>" } }, { "inline_data": { "mime_type": "image/jpeg", "data": "<your_third_image_base64_data_here>" } } 
] } 
], "generationConfig": { "responseModalities": [ "TEXT", "IMAGE" 
] } }'

Typische Parameter zum Abstimmen

model: wählen Sie gemini-3.1-flash-image-preview (Nano Banana 2) oder gemini-3-pro-image-preview (Pro).
imageConfig.aspect_ratio und imageConfig.image_size (512, 1K, 2K, 4K) — beeinflusst Kosten und Latenz.
responseModalities: ["Image"] oder ["Text","Image"] für multimodale Abläufe.

Wie sollte ich Prompts für Nano Banana 2 erstellen?

Prompt-Engineering für Bildmodelle kombiniert Komposition, Stil, Kamera-/Licht-Hinweise und Constraints. Nano Banana 2 ist auf zuverlässige Befolgung von Anweisungen abgestimmt, daher sollten Sie Kürze mit Klarheit austarieren.

Prompt-Struktur (empfohlen)

Primäres Motiv: wer/was im Bild ist.
Aktion oder Zustand: was das Motiv tut.
Umgebung & Stimmung: Setting, Beleuchtung, Atmosphäre.
Technische Vorgaben: Kameraobjektiv, Seitenverhältnis, Auflösung, Komposition.
Stil & Referenzen: Kunststil, Künstlerreferenzen (Urheberrechtsregeln beachten), Epoche.
Constraints: Anzahl der Charaktere/Objekte, bestimmte Farben vermeiden, lesbaren Text einfügen.

Beispiel-Prompt:

“Ein fotorealistisches Bild einer kleinen gelben Banane, geformt wie eine Vintage-Rakete, die auf einem glänzenden Mahagonitisch in einem sonnenbeschienenen Studio ruht. 50mm-Objektiv, geringe Tiefenschärfe, warmes Golden-Hour-Licht, hohe Detailgenauigkeit, keine sichtbaren Logos, 2048×1152.”

Tipps für Bearbeitungs-Prompts (Inpainting / Replace)

Geben Sie die Maske klar an und spezifizieren Sie, welche Bereiche geändert werden sollen.
Verwenden Sie „preserve“-Formulierungen für Bereiche, die unverändert bleiben sollen (z. B. „die Gesichtszüge des Motivs erhalten, nur den Hintergrund ersetzen“).
Für Text im Bild geben Sie den exakten Text an und nennen Sie Schrift/Style (z. B. „lesbare Sans-Serif, zentriert“). Nano Banana 2 betont eine bessere Textdarstellung, dennoch sollten Sie explizit sein.

Checkliste zur Prompt-Fehleranalyse

Wenn das Ergebnis abweicht, vereinfachen: reduzieren Sie zunächst die kreativen Stilvorgaben und führen Sie Details anschließend wieder ein.
Wenn Text unleserlich ist: spezifizieren Sie Schrift, Größe und Kontrast im Prompt und erhöhen Sie die Auflösung.
Wenn die Komposition nicht stimmt: verwenden Sie Kamera-Winkel und Objektiv-Spezifizierer.

Häufige Fallstricke und wie man sie vermeidet

Fallstrick: Übermäßige Abhängigkeit von One-Shot-Prompts

Erwarten Sie nicht, dass ein einzelner Prompt Trimmen, Layout und mehrstufige Bearbeitungen erledigt. Zerlegen Sie die Arbeit in: Basis generieren → bearbeiten/ersetzen → finaler Feinschliff. Verwenden Sie Seed und Masken für Präzision.

Fallstrick: Vernachlässigung von Provenienz- und Urheberrechtsprüfungen

Skalieren Sie nicht ohne SynthID/C2PA oder andere Provenienzmechanismen. Viele Unternehmen verlangen Nachverfolgbarkeit für KI-Ursprungsinhalte.

Fallstrick: Budgetüberraschungen

Verfolgen Sie die Nutzung auf Modell- und Endpunkt-Ebene und setzen Sie harte Nutzungslimits über den Anbieter oder einen Proxy. Flash-Tiers sind günstiger, können aber dennoch teuer werden, wenn Sie unbeabsichtigt Tausende 4K-Bilder rendern.

Empfohlene Best Practices mit Nano Banana 2?

Die Produktionsreife von Bildgenerierung erfordert Aufmerksamkeit für Kosten, Latenz, Qualitätskontrolle, Provenienz und Sicherheit. Nachfolgend praxisnahe Best Practices, destilliert aus Felderfahrungen, Google-Dokumenten und Community-Tests.

Prompt-Engineering & deterministische Ausgaben

Templatisieren Sie Ihre Prompts: Für reproduzierbare Ausgaben (z. B. Produktaufnahmen) verwenden Sie strukturierte Prompts mit festen Segmenten (Motiv, Kamera, Beleuchtung, Textur, Post-Processing). Das reduziert die Drift zwischen Calls.
Verwenden Sie Referenzbilder und Masken-Anweisungen für Bearbeitungen statt komplexe, lokalisierte Änderungen rein über Text zu versuchen — das reduziert semantische Fehler und Artefakte.

Kosten- & Performance-Tuning

Wählen Sie den Flash/„Nano Banana 2“-Modus für hohes Volumen: Wenn Sie viele schnelle Iterationen benötigen, nutzen Sie Flash-Tier-Modelle und kleinere Größen (2K vs 4K), um Kosten und Latenz zu senken.
Batchen Sie Anfragen, wo möglich: Manche Anbieter erlauben Multi-Prompt-Batching — das reduziert die Gesamtlatenz pro generiertem Asset in Hochdurchsatz-Pipelines. (Prüfen Sie die Anbieter-Dokumentation.)

Sicherheit, Provenienz und Rechtliches

Aktivieren Sie SynthID und C2PA-Metadaten auf generierten Assets, um nachgelagerte Audits und Compliance zu unterstützen (insbesondere bei Bildern in Werbung/PR). Google und Partner betonen SynthID als Provenienzmechanismus.
Human-in-the-Loop-Review für sensible Inhalte: Automatisierte Policy-Ebenen sind stark, aber nicht perfekt — nutzen Sie manuelle Prüfungen für öffentlichkeitswirksame Kampagnen oder Inhalte mit öffentlichen Personen.

Qualitätssicherung

Automatisieren Sie QA-Checks: Führen Sie einen schnellen Post-Generation-Klassifizierer aus, um unerwartete Artefakte zu erkennen (Text-Fehlrenderings, geringe Gesichts-Treue, versehentliche Logo-Erzeugung). Halten Sie ein Scoringsystem vor und nutzen Sie ein Fail-safe-Fallback zu Pro-Tier-Renderings, wenn der Auto-Check fehlschlägt.
Speichern Sie Prompts und Seeds: Für Auditierbarkeit und Reproduzierbarkeit sichern Sie den genauen Prompt, Zeitstempel, Modellversion sowie jeden Seed oder deterministischen Parameter.

Latenz-sensitive UX

Progressive UX: Liefern Sie zunächst ein niedrigauflösendes/schnelles Draft und ersetzen Sie es durch ein hochauflösendes/Pro-Rendering, sobald verfügbar. Das hält Ihre App responsiv (viele Anbieter bieten einen „Draft“- oder Flash-Flavor).

Abschließende Hinweise & nächste Schritte

Nano Banana 2 ist darauf ausgelegt, die Ökonomie bildzentrierter Produktions-Workflows zu verändern: geringere Latenz und geringere Kosten pro Call eröffnen Anwendungsfälle wie On-Demand-Ad-Asset-Generierung, schnelles A/B-Testing von Kreativen und Echtzeit-kollaborative Design-Tools. Das Modell ist bereits in Googles Consumer- und Cloud-Oberflächen integriert; für Entwickler, die schnell live gehen möchten, bietet CometAPI einen praktischen Marketplace-Wrapper, der Gemini-Bild-Endpunkte plus andere Modelle unterstützt — eine sinnvolle Wahl, wenn Sie mit mehreren Engines experimentieren möchten, ohne den App-Code zu ändern.
Entwickler können Nano Banana 2 über CometAPI jetzt nutzen. Um zu beginnen, erkunden Sie die Fähigkeiten des Modells im Playground und konsultieren Sie den API-Guide für detaillierte Anweisungen. Bitte stellen Sie vor dem Zugriff sicher, dass Sie sich bei CometAPI angemeldet und den API-Schlüssel erhalten haben. CometAPI bietet einen weit niedrigeren Preis als den offiziellen, um Ihnen die Integration zu erleichtern.

Bereit?→ Melden Sie sich noch heute für Nano Banana 2 an !

Wenn Sie mehr Tipps, Anleitungen und News zu KI erfahren möchten, folgen Sie uns auf VK, X und Discord!