What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 ist Googles neuestes KI-Modell für Bildgenerierung und -bearbeitung, basierend auf der Gemini Flash Image-Technologie, um schnelle, hochwertige visuelle Generierung und präzise Befolgung von Anweisungen bei Text- und Bildeingaben zu ermöglichen.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 ist im Wesentlichen die verbraucherorientierte Markenbezeichnung für Googles Gemini 3.1 Flash Image-Modell und kombiniert fortgeschrittene Funktionen aus früheren Nano Banana-Versionen mit der Geschwindigkeit der Flash-Modelle.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 bietet schnellere Generierung, schärfere Details, bessere Befolgung von Anweisungen, verbessertes Text-Rendering und lokalisierte Übersetzungen sowie umfassendere kreative Kontrolle und stellt zugleich viele Profi-Funktionen bereits auf Basisebene zur Verfügung.

What kinds of images and resolutions can Nano Banana 2 generate?

Das Modell unterstützt flexible Ausgaben mit verschiedenen Seitenverhältnissen und Auflösungen bis 4K und eignet sich für Social Media, Anzeigen, Displays und professionelle Inhalte.

Can Nano Banana 2 maintain consistency in complex compositions?

Ja — es wahrt Konsistenz über mehrere Motive und Objekte hinweg (z. B. bis zu fünf Figuren und 14 Objekte in einem Prompt-Workflow) und hilft bei narrativen Szenen sowie Aufgaben im Storyboard-Stil.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

Es eignet sich gut für die Erstellung und Bearbeitung von Bildern in Profiqualität, Infografiken, Konsistenz über mehrere Bilder hinweg, Text-Rendering und lokalisierte mehrsprachige Ausgaben — insbesondere wenn Workflows präzise Steuerung und wiederholte Iterationen erfordern.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 integriert Wissen über die reale Welt und die Integration der Bildsuche, um präzisere Motive, Infografiken und ortsbezogene Darstellungen zu erzeugen.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Ja — es kann klaren Text innerhalb von Bildern erzeugen und rendern, jedoch bleibt extrem kleiner oder sehr dichter, mehrabsätziger Text bisweilen eine Herausforderung.

Erschwingliche Nano Banana 2 API | text-to-image

Technische Spezifikationen von Gemini 3.1 Flash Image Preview

Element	Gemini 3.1 Flash Image Preview
Anbieter	Google
Modellfamilie	Gemini 3.1 (Flash-Stufe)
Hauptfokus	Schnelle multimodale Generierung mit Bildvorschau
Eingabetypen	Text, Bild
Ausgabetypen	Text, Bild (Vorschaugenerierung)
Kontextfenster	Bis zu 1M Tokens (Standard der Gemini 3.x Flash-Stufe)
Latenzstufe	Niedrige Latenz, hoher Durchsatz
Streaming-Unterstützung	Ja
Tool-Aufrufe	Ja (Gemini API tools framework)
Version	3.1

Was ist Nano Banana 2

Nano Banana 2 ist der geläufige Spitzname, den Presse und Entwickler-Community für das neu veröffentlichte Modell Gemini-3.1-Flash-Image verwenden. Google positioniert es als Image-Engine der „Flash“-Stufe, die nahezu professionelle visuelle Qualität bei deutlich geringerer Latenz und geringeren Kosten bietet — geeignet für großvolumige Generierung, schnelle iterative Bearbeitung und integrierte Produkt-Workflows in Google-Diensten. Es erbt das multimodale Reasoning von Gemini 3.1 und fügt bildzentrierte Fähigkeiten hinzu (lesbarer Text in Bildern, Zusammensetzung mehrerer Bilder, Unterstützung breiter Seitenverhältnisse, native 4K).

Hauptfunktionen

Hochgeschwindigkeits-Generierung in mehreren Auflösungen: Flash-Stufen-Tempo mit Optionen für 0.5K / 1K / 2K / 4K-Ausgaben und neuen extremen Seitenverhältnissen (1:4, 4:1, 1:8, 8:1).
Echtzeit-Web-Grounding: Integriert sowohl Text- als auch Bildsuchergebnisse, um generierte Inhalte in aktuellen Webinformationen zu verankern, wenn „Thinking“ oder Such-Grounding aktiviert ist. Nützlich für aktuelle Referenzen und faktenbasierte Infografiken.
Verbesserte Textdarstellung: Bessere Darstellung von Kurztext und grafischem Text (Schriften, Größen) als bei früheren Flash-Modellen; bei langen Absätzen/kleinem Text weiterhin nicht perfekt.
Multi-Input-Bearbeitung und Multi-Turn-Workflows: Starke Unterstützung für die Kombination mehrerer Bilder als Eingaben und für iterative Bearbeitungen über mehrere Runden.

📊 Benchmark-Leistung — Bildgenerierung & -bearbeitung (Elo-Scores)

Fähigkeit	Gemini 3.1 Flash Image (Nano Banana 2)	Gemini 2.5 Flash Image (Nano Banana)	Gemini 3 Pro Image (Nano Banana Pro)	GPT-Image 1.5	Seedream 5.0 Lite	Grok Imagine Image Pro
Text-zu-Bild — Gesamtpräferenz	1079.0 ± 7.0	1073.0 ± 5.0	942.0 ± 6.0	1021.0 ± 5.0	1047.0 ± 5.0	928.0 ± 8.0
Text-zu-Bild — Visuelle Qualität	1140.0 ± 6.0	1129.0 ± 6.0	929.0 ± 6.0	1043.0 ± 5.0	975.0 ± 5.0	759.0 ± 10.0
Text-zu-Bild — Infografiken (Faktentreue)	1114.0 ± 14.0	1074.0 ± 12.0	881.0 ± 13.0	1102.0 ± 13.0	985.0 ± 12.0	890.0 ± 22.0
Bearbeitung — Allgemein	1065.0 ± 9.0	1047.0 ± 9.0	913.0 ± 9.0	1051.0 ± 10.0	995.0 ± 8.0	937.0 ± 9.0
Bearbeitung — Figuren	1056.0 ± 7.0	1049.0 ± 7.0	952.0 ± 7.0	1050.0 ± 8.0	1025.0 ± 7.0	894.0 ± 8.0
Bearbeitung — Kreativ	1023.0 ± 7.0	1031.0 ± 7.0	976.0 ± 7.0	1004.0 ± 7.0	1017.0 ± 7.0	938.0 ± 7.0
Bearbeitung — Objekt/Umgebung	1029.0 ± 8.0	1018.0 ± 8.0	945.0 ± 8.0	1042.0 ± 10.0	976.0 ± 8.0	946.0 ± 9.0
Bearbeitung — Multi-Input	1037.0 ± 8.0	1016.0 ± 8.0	919.0 ± 9.0	1056.0 ± 12.0	1014.0 ± 9.0	N/A
Bearbeitung — Stilisierung	1045.0 ± 7.0	1031.0 ± 7.0	862.0 ± 8.0	1045.0 ± 9.0	996.0 ± 7.0	984.0 ± 7.0

Wichtigste Erkenntnisse aus dieser Benchmark-Tabelle:

Über die Kategorien der Text-zu-Bild-Generierung und Bildbearbeitung hinweg führt Gemini 3.1 Flash Image konsistent oder erreicht die höchsten Werte unter Modellen der Flash-Stufe und vielen Wettbewerbern.
Das Modell zeigt besonders starke Ergebnisse in den Benchmarks zur visuellen Qualität und zu Infografiken (Faktentreue) — was darauf hindeutet, dass es nicht nur ästhetisch, sondern auch bei der strukturell korrekten Darstellung überzeugt.
Bei der Multi-Input-Bearbeitung zeigt Nano Banana 2 ebenfalls robuste Generalisierung, mit höheren Scores als die vorherige Flash-Generation.

Diese Bewertungen erfolgen über menschliche Side-by-Side-Elo-Vergleiche auf einer vielfältigen Benchmark-Suite und spiegeln sowohl Präferenz als auch Treue in gängigen Aufgaben der Bildgenerierung/-bearbeitung wider.

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

Modell	Positionierung	Repräsentative Benchmarks/Hinweise
Gemini 3.1 Flash Image (Nano Banana 2)	Flash-Stufe: Geschwindigkeit + hohe visuelle Qualität (2K–4K)	Gesamtpräferenz 1079.0 ± 7.0; visuelle Qualität 1140 ± 6.0 (interner GenAI-Bench).
Gemini 2.5 Flash Image (Nano Banana)	Frühere Flash-Version (geringere Treue)	Etwas niedrigere Präferenz-/Visuell-Scores gegenüber 3.1.
Gemini 3 Pro Image (Nano Banana Pro)	Pro-Stufe: höhere wahrgenommene Treue bei komplexen Aufgaben, höhere Kosten/Latenz	Andere Abwägungen; einige Metriken zeigen in Spezialaufgaben abweichende relative Platzierungen.
GPT-Image 1.5 / andere kommerzielle Modelle	Wettbewerber (Open/Closed)	In Googles internen Benchmarks lagen GPT-Image und andere bei visueller Qualität und Gesamtpräferenz unter Gemini 3.1 in der berichteten Evaluierung. Unabhängige Drittvergleiche variieren.

Wann Flash Image Preview wählen:

Echtzeit-Bildvorschau in Apps
Kostensensitive, großskalige Bildgenerierung
Interaktive Design-Assistenten

Zugriff und Integration von Nano Banana 2

Schritt 1: Für API-Schlüssel registrieren

Melden Sie sich bei cometapi.com an. Falls Sie noch kein Benutzer sind, registrieren Sie sich bitte zuerst. Melden Sie sich in Ihrer CometAPI-Konsole an. Rufen Sie die Zugriffsberechtigung (API-Schlüssel) der Schnittstelle ab. Klicken Sie im persönlichen Bereich beim API-Token auf „Add Token“, erhalten Sie den Token-Schlüssel: sk-xxxxx und senden Sie ihn.

Schritt 2: An die `Nano Banana 2`-API Anfragen senden

Wählen Sie den Endpoint “gemini-3.1-flash-image-preview8”, um die API-Anfrage zu senden und den Request-Body festzulegen. Methode und Request-Body entnehmen Sie bitte der API-Dokumentation auf unserer Website. Unsere Website bietet auch einen Apifox-Test zu Ihrer Bequemlichkeit. Ersetzen Sie <YOUR_API_KEY> durch Ihren tatsächlichen CometAPI-Schlüssel aus Ihrem Konto. Wo aufrufen: Gemini erzeugt Bilder

Nano Banana 2 unterstützt Bildbearbeitung, Bildgenerierung und Multi-Image-Workflows. Für die Bildbearbeitung müssen Sie die Bild-URL hochladen. Weitere Parameter entnehmen Sie bitte der Dokumentation.

Schritt 3: Ergebnisse abrufen und verifizieren

Verarbeiten Sie die API-Antwort, um die generierte Ausgabe zu erhalten. Nach der Verarbeitung antwortet die API mit dem Aufgabenstatus und den Ausgabedaten. Im Playground können Sie das Bild direkt auf Ihren lokalen Rechner herunterladen (in der Regel im PNG-Format). Im API-Prozess wird eine Bild-URL erzeugt; bitte zeitnah herunterladen.

Preise für Nano Banana 2

Entdecken Sie wettbewerbsfähige Preise für Nano Banana 2, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Nano Banana 2 Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.

nano-banana-2（image）

variant / alias	Price
gemini-3.1-flash-image (0.5K)	≈ $0.03600
gemini-3.1-flash-image (1K)	≈ $0.05360
gemini-3.1-flash-image (2K)	≈ $0.08080
gemini-3.1-flash-image (4K)	≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)	≈ $0.03600
gemini-3.1-flash-image-preview (1K)	≈ $0.05360
gemini-3.1-flash-image-preview (2K)	≈ $0.08080
gemini-3.1-flash-image-preview (4K)	≈ $0.12080

Beispielcode und API für Nano Banana 2

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für Nano Banana 2 zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von Nano Banana 2 in Ihren Projekten zu nutzen.

Python
JavaScript
Curl

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Versionen von Nano Banana 2

Der Grund, warum Nano Banana 2 mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.

Modell-ID	Beschreibung	Verfügbarkeit	Anfrage
gemini-3.1-flash-image	Empfohlen, verweist auf das neueste Modell	✅	Gemini generiert ein Bild
gemini-3.1-flash-image-preview	Offizielle Vorschau	✅	Gemini generiert ein Bild