/
ModeleWsparciePrzedsiębiorstwoBlog
Ponad 500 API modeli AI, wszystko w jednym API. Tylko w CometAPI
API modeli
Deweloper
Szybki startDokumentacjaPanel API
Zasoby
Modele Sztucznej InteligencjiBlogPrzedsiębiorstwoDziennik zmianO nas
2025 CometAPI. Wszelkie prawa zastrzeżone.Polityka PrywatnościWarunki korzystania z usługi
Home/Models/Google/Nano Banana
G

Nano Banana

Na żądanie:$0.0312
Gemini 2.5 Flash Image (auch bekannt als nano-banana) ist Googles fortschrittlichstes Modell zur Bildgenerierung und -bearbeitung. Dieses Update ermöglicht es Ihnen, mehrere Bilder zu einem einzigen Bild zu verschmelzen, die Konsistenz von Figuren beizubehalten, um reichhaltige Geschichten zu erzählen, mithilfe natürlicher Sprache gezielte Transformationen vorzunehmen und das Weltwissen von Gemini zu nutzen, um Bilder zu generieren und zu bearbeiten.
Użycie komercyjne
Playground
Przegląd
Funkcje
Cennik
API
Wersje

Wichtige Funktionen

  • Native Bildgenerierung und -bearbeitung — Bilder generieren oder vorhandene Fotos über Prompts in natürlicher Sprache bearbeiten. (Generieren / Bearbeiten).
  • Multi-Image-Fusion — mehrere Eingabebilder zu einer fotorealistischen Szene kombinieren.
  • Charakterkonsistenz — das gleiche Motiv oder die gleiche Figurenerscheinung über Bearbeitungen und Prompts hinweg beibehalten. (Konsistenz).
  • SynthID-Wasserzeichen — alle Ausgaben enthalten eine unsichtbare SynthID, um KI-generierte Inhalte zu identifizieren. (Wasserzeichen).

Technische Details

  • Architektur & Positionierung: basiert auf der Gemini 2.5 Flash-Familie — konzipiert als Low-Latency‑„Flash“-Variante, die etwas Modellgröße/Durchsatz gegen deutlich schnellere pro‑Call‑Antworten und Kosteneffizienz tauscht, während sie stärkeres Reasoning als frühere Flash‑Tiers beibehält.
  • Eingabeformate & Limits: akzeptiert Inline‑Base64‑Bilder für kleine Eingaben und Datei‑Uploads über die File API für größere Bilder (empfohlen für >20 MB). Unterstützt gängige MIME‑Typen (JPEG, PNG).
  • Betriebsmodi: Text‑zu‑Bild, Bildbearbeitung (Inpainting / semantische Maskierung), Stiltransfer, Mehrbild‑Komposition und interleaved Text+Bild‑Antworten (nützlich für illustrierte Anleitungen, Rezepte oder gemischte Inhalte).
  • Herkunft & Sicherheitsmechanismen: sichtbare Wasserzeichen auf KI‑Ausgaben plus versteckte SynthID‑Marker sowie Richtlinien‑Durchsetzungsschichten zur Begrenzung explizit unzulässiger Inhalte.

Einschränkungen & bekannte Risiken

  • Inhaltsrichtlinien‑Beschränkungen: Modelle setzen Inhaltsrichtlinien durch (z. B. das Untersagen expliziter sexueller Inhalte und bestimmter illegaler Inhalte), aber die Durchsetzung ist nicht perfekt — das Generieren von Bildern öffentlicher Personen oder kontroverser Symbole kann in einigen Szenarien dennoch möglich sein, daher sind Richtlinienprüfungen essenziell. )
  • Fehlermodi: möglicher Identitätsdrift bei extremen Bearbeitungen, gelegentliche semantische Fehlanpassungen (wenn Prompts unzureichend spezifiziert sind) und Artefakte in sehr komplexen Szenen oder bei extremen Perspektivenwechseln.
  • Herkunft & Missbrauch: Auch wenn Wasserzeichen und SynthID vorhanden sind, verhindern sie Missbrauch nicht — sie unterstützen Erkennung und Zuordnung, sind aber kein Ersatz für menschliche Prüfung in sensiblen Workflows.

Typische Anwendungsfälle

  • Produkt & E‑Commerce: Produkte per Multi‑Image‑Fusion in Lifestyle‑Aufnahmen platzieren/katalogisieren.
  • Kreativ‑Tools / Design: schnelle Iterationen in Design‑Apps (Adobe Firefly‑Integration genannt).
  • Bildbearbeitung & Retusche: lokalisierte Bearbeitungen per natürlicher Sprache (Objekte entfernen, Farbe/Beleuchtung ändern, neu stylen).
  • Storytelling / Charakter‑Assets: Charaktere über Panels und Szenen hinweg konsistent halten.

Funkcje dla Nano Banana

Poznaj kluczowe funkcje Nano Banana, zaprojektowane w celu zwiększenia wydajności i użyteczności. Odkryj, jak te możliwości mogą przynieść korzyści Twoim projektom i poprawić doświadczenie użytkownika.

Cennik dla Nano Banana

Poznaj konkurencyjne ceny dla Nano Banana, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak Nano Banana może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)Oficjalna cena (USD / M Tokens)Zniżka
Na żądanie:$0.0312
Na żądanie:$0.039
-20%

Przykładowy kod i API dla Nano Banana

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla Nano Banana, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał Nano Banana w Twoich projektach.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = (
    "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"
)

response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=[prompt],
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = os.path.join(OUTPUT_DIR, "gemini-native-image.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Wersje modelu Nano Banana

Powody, dla których Nano Banana posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.
version
gemini-2.5-flash-image
gemini-2.5-flash-image-preview

Więcej modeli