Home/Models/Google/Nano Banana
G

Nano Banana

Na żądanie:$0.0312
Gemini 2.5 Flash Image (znany również jako nano-banana) to najnowocześniejszy model Google do generowania i edycji obrazów. Ta aktualizacja umożliwia łączenie wielu obrazów w jeden, utrzymywanie spójności postaci, by opowiadać bogate historie, wykonywanie celowanych modyfikacji za pomocą języka naturalnego oraz wykorzystywanie wiedzy o świecie modelu Gemini do generowania i edycji obrazów.
Użycie komercyjne
Playground
Przegląd
Funkcje
Cennik
API
Wersje

Kluczowe funkcje

  • Natywne generowanie i edycja obrazów — generuj obrazy lub edytuj istniejące zdjęcia za pomocą poleceń w języku naturalnym. (Generuj / Edytuj).
  • Fuzja wielu obrazów — połącz wiele obrazów wejściowych w jedną fotorealistyczną scenę.
  • Spójność postaci — zachowuj ten sam wygląd obiektu lub postaci w kolejnych edycjach i poleceniach. (Spójność).
  • Znakowanie wodne SynthID — wszystkie wyniki zawierają niewidoczny SynthID identyfikujący treści generowane przez AI. (Znak wodny).

Szczegóły techniczne

  • Architektura i pozycjonowanie: zbudowany na rodzinie Gemini 2.5 Flash — zaprojektowany jako wariant „Flash” o niskich opóźnieniach, który wymienia nieco rozmiaru/przepustowości modelu na znacznie szybszą odpowiedź na pojedyncze wywołanie i efektywność kosztową, jednocześnie zachowując silniejsze wnioskowanie niż wcześniejsze poziomy Flash.
  • Formaty wejściowe i limity: akceptuje osadzone inline obrazy base64 dla małych danych wejściowych oraz przesyłanie plików przez File API dla większych obrazów (zalecane dla >20 MB). Obsługuje typowe typy MIME (JPEG, PNG).
  • Tryby pracy: tekst-na-obraz, edycja obrazu (inpainting / maskowanie semantyczne), transfer stylu, kompozycja wieloobrazowa oraz przeplatane odpowiedzi tekst+obraz (przydatne do zilustrowanych instrukcji, przepisów lub treści mieszanych).
  • Pochodzenie i mechanizmy bezpieczeństwa: widoczne znaki wodne na wynikach AI oraz ukryte znaczniki SynthID i warstwy egzekwowania zasad ograniczające jawnie niedozwolone treści.

Ograniczenia i znane ryzyka

  • Ograniczenia polityki treści: modele egzekwują zasady dotyczące treści (np. zakaz wyraźnych treści seksualnych i części treści nielegalnych), jednak egzekwowanie nie jest doskonałe — generowanie obrazów osób publicznych lub kontrowersyjnych ikon może być w niektórych scenariuszach nadal możliwe, dlatego kontrole zgodności z polityką są kluczowe. )
  • Tryby awarii: możliwe dryfowanie tożsamości przy skrajnych edycjach, sporadyczne niedopasowanie semantyczne (gdy polecenia są niedookreślone) oraz artefakty w bardzo złożonych scenach lub przy skrajnych zmianach punktu widzenia.
  • Pochodzenie i nadużycia: mimo obecności znaków wodnych i SynthID nie zapobiegają one nadużyciom — pomagają w wykrywaniu i atrybucji, lecz nie zastępują ludzkiej weryfikacji w wrażliwych procesach.

Typowe zastosowania

  • Produkt i ecommerce: umieszczaj/kataloguj produkty w ujęciach lifestylowych dzięki fuzji wielu obrazów.
  • Narzędzia kreatywne / projektowanie: szybkie iteracje w aplikacjach projektowych (wspomniana integracja z Adobe Firefly).
  • Edycja i retusz zdjęć: lokalne edycje na podstawie języka naturalnego (usuwanie obiektów, zmiana koloru/oświetlenia, zmiana stylu).
  • Opowiadanie historii / zasoby postaci: zachowuj spójność postaci w kolejnych kadrach i scenach.

Funkcje dla Nano Banana

Poznaj kluczowe funkcje Nano Banana, zaprojektowane w celu zwiększenia wydajności i użyteczności. Odkryj, jak te możliwości mogą przynieść korzyści Twoim projektom i poprawić doświadczenie użytkownika.

Cennik dla Nano Banana

Poznaj konkurencyjne ceny dla Nano Banana, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak Nano Banana może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)Oficjalna cena (USD / M Tokens)ModelDetail.discount
Na żądanie:$0.0312
Na żądanie:$0.039
-20%

Przykładowy kod i API dla Nano Banana

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla Nano Banana, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał Nano Banana w Twoich projektach.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = (
    "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme"
)

response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=[prompt],
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = os.path.join(OUTPUT_DIR, "gemini-native-image.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Wersje modelu Nano Banana

Powody, dla których Nano Banana posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.
version
gemini-2.5-flash-image
gemini-2.5-flash-image-preview

Więcej modeli