Home/Models/Google/Nano Banana 2
G

Nano Banana 2

Wejście:$0.2/M
Wyjście:$1.2/M
Przegląd kluczowych możliwości: Rozdzielczość: Do 4K (4096×4096), na równi z Pro. Spójność obrazów referencyjnych: Do 14 obrazów referencyjnych (10 obiektów + 4 postacie), z zachowaniem spójności stylu/postaci. Ekstremalne proporcje obrazu: Dodano nowe proporcje 1:4, 4:1, 1:8, 8:1, odpowiednie do długich obrazów, plakatów i banerów. Renderowanie tekstu: Zaawansowane generowanie tekstu, odpowiednie do infografik i układów plakatów marketingowych. Ulepszenie wyszukiwania: Zintegrowane Google Search + Image Search. Osadzanie: Wbudowany proces rozumowania; złożone polecenia są analizowane przed generowaniem.
Nowy
Użycie komercyjne
Playground
Przegląd
Funkcje
Cennik
API
Wersje

Specyfikacja techniczna Gemini 3.1 Flash Image Preview

ElementGemini 3.1 Flash Image Preview
DostawcaGoogle
Rodzina modeliGemini 3.1 (warstwa Flash)
Główne przeznaczenieSzybkie generowanie multimodalne z podglądem obrazu
Typy danych wejściowychTekst, Obraz
Typy danych wyjściowychTekst, Obraz (generowanie podglądu)
Okno kontekstuDo 1M tokenów (standard warstwy Flash Gemini 3.x)
Poziom opóźnieńNiskie opóźnienia, wysoka przepustowość
Obsługa strumieniowaniaTak
Wywoływanie narzędziTak (framework narzędzi Gemini API)
Wersja3.1

Czym jest Nano Banana 2

Nano Banana 2 to popularna ksywka używana przez media i społeczność deweloperów dla nowo wydanego modelu Gemini-3.1-Flash-Image. Google pozycjonuje go jako silnik obrazowania warstwy „Flash”, który zapewnia niemal profesjonalną wierność wizualną przy znacznie niższej latencji i koszcie — odpowiedni do masowego generowania, szybkiej iteracyjnej edycji oraz zintegrowanych przepływów pracy produktowych w usługach Google. Dziedziczy wielomodalne rozumowanie Gemini 3.1 i dodaje możliwości ukierunkowane na obraz (czytelny tekst na obrazach, kompozycje z wielu obrazów, obsługa szerokich proporcji, natywne 4K).

Najważniejsze funkcje

  • Szybkie generowanie w wielu rozdzielczościach: prędkość warstwy Flash z opcjami 0.5K / 1K / 2K / 4K oraz nowymi skrajnymi proporcjami (1:4, 4:1, 1:8, 8:1).
  • Oparcie na sieci w czasie rzeczywistym: integruje wyniki wyszukiwania tekstów i obrazów, aby osadzić generowaną treść w bieżących informacjach z sieci, gdy włączone jest „Thinking” lub uziemianie przez wyszukiwarkę. Przydatne dla aktualnych odwołań i infografik opartych na faktach.
  • Ulepszone renderowanie tekstu: lepsze renderowanie krótkiego tekstu i grafik (czcionki, rozmiary) niż w wcześniejszych modelach Flash; wciąż niedoskonałe przy długich akapitach/małym tekście.
  • Edycja z wieloma wejściami i wieloturowe przepływy pracy: silne wsparcie dla łączenia kilku obrazów jako wejścia oraz iteracyjnych edycji na wielu turach.

📊 Wydajność w benchmarkach — Generowanie i edycja obrazów (wyniki Elo)

ZdolnośćGemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
Tekst-do-obrazu — Preferencja ogólna1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
Tekst-do-obrazu — Jakość wizualna1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
Tekst-do-obrazu — Infografiki (faktualność)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
Edycja — Ogólna1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
Edycja — Postacie1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
Edycja — Kreatywna1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
Edycja — Obiekt/Środowisko1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
Edycja — Wiele wejść1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
Edycja — Stylizacja1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

Najważniejsze wnioski z tej tabeli benchmarków:

  • W kategoriach generowania tekst-do-obrazu i edycji obrazu Gemini 3.1 Flash Image konsekwentnie prowadzi lub dorównuje najwyższym wynikom wśród modeli warstwy Flash i wielu konkurencyjnych modeli obrazowych.
  • Model wykazuje szczególnie mocne wyniki w benchmarkach Jakości wizualnej i Infografik (faktualności) — co sygnalizuje, że wyróżnia się nie tylko estetyką, ale też poprawnym odwzorowaniem strukturalnym treści.
  • W przypadku edycji z wieloma wejściami Nano Banana 2 również wykazuje solidną uogólnialność, z wyższymi wynikami niż poprzednia generacja Flash.

Oceny przeprowadzono metodą ludzkich porównań Elo w parach na zróżnicowanym zestawie benchmarków, odzwierciedlając zarówno preferencje, jak i wierność w często stosowanych zadaniach generowania/edycji obrazów.

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

ModelPozycjonowanieReprezentatywne benchmarki/uwagi
Gemini 3.1 Flash Image (Nano Banana 2)Warstwa Flash: szybkość + wysoka jakość wizualna (2K–4K)Preferencja ogólna 1079.0 ± 7.0; jakość wizualna 1140 ± 6.0 (wewnętrzny GenAI-Bench).
Gemini 2.5 Flash Image (Nano Banana)Wcześniejsze wydanie Flash (niższa wierność)Nieco niższe wyniki preferencji/jakości wizualnej w porównaniu z 3.1.
Gemini 3 Pro Image (Nano Banana Pro)Warstwa Pro: wyższa postrzegana wierność w złożonych zadaniach, wyższy koszt/opóźnieniaRóżne kompromisy; niektóre metryki pokazują inne względne pozycje w zadaniach specjalistycznych.
GPT-Image 1.5 / inne komercyjne modeleKonkurenci (otwarci/zamknięci)W wewnętrznych benchmarkach Google GPT-Image i inne uzyskały wyniki poniżej Gemini 3.1 pod względem jakości wizualnej i preferencji ogólnej w raporcie z ewaluacji. Niezależne porównania stron trzecich są zróżnicowane.

Kiedy wybrać Flash Image Preview:

  • Podgląd obrazów w czasie rzeczywistym w aplikacjach
  • Skalowalne generowanie obrazów przy wrażliwości na koszty
  • Interaktywne asystenty projektowe

Jak uzyskać dostęp i zintegrować Nano Banana 2

Krok 1: Zarejestruj się po klucz API

Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokenu: sk-xxxxx i zatwierdź.

Krok 2: Wyślij żądania do API Nano Banana 2

Wybierz endpoint „gemini-3.1-flash-image-preview8”, aby wysłać żądanie do API i ustawić body żądania. Metodę i body żądania znajdziesz w dokumentacji API na naszej stronie. Dla wygody nasza strona udostępnia też test w Apifox. Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta. Gdzie to wywołać: Gemini generuje obraz

Nano Banana 2 obsługuje edycję obrazów, generowanie obrazów oraz przepływy pracy z wieloma obrazami. W przypadku edycji obrazu musisz przesłać adres URL obrazu. Więcej parametrów znajdziesz w dokumentacji.

Krok 3: Pobierz i zweryfikuj wyniki

Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania i dane wyjściowe. Możesz bezpośrednio pobrać obraz na swój komputer w playgroundzie (zwykle w formacie PNG). W procesie API generowany jest adres URL obrazu; pobierz go niezwłocznie.

Najczęściej zadawane pytania

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 to najnowszy model Google do generowania i edycji obrazów z użyciem AI, zbudowany na technologii Gemini Flash Image, który zapewnia szybkie, wysokiej jakości tworzenie wizualizacji oraz precyzyjne wykonywanie poleceń w oparciu o wejścia tekstowe i obrazowe.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 to w istocie nazwa konsumencka modelu Google Gemini 3.1 Flash Image, łącząca zaawansowane możliwości z poprzednich wersji Nano Banana z szybkością modeli Flash.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 oferuje większą szybkość generowania, ostrzejsze detale, lepszą zgodność z poleceniami, ulepszone renderowanie tekstu/lokalizowane tłumaczenia oraz szerszą kontrolę twórczą, udostępniając wiele funkcji klasy Pro na poziomie podstawowym.

What kinds of images and resolutions can Nano Banana 2 generate?

Model obsługuje elastyczne generowanie z różnymi proporcjami obrazu i rozdzielczościami do 4K, odpowiednie dla mediów społecznościowych, reklam, wyświetlaczy i treści profesjonalnych.

Can Nano Banana 2 maintain consistency in complex compositions?

Tak — zachowuje spójność między wieloma postaciami i obiektami (np. do pięciu postaci i 14 obiektów w jednym przepływie pracy na podstawie pojedynczego polecenia), co pomaga w scenach narracyjnych i zadaniach w stylu storyboardu.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

Doskonale nadaje się do profesjonalnego tworzenia i edycji obrazów, infografik, zachowania spójności między wieloma obrazami, renderowania tekstu oraz zlokalizowanych, wielojęzycznych wyników, zwłaszcza gdy przepływy pracy wymagają precyzyjnej kontroli i wielokrotnych iteracji.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 wykorzystuje wiedzę o świecie oraz integrację z wyszukiwaniem obrazów, aby pomagać w generowaniu bardziej precyzyjnych motywów, infografik i wizualizacji uwzględniających lokalizację.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Tak — potrafi generować i renderować wyraźny tekst w obrębie obrazów, lecz wyjątkowo mały lub gęsty, wieloakapitowy tekst bywa nadal wyzwaniem.

Funkcje dla Nano Banana 2

Poznaj kluczowe funkcje Nano Banana 2, zaprojektowane w celu zwiększenia wydajności i użyteczności. Odkryj, jak te możliwości mogą przynieść korzyści Twoim projektom i poprawić doświadczenie użytkownika.

Cennik dla Nano Banana 2

Poznaj konkurencyjne ceny dla Nano Banana 2, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak Nano Banana 2 może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)Oficjalna cena (USD / M Tokens)Zniżka
Wejście:$0.2/M
Wyjście:$1.2/M
Wejście:$0.25/M
Wyjście:$1.5/M
-20%

Przykładowy kod i API dla Nano Banana 2

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla Nano Banana 2, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał Nano Banana 2 w Twoich projektach.
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Wersje modelu Nano Banana 2

Powody, dla których Nano Banana 2 posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.
ID modeluOpisDostępnośćŻądanie
gemini-3.1-flash-imagePolecany, wskazuje na najnowszy model✅Gemini generuje obraz
gemini-3.1-flash-image-previewOficjalna wersja zapoznawcza✅Gemini generuje obraz

Więcej modeli