Specyfikacja techniczna Gemini 3.1 Flash Image Preview
| Element | Gemini 3.1 Flash Image Preview |
|---|---|
| Dostawca | |
| Rodzina modeli | Gemini 3.1 (warstwa Flash) |
| Główny cel | Szybkie multimodalne generowanie z podglądem obrazu |
| Typy wejścia | Tekst, obraz |
| Typy wyjścia | Tekst, obraz (generowanie podglądu) |
| Okno kontekstu | Do 1M tokenów (standard warstwy Flash Gemini 3.x) |
| Poziom opóźnień | Niskie opóźnienia, wysoka przepustowość |
| Obsługa strumieniowania | Tak |
| Wywoływanie narzędzi | Tak (framework narzędzi Gemini API) |
| Wersja | 3.1 |
Czym jest Nano Banana 2
Nano Banana 2 to popularny pseudonim używany przez prasę i społeczność deweloperów dla nowo wydanego modelu Gemini-3.1-Flash-Image. Google pozycjonuje go jako silnik obrazowania klasy „Flash”, który zapewnia niemal pro‑jakość wizualną przy znacznie niższych opóźnieniach i kosztach — odpowiedni do generowania na dużą skalę, szybkiej iteracyjnej edycji oraz zintegrowanych przepływów pracy produktowych w usługach Google. Dziedziczy multimodalne wnioskowanie Gemini 3.1 i dodaje możliwości zorientowane na obraz (czytelny tekst na obrazach, kompozycja z wielu obrazów, obsługa szerokich proporcji, natywne 4K).
Główne funkcje
- Szybkie generowanie w wielu rozdzielczościach: prędkość klasy Flash z opcjami wyjść 0.5K / 1K / 2K / 4K oraz nowymi skrajnymi proporcjami (1:4, 4:1, 1:8, 8:1).
- Powiązanie z siecią w czasie rzeczywistym: integruje wyniki wyszukiwania tekstu i obrazów, aby osadzić generowane treści w aktualnych informacjach z sieci, gdy włączone jest „Thinking” lub oparcie w wynikach wyszukiwania. Przydatne do aktualnych odniesień i faktograficznych infografik.
- Ulepszone renderowanie tekstu: lepsze odwzorowanie krótkich i graficznych napisów (czcionki, rozmiary) niż we wcześniejszych modelach Flash; wciąż niedoskonałe przy długich akapitach/drobnych napisach.
- Edycja z wieloma wejściami i wieloturowe przepływy pracy: silne wsparcie dla łączenia wielu obrazów jako wejść oraz iteracyjnych edycji w kolejnych turach.
📊 Wyniki benchmarków — generowanie i edycja obrazów (wyniki Elo)
| Zdolność | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Tekst na obraz — preferencja ogólna | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Tekst na obraz — jakość wizualna | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Tekst na obraz — infografiki (faktualność) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Edycja — ogólna | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Edycja — postacie | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Edycja — kreatywna | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Edycja — obiekt/otoczenie | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Edycja — wiele wejść | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Edycja — stylizacja | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Najważniejsze wnioski z tej tabeli benchmarków:
- W kategoriach generowania tekst‑na‑obraz i edycji obrazów Gemini 3.1 Flash Image konsekwentnie prowadzi lub dorównuje najwyższym wynikom wśród modeli klasy Flash oraz wielu konkurencyjnych modeli obrazowych.
- Model wykazuje szczególnie mocne wyniki w benchmarkach Jakość wizualna i Infografiki (faktualność) — co wskazuje, że wyróżnia się nie tylko estetyką, ale również wiernym odwzorowaniem strukturalnie poprawnych treści.
- W edycji z wieloma wejściami Nano Banana 2 pokazuje również solidną uogólnialność, uzyskując wyższe wyniki niż poprzednia generacja Flash.
Te oceny są przeprowadzane poprzez bezpośrednie porównania Elo z udziałem ludzi na zróżnicowanym zestawie benchmarków, odzwierciedlając zarówno preferencje, jak i wierność w powszechnych zadaniach generowania/edycji obrazów.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Model | Pozycjonowanie | Reprezentatywny benchmark/uwagi |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Warstwa Flash: szybkość + wysoka jakość wizualna (2K–4K) | Preferencja ogólna 1079.0 ± 7.0; jakość wizualna 1140 ± 6.0 (wewnętrzny GenAI-Bench). |
| Gemini 2.5 Flash Image (Nano Banana) | Wcześniejsze wydanie Flash (niższa wierność) | Nieco niższe wyniki preferencji/jakości wizualnej względem 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Warstwa Pro: wyższa postrzegana wierność przy złożonych zadaniach, wyższy koszt/opóźnienia | Inne kompromisy; niektóre metryki pokazują odmienne względne pozycje w zadaniach specjalistycznych. |
| GPT-Image 1.5 / inne modele komercyjne | Konkurenci (otwarte/zamknięte) | W wewnętrznych benchmarkach Google GPT-Image i inne uzyskały niższe wyniki niż Gemini 3.1 w zakresie jakości wizualnej i preferencji ogólnej w raportowanej ewaluacji. Niezależne porównania osób trzecich są zróżnicowane. |
Kiedy wybrać Flash Image Preview:
- Podgląd obrazu w czasie rzeczywistym w aplikacjach
- Skalowane generowanie obrazów wrażliwe na koszty
- Interaktywne asystenty projektowe
Jak uzyskać dostęp i zintegrować Nano Banana 2
Krok 1: Zarejestruj się po klucz API
Zaloguj się do cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokenu: sk-xxxxx i zatwierdź.
Krok 2: Wysyłaj żądania do interfejsu API Nano Banana 2
Wybierz endpoint „gemini-3.1-flash-image-preview8”, aby wysłać żądanie API i ustaw ciało żądania. Metodę i ciało żądania znajdziesz w dokumentacji API na naszej stronie. Nasza strona udostępnia także test w Apifox dla Twojej wygody. Zastąp <YOUR_API_KEY> rzeczywistym kluczem CometAPI ze swojego konta. Gdzie wywołać: Gemini — generowanie obrazu
Nano Banana 2 obsługuje edycję obrazów, generowanie obrazów i przepływy pracy z wieloma obrazami. W przypadku edycji obrazu musisz przekazać URL obrazu. Więcej parametrów znajdziesz w dokumentacji.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania i dane wyjściowe. Możesz bezpośrednio pobrać obraz na lokalną maszynę w playgroundzie (zwykle w formacie PNG). W procesie API generowany jest URL obrazu; prosimy o jego niezwłoczne pobranie.



