Specyfikacja techniczna Gemini 3.1 Flash Image Preview
| Element | Gemini 3.1 Flash Image Preview |
|---|---|
| Dostawca | |
| Rodzina modeli | Gemini 3.1 (warstwa Flash) |
| Główne przeznaczenie | Szybkie generowanie multimodalne z podglądem obrazu |
| Typy danych wejściowych | Tekst, Obraz |
| Typy danych wyjściowych | Tekst, Obraz (generowanie podglądu) |
| Okno kontekstu | Do 1M tokenów (standard warstwy Flash Gemini 3.x) |
| Poziom opóźnień | Niskie opóźnienia, wysoka przepustowość |
| Obsługa strumieniowania | Tak |
| Wywoływanie narzędzi | Tak (framework narzędzi Gemini API) |
| Wersja | 3.1 |
Czym jest Nano Banana 2
Nano Banana 2 to popularna ksywka używana przez media i społeczność deweloperów dla nowo wydanego modelu Gemini-3.1-Flash-Image. Google pozycjonuje go jako silnik obrazowania warstwy „Flash”, który zapewnia niemal profesjonalną wierność wizualną przy znacznie niższej latencji i koszcie — odpowiedni do masowego generowania, szybkiej iteracyjnej edycji oraz zintegrowanych przepływów pracy produktowych w usługach Google. Dziedziczy wielomodalne rozumowanie Gemini 3.1 i dodaje możliwości ukierunkowane na obraz (czytelny tekst na obrazach, kompozycje z wielu obrazów, obsługa szerokich proporcji, natywne 4K).
Najważniejsze funkcje
- Szybkie generowanie w wielu rozdzielczościach: prędkość warstwy Flash z opcjami 0.5K / 1K / 2K / 4K oraz nowymi skrajnymi proporcjami (1:4, 4:1, 1:8, 8:1).
- Oparcie na sieci w czasie rzeczywistym: integruje wyniki wyszukiwania tekstów i obrazów, aby osadzić generowaną treść w bieżących informacjach z sieci, gdy włączone jest „Thinking” lub uziemianie przez wyszukiwarkę. Przydatne dla aktualnych odwołań i infografik opartych na faktach.
- Ulepszone renderowanie tekstu: lepsze renderowanie krótkiego tekstu i grafik (czcionki, rozmiary) niż w wcześniejszych modelach Flash; wciąż niedoskonałe przy długich akapitach/małym tekście.
- Edycja z wieloma wejściami i wieloturowe przepływy pracy: silne wsparcie dla łączenia kilku obrazów jako wejścia oraz iteracyjnych edycji na wielu turach.
📊 Wydajność w benchmarkach — Generowanie i edycja obrazów (wyniki Elo)
| Zdolność | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Tekst-do-obrazu — Preferencja ogólna | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Tekst-do-obrazu — Jakość wizualna | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Tekst-do-obrazu — Infografiki (faktualność) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Edycja — Ogólna | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Edycja — Postacie | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Edycja — Kreatywna | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Edycja — Obiekt/Środowisko | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Edycja — Wiele wejść | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Edycja — Stylizacja | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Najważniejsze wnioski z tej tabeli benchmarków:
- W kategoriach generowania tekst-do-obrazu i edycji obrazu Gemini 3.1 Flash Image konsekwentnie prowadzi lub dorównuje najwyższym wynikom wśród modeli warstwy Flash i wielu konkurencyjnych modeli obrazowych.
- Model wykazuje szczególnie mocne wyniki w benchmarkach Jakości wizualnej i Infografik (faktualności) — co sygnalizuje, że wyróżnia się nie tylko estetyką, ale też poprawnym odwzorowaniem strukturalnym treści.
- W przypadku edycji z wieloma wejściami Nano Banana 2 również wykazuje solidną uogólnialność, z wyższymi wynikami niż poprzednia generacja Flash.
Oceny przeprowadzono metodą ludzkich porównań Elo w parach na zróżnicowanym zestawie benchmarków, odzwierciedlając zarówno preferencje, jak i wierność w często stosowanych zadaniach generowania/edycji obrazów.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Model | Pozycjonowanie | Reprezentatywne benchmarki/uwagi |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Warstwa Flash: szybkość + wysoka jakość wizualna (2K–4K) | Preferencja ogólna 1079.0 ± 7.0; jakość wizualna 1140 ± 6.0 (wewnętrzny GenAI-Bench). |
| Gemini 2.5 Flash Image (Nano Banana) | Wcześniejsze wydanie Flash (niższa wierność) | Nieco niższe wyniki preferencji/jakości wizualnej w porównaniu z 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Warstwa Pro: wyższa postrzegana wierność w złożonych zadaniach, wyższy koszt/opóźnienia | Różne kompromisy; niektóre metryki pokazują inne względne pozycje w zadaniach specjalistycznych. |
| GPT-Image 1.5 / inne komercyjne modele | Konkurenci (otwarci/zamknięci) | W wewnętrznych benchmarkach Google GPT-Image i inne uzyskały wyniki poniżej Gemini 3.1 pod względem jakości wizualnej i preferencji ogólnej w raporcie z ewaluacji. Niezależne porównania stron trzecich są zróżnicowane. |
Kiedy wybrać Flash Image Preview:
- Podgląd obrazów w czasie rzeczywistym w aplikacjach
- Skalowalne generowanie obrazów przy wrażliwości na koszty
- Interaktywne asystenty projektowe
Jak uzyskać dostęp i zintegrować Nano Banana 2
Krok 1: Zarejestruj się po klucz API
Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokenu: sk-xxxxx i zatwierdź.
Krok 2: Wyślij żądania do API Nano Banana 2
Wybierz endpoint „gemini-3.1-flash-image-preview8”, aby wysłać żądanie do API i ustawić body żądania. Metodę i body żądania znajdziesz w dokumentacji API na naszej stronie. Dla wygody nasza strona udostępnia też test w Apifox. Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta. Gdzie to wywołać: Gemini generuje obraz
Nano Banana 2 obsługuje edycję obrazów, generowanie obrazów oraz przepływy pracy z wieloma obrazami. W przypadku edycji obrazu musisz przesłać adres URL obrazu. Więcej parametrów znajdziesz w dokumentacji.
Krok 3: Pobierz i zweryfikuj wyniki
Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania i dane wyjściowe. Możesz bezpośrednio pobrać obraz na swój komputer w playgroundzie (zwykle w formacie PNG). W procesie API generowany jest adres URL obrazu; pobierz go niezwłocznie.