ModeleCenyPrzedsiębiorstwo
Ponad 500 API modeli AI, wszystko w jednym API. Tylko w CometAPI
API modeli
Deweloper
Szybki startDokumentacjaPanel API
Firma
O nasPrzedsiębiorstwo
Zasoby
Modele Sztucznej InteligencjiBlogDziennik zmianWsparcie
Warunki korzystania z usługiPolityka Prywatności
© 2026 CometAPI · All rights reserved
Home/Models/Google/Nano Banana 2
G

Nano Banana 2

Wejście:$0.4/M
Wyjście:$2.4/M
Przegląd kluczowych możliwości: Rozdzielczość: Do 4K (4096×4096), na równi z Pro. Spójność obrazów referencyjnych: Do 14 obrazów referencyjnych (10 obiektów + 4 postacie), z zachowaniem spójności stylu/postaci. Ekstremalne proporcje obrazu: Dodano nowe proporcje 1:4, 4:1, 1:8, 8:1, odpowiednie do długich obrazów, plakatów i banerów. Renderowanie tekstu: Zaawansowane generowanie tekstu, odpowiednie do infografik i układów plakatów marketingowych. Ulepszenie wyszukiwania: Zintegrowane Google Search + Image Search. Osadzanie: Wbudowany proces rozumowania; złożone polecenia są analizowane przed generowaniem.
Nowy
Użycie komercyjne
Playground
Przegląd
Funkcje
Cennik
API
Wersje

Specyfikacja techniczna Gemini 3.1 Flash Image Preview

ElementGemini 3.1 Flash Image Preview
DostawcaGoogle
Rodzina modeliGemini 3.1 (warstwa Flash)
Główny celSzybkie multimodalne generowanie z podglądem obrazu
Typy wejściaTekst, obraz
Typy wyjściaTekst, obraz (generowanie podglądu)
Okno kontekstuDo 1M tokenów (standard warstwy Flash Gemini 3.x)
Poziom opóźnieńNiskie opóźnienia, wysoka przepustowość
Obsługa strumieniowaniaTak
Wywoływanie narzędziTak (framework narzędzi Gemini API)
Wersja3.1

Czym jest Nano Banana 2

Nano Banana 2 to popularny pseudonim używany przez prasę i społeczność deweloperów dla nowo wydanego modelu Gemini-3.1-Flash-Image. Google pozycjonuje go jako silnik obrazowania klasy „Flash”, który zapewnia niemal pro‑jakość wizualną przy znacznie niższych opóźnieniach i kosztach — odpowiedni do generowania na dużą skalę, szybkiej iteracyjnej edycji oraz zintegrowanych przepływów pracy produktowych w usługach Google. Dziedziczy multimodalne wnioskowanie Gemini 3.1 i dodaje możliwości zorientowane na obraz (czytelny tekst na obrazach, kompozycja z wielu obrazów, obsługa szerokich proporcji, natywne 4K).

Główne funkcje

  • Szybkie generowanie w wielu rozdzielczościach: prędkość klasy Flash z opcjami wyjść 0.5K / 1K / 2K / 4K oraz nowymi skrajnymi proporcjami (1:4, 4:1, 1:8, 8:1).
  • Powiązanie z siecią w czasie rzeczywistym: integruje wyniki wyszukiwania tekstu i obrazów, aby osadzić generowane treści w aktualnych informacjach z sieci, gdy włączone jest „Thinking” lub oparcie w wynikach wyszukiwania. Przydatne do aktualnych odniesień i faktograficznych infografik.
  • Ulepszone renderowanie tekstu: lepsze odwzorowanie krótkich i graficznych napisów (czcionki, rozmiary) niż we wcześniejszych modelach Flash; wciąż niedoskonałe przy długich akapitach/drobnych napisach.
  • Edycja z wieloma wejściami i wieloturowe przepływy pracy: silne wsparcie dla łączenia wielu obrazów jako wejść oraz iteracyjnych edycji w kolejnych turach.

📊 Wyniki benchmarków — generowanie i edycja obrazów (wyniki Elo)

ZdolnośćGemini 3.1 Flash Image (Nano Banana 2)Gemini 2.5 Flash Image (Nano Banana)Gemini 3 Pro Image (Nano Banana Pro)GPT-Image 1.5Seedream 5.0 LiteGrok Imagine Image Pro
Tekst na obraz — preferencja ogólna1079.0 ± 7.01073.0 ± 5.0942.0 ± 6.01021.0 ± 5.01047.0 ± 5.0928.0 ± 8.0
Tekst na obraz — jakość wizualna1140.0 ± 6.01129.0 ± 6.0929.0 ± 6.01043.0 ± 5.0975.0 ± 5.0759.0 ± 10.0
Tekst na obraz — infografiki (faktualność)1114.0 ± 14.01074.0 ± 12.0881.0 ± 13.01102.0 ± 13.0985.0 ± 12.0890.0 ± 22.0
Edycja — ogólna1065.0 ± 9.01047.0 ± 9.0913.0 ± 9.01051.0 ± 10.0995.0 ± 8.0937.0 ± 9.0
Edycja — postacie1056.0 ± 7.01049.0 ± 7.0952.0 ± 7.01050.0 ± 8.01025.0 ± 7.0894.0 ± 8.0
Edycja — kreatywna1023.0 ± 7.01031.0 ± 7.0976.0 ± 7.01004.0 ± 7.01017.0 ± 7.0938.0 ± 7.0
Edycja — obiekt/otoczenie1029.0 ± 8.01018.0 ± 8.0945.0 ± 8.01042.0 ± 10.0976.0 ± 8.0946.0 ± 9.0
Edycja — wiele wejść1037.0 ± 8.01016.0 ± 8.0919.0 ± 9.01056.0 ± 12.01014.0 ± 9.0N/A
Edycja — stylizacja1045.0 ± 7.01031.0 ± 7.0862.0 ± 8.01045.0 ± 9.0996.0 ± 7.0984.0 ± 7.0

Najważniejsze wnioski z tej tabeli benchmarków:

  • W kategoriach generowania tekst‑na‑obraz i edycji obrazów Gemini 3.1 Flash Image konsekwentnie prowadzi lub dorównuje najwyższym wynikom wśród modeli klasy Flash oraz wielu konkurencyjnych modeli obrazowych.
  • Model wykazuje szczególnie mocne wyniki w benchmarkach Jakość wizualna i Infografiki (faktualność) — co wskazuje, że wyróżnia się nie tylko estetyką, ale również wiernym odwzorowaniem strukturalnie poprawnych treści.
  • W edycji z wieloma wejściami Nano Banana 2 pokazuje również solidną uogólnialność, uzyskując wyższe wyniki niż poprzednia generacja Flash.

Te oceny są przeprowadzane poprzez bezpośrednie porównania Elo z udziałem ludzi na zróżnicowanym zestawie benchmarków, odzwierciedlając zarówno preferencje, jak i wierność w powszechnych zadaniach generowania/edycji obrazów.

Nano Banana 2 vs Nano Banana vs Nano Banana Pro

ModelPozycjonowanieReprezentatywny benchmark/uwagi
Gemini 3.1 Flash Image (Nano Banana 2)Warstwa Flash: szybkość + wysoka jakość wizualna (2K–4K)Preferencja ogólna 1079.0 ± 7.0; jakość wizualna 1140 ± 6.0 (wewnętrzny GenAI-Bench).
Gemini 2.5 Flash Image (Nano Banana)Wcześniejsze wydanie Flash (niższa wierność)Nieco niższe wyniki preferencji/jakości wizualnej względem 3.1.
Gemini 3 Pro Image (Nano Banana Pro)Warstwa Pro: wyższa postrzegana wierność przy złożonych zadaniach, wyższy koszt/opóźnieniaInne kompromisy; niektóre metryki pokazują odmienne względne pozycje w zadaniach specjalistycznych.
GPT-Image 1.5 / inne modele komercyjneKonkurenci (otwarte/zamknięte)W wewnętrznych benchmarkach Google GPT-Image i inne uzyskały niższe wyniki niż Gemini 3.1 w zakresie jakości wizualnej i preferencji ogólnej w raportowanej ewaluacji. Niezależne porównania osób trzecich są zróżnicowane.

Kiedy wybrać Flash Image Preview:

  • Podgląd obrazu w czasie rzeczywistym w aplikacjach
  • Skalowane generowanie obrazów wrażliwe na koszty
  • Interaktywne asystenty projektowe

Jak uzyskać dostęp i zintegrować Nano Banana 2

Krok 1: Zarejestruj się po klucz API

Zaloguj się do cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, najpierw się zarejestruj. Zaloguj się do swojej konsoli CometAPI. Uzyskaj poświadczenie dostępu — klucz API interfejsu. Kliknij „Add Token” przy tokenie API w centrum osobistym, pobierz klucz tokenu: sk-xxxxx i zatwierdź.

Krok 2: Wysyłaj żądania do interfejsu API Nano Banana 2

Wybierz endpoint „gemini-3.1-flash-image-preview8”, aby wysłać żądanie API i ustaw ciało żądania. Metodę i ciało żądania znajdziesz w dokumentacji API na naszej stronie. Nasza strona udostępnia także test w Apifox dla Twojej wygody. Zastąp <YOUR_API_KEY> rzeczywistym kluczem CometAPI ze swojego konta. Gdzie wywołać: Gemini — generowanie obrazu

Nano Banana 2 obsługuje edycję obrazów, generowanie obrazów i przepływy pracy z wieloma obrazami. W przypadku edycji obrazu musisz przekazać URL obrazu. Więcej parametrów znajdziesz w dokumentacji.

Krok 3: Pobierz i zweryfikuj wyniki

Przetwórz odpowiedź API, aby uzyskać wygenerowany wynik. Po przetworzeniu API zwraca status zadania i dane wyjściowe. Możesz bezpośrednio pobrać obraz na lokalną maszynę w playgroundzie (zwykle w formacie PNG). W procesie API generowany jest URL obrazu; prosimy o jego niezwłoczne pobranie.

FAQ

What exactly is Nano Banana 2 and what does it do?

Nano Banana 2 is Google’s latest AI image generation and editing model, built on Gemini Flash image technology to deliver fast, high-quality visual generation and precise instruction following across text and image inputs.

How does Nano Banana 2 relate to Gemini 3.1 Flash Image?

Nano Banana 2 is essentially the consumer-facing branding for Google’s Gemini 3.1 Flash Image model, combining advanced capabilities from previous Nano Banana versions with the speed of Flash models.

What improvements does Nano Banana 2 add over earlier Nano Banana models?

Nano Banana 2 brings faster generation speed, sharper detail, better instruction fidelity, enhanced text rendering⁠/localized translation, and broader creative control while making many Pro-grade features available at base tier.

What kinds of images and resolutions can Nano Banana 2 generate?

The model supports flexible output with various aspect ratios and resolutions up to 4K, suitable for social media, ads, displays, and professional content.

Can Nano Banana 2 maintain consistency in complex compositions?

Yes — it preserves consistency across multiple subjects and objects (e.g., up to five characters and 14 objects in a single prompt workflow), helping with narrative scenes and storyboard-style tasks.

What image generation use cases is Gemini 3.1 Flash Image best suited for?

It’s well-suited for professional-grade image creation and editing, infographics, multi-image consistency, text rendering, and localized multilingual outputs, especially when workflows need precise control and repeated iterations.

Does Nano Banana 2 use real-time information or world knowledge?

Nano Banana 2 incorporates real-world knowledge and image search integration to help generate more accurate subjects, infographics, and location-aware visuals.

Can Gemini 3.1 Flash Image generate detailed text within images or diagrams?

Yes — it can generate and render clear text within images, but extremely small or dense multi-paragraph text sometimes remains challenging.

Cennik dla Nano Banana 2

Poznaj konkurencyjne ceny dla Nano Banana 2, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak Nano Banana 2 może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.

nano-banana-2(image)

variant / aliasPrice
gemini-3.1-flash-image (0.5K)≈ $0.03600
gemini-3.1-flash-image (1K)≈ $0.05360
gemini-3.1-flash-image (2K)≈ $0.08080
gemini-3.1-flash-image (4K)≈ $0.12080
gemini-3.1-flash-image-preview (0.5K)≈ $0.03600
gemini-3.1-flash-image-preview (1K)≈ $0.05360
gemini-3.1-flash-image-preview (2K)≈ $0.08080
gemini-3.1-flash-image-preview (4K)≈ $0.12080

Przykładowy kod i API dla Nano Banana 2

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla Nano Banana 2, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał Nano Banana 2 w Twoich projektach.
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

Python Code Example

from google import genai
from google.genai import types
from PIL import Image
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

prompt = (
    "A woman leaning on a wooden railing of a traditional Chinese building. "
    "She is wearing a blue cheongsam with pink and red floral motifs and a headdress "
    "made of colorful flowers, including roses and lilacs. Realistic painting style, "
    "focusing on the textural details of the clothing patterns and wooden buildings."
)
aspect_ratio = "9:16"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"

response = client.models.generate_content(
    model="gemini-3.1-flash-image-preview",
    contents=[prompt],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(aspect_ratio=aspect_ratio),
    ),
)

os.makedirs("./output", exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif part.inline_data is not None:
        image = part.as_image()
        output_path = "./output/gemini-3.1-flash-image-preview.png"
        image.save(output_path)
        print(f"Image saved to {output_path}")

JavaScript Code Example

import fs from "fs";
import path from "path";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.1-flash-image-preview";

const prompt =
  "A woman leaning on a wooden railing of a traditional Chinese building. " +
  "She is wearing a blue cheongsam with pink and red floral motifs and a headdress " +
  "made of colorful flowers, including roses and lilacs. Realistic painting style, " +
  "focusing on the textural details of the clothing patterns and wooden buildings.";

const response = await fetch(`${base_url}/models/${model}:generateContent`, {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    Authorization: api_key,
  },
  body: JSON.stringify({
    contents: [
      {
        role: "user",
        parts: [{ text: prompt }],
      },
    ],
    generationConfig: {
      responseModalities: ["IMAGE"],
      imageConfig: {
        aspectRatio: "9:16",
      },
    },
  }),
});

const data = await response.json();

const outputDir = "./output";
if (!fs.existsSync(outputDir)) {
  fs.mkdirSync(outputDir, { recursive: true });
}

for (const candidate of data.candidates) {
  for (const part of candidate.content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageBuffer = Buffer.from(part.inlineData.data, "base64");
      const outputPath = path.join(outputDir, "gemini-3.1-flash-image-preview.png");
      fs.writeFileSync(outputPath, imageBuffer);
      console.log(`Image saved to ${outputPath}`);
    }
  }
}

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

mkdir -p ./output

curl -s "https://api.cometapi.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "A woman leaning on a wooden railing of a traditional Chinese building. She is wearing a blue cheongsam with pink and red floral motifs and a headdress made of colorful flowers, including roses and lilacs. Realistic painting style, focusing on the textural details of the clothing patterns and wooden buildings."
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"],
      "imageConfig": {
        "aspectRatio": "9:16"
      }
    }
  }' | python3 -c "
import sys, json, base64
data = json.load(sys.stdin)
parts = data['candidates'][0]['content']['parts']
for part in parts:
    if 'text' in part:
        print(part['text'])
    elif 'inlineData' in part:
        img = base64.b64decode(part['inlineData']['data'])
        with open('./output/gemini-3.1-flash-image-preview.png', 'wb') as f:
            f.write(img)
        print('Image saved to ./output/gemini-3.1-flash-image-preview.png')
"

Wersje modelu Nano Banana 2

Powody, dla których Nano Banana 2 posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.
Identyfikator modeluopisDostępnośćŻądanie
gemini-3.1-flash-imageZalecany, wskazujący na najnowszy model✅Gemini generuje obraz
gemini-3.1-flash-image-previewOficjalna wersja zapoznawcza✅Gemini generuje obraz