Can Gemini 3 Pro Image generate 4K resolution images?

Tak, Nano Banana Pro (Gemini 3 Pro Image) obsługuje natywną generację w rozdzielczości do 4K z proporcjami obrazu, w tym 1:1, 3:2, 16:9, 9:16 i 21:9. Obsługuje także presety 1K i 2K za pośrednictwem parametru imageConfig.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro oferuje zaawansowane renderowanie tekstu w obrębie obrazów z wyraźnym, czytelnym wsparciem dla wielojęzycznego tekstu — od krótkich podpisów po długie akapity. Dzięki temu idealnie nadaje się do plakatów, infografik, makiet UI i materiałów marketingowych.

Can I edit images conversationally with Gemini 3 Pro Image?

Tak, Nano Banana Pro obsługuje wieloetapową edycję konwersacyjną. Wystarczy poprosić o zmiany, takie jak 'Zmień tło na zachód słońca', a model zachowuje kontekst wizualny między turami dzięki Thought Signatures.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro wyróżnia się iteracyjną autokorektą, spójnym zachowaniem postaci w wielu edycjach oraz ścisłą integracją z ekosystemem Google. Obsługuje do 14 obrazów referencyjnych w złożonych przepływach pracy łączenia wielu obrazów.

Does Nano Banana Pro use Google Search for grounded image generation?

Tak, Nano Banana Pro może korzystać z Search grounding, aby zweryfikować fakty przed generowaniem obrazów. Na przykład może pobrać bieżące dane pogodowe, aby stworzyć dokładną infografikę pogody w Tokio.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro obsługuje do 14 obrazów wejściowych w ramach jednego promptu, z maksymalnie 7MB na obraz. Utrzymuje spójność tematu i postaci dla maksymalnie 5 postaci w złożonych scenariuszach łączenia wielu obrazów.

Przystępne cenowo API Nano Banana Pro | text-to-image

Podstawowe funkcje

Tekst → Obraz: pełna generacja sterowana promptem z wysoką zgodnością z poleceniem.
Obraz → Obraz (edytowanie): precyzyjne, ukierunkowane poprawki przy zachowaniu spójności postaci/bohatera w wielu edycjach.
Maksymalna rozdzielczość wyjściowa: do 4K (przykłady i obsługiwane dokładne rozmiary w pikselach zależą od proporcji; API udostępnia presety 1K/2K/4K)
Planowanie iteracyjne i autokorekta: wewnętrzny „wieloetapowy” pipeline, który wykrywa i koryguje typowe błędy wizualne (perspektywa, tekst, drobna geometria).
Zaawansowane renderowanie tekstu w obrazie: wyraźny, czytelny tekst wielojęzyczny (od krótkich podpisów po długie akapity) odpowiedni do plakatów, makiet i infografik.
5 postaci oraz wierność dla maksymalnie 14 obiektów/obrazów referencyjnych w jednym przebiegu.
Znakowanie wodne / pochodzenie: wszystkie generowane obrazy zawierają znak wodny SynthID; model osadza metadane C2PA dotyczące pochodzenia w niektórych integracjach produktowych.

Wersje i nazewnictwo Gemini 3 Pro Image

gemini-3-pro-image-preview
gemini-3-pro-image

Dane techniczne

Architektura

Pochodzenie / backbone: Nano Banana Pro jest zbudowany na ewoluującym stosie obrazowym Google Gemini — konkretnie na nowej architekturze Gemini 3 Pro Image / GEMPIX 2 (model multimodalny obraz+tekst o wyższej pojemności). To ewolucja z Gemini 2.5 Flash Image (oryginalne „nano-banana”) do natywnie multimodalnego modelu obrazowego z rozszerzonymi zdolnościami rozumowania wizualno-językowego.
Zachowanie modelu: natywna multimodalność (obraz + tekst + wiedza o świecie), jawne pipeline’y do fuzji wielu obrazów oraz wewnętrzny planista etapowy, który udoskonala wyniki w wielu przebiegach zamiast tworzyć pojedynczą statyczną próbkę. Wczesne relacje wskazują na silniejsze rozumienie geometrii/optyki (szkło, refrakcja) względem poprzednich wersji.
Myślenie / wewnętrzne dopracowanie: model używa widocznego procesu „myślenia” wewnętrznie do dopracowania kompozycji (API dokumentuje to zachowanie i zaznacza, że te wewnętrzne kroki nie są naliczane jako końcowe tokeny obrazowe).
Grounding i narzędzia: obsługuje Search grounding (może włączać fakty z sieci do generowania diagramów/infografik). Wspiera także instrukcje systemowe dla bardziej deterministycznej kontroli.

Kluczowe parametry API:

thinking_level (low / high) do równoważenia opóźnienia względem głębokości rozumowania;
media_resolution (low/medium/high) do kontrolowania tokenów OCR/szczegółów odczytu obrazu;
generationConfig.imageConfig do kontrolowania proporcji/rozdzielczości w obrazach wyjściowych.

Limity obrazów:

Obsługiwane tryby wejścia: Tekst i obrazy (model nie akceptuje audio ani wideo jako wejść do generowania obrazów).
Maks. liczba obrazów na prompt: 14 (dla podglądu Gemini 3 Pro Image).
Maks. rozmiar obrazu (upload): 7 MB na obraz wejściowy.
Obsługiwane proporcje: 1:1, 3:2, 16:9, 9:16, 21:9 itd.

Obrazy wyjściowe / tokeny: wysokie limity, z obsługą 4K/4096 px.

Wydajność w benchmarkach

Krótko: publiczne/wczesne benchmarki są głównie jakościowe/społecznościowe, ale konsekwentnie raportują istotne poprawy rozdzielczości, redukcji artefaktów i zgodności fizycznej względem oryginalnego nano-banana (Gemini 2.5 Flash Image). Konkretne „wyzwania” nazwane z nazwy wykazały wyraźne zyski wizualne, lecz nie ma jeszcze publicznych, ustandaryzowanych tabel liczbowych od Google porównujących v1 → v2 na standardowych metrykach generowania obrazów.

Jakościowe testy społeczności: czystsze krawędzie, ostrzejsze mikroszczegóły, wierniejsze kolory i lepsza zgodność z promptem (mniej halucynowanych rekwizytów, bardziej spójne postacie). Popularne nieformalne testy to tzw. „Wine Glass Test” i „Glass Burger Challenge”, gdzie GEMPIX2 (Nano Banana Pro) znacznie lepiej radzi sobie z przezroczystością i refrakcją niż wcześniejsze wydania.
Obsługa tekstu: Nano Banana Pro wykazuje widocznie ulepszoną typografię i rozmieszczanie tekstu w obrazach (trwała słabość wielu modeli obrazowych). Porównania społeczności wskazują na mniej zniekształconych glifów.
Przepustowość / UX: szybsza iteracja i zaplecze wykonujące wieloetapowe dopracowanie, dzięki czemu użytkownicy widzą bardziej wiarygodne wyniki już w pierwszym przebiegu (mniej ręcznych powtórzeń).

Ograniczenia i ryzyka

Filtry treści i detekcja: platformy integrujące model (np. Whisk/aplikacje zewnętrzne) mogą włączać restrykcyjną detekcję celebrytów lub podobizn i blokować określone wyniki, co wpływa na kreatywne przepływy pracy polegające na realistycznych podobiznach celebrytów.
Halucynacje / trudne przypadki rozumowania: mimo ulepszeń model może wciąż tworzyć fizycznie nierealistyczne artefakty, zwłaszcza przy gęstym symbolicznym tekście w obrazach lub wysoko technicznych diagramach — choć NB2 zdaje się ograniczać te błędy względem wcześniejszych wersji.
Bezpieczeństwo i nadużycia: generatywne modele obrazowe mogą być wykorzystywane do problematycznych lub szkodliwych treści. Google stosuje ograniczenia, filtry treści oraz znak wodny SynthID w celu weryfikacji pochodzenia; niemniej do nadużyć dochodziło (głośny incydent związany z obrazem Nano Banana w politycznie wrażliwym kontekście).

Jak Nano Banana Pro wypada na tle innych modeli

Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — silna integracja mobilna, fuzja wielu obrazów, iteracyjna autokorekta, natywne 2K/skalowanie do 4K, ścisła integracja z aplikacjami Google (Search, Photos, Workspace/Gemini). Najlepszy do przepływów wymagających niezawodnych edycji, ciągłości i integracji z usługami Google.
Midjourney — doskonały do stylizowanych, artystycznych efektów i inżynierii promptów napędzanej społecznością; zazwyczaj nie jest ukierunkowany na foto-realistyczną fuzję wielu obrazów ani głębokie multimodalne pipeline’y edycyjne.
Stable Diffusion / open weights — w pełni otwarty, wysoko konfigurowalny i możliwy do hostowania lokalnie; ekosystem checkpointów i fine-tuningu to decydująca przewaga dla badań i pracy offline. Mniej „jednoklikowej” integracji mobilnej i mniej spójnej koherencji edycji wielu obrazów „z pudełka” niż Nano Banana Pro.
Seedream 4.0 (ByteDance) — ostatnio pozycjonowany wprost jako konkurent Nano Banana, podkreślający ultraszybkie renderowanie, wyjścia 2K i wsparcie wielu obrazów referencyjnych (do sześciu). Pozycjonowany jako alternatywa pro/creator.

(Te porównania są wysokopoziomowe; wybierz zwycięzcę, dopasowując narzędzie do swojego workflow: otwartość/konfigurowalność → Stable Diffusion; stylizowana sztuka → Midjourney; zintegrowana, spójna edycja mobilna z agresywną iteracją → rodzina Nano Banana Pro/Gemini 3 Pro Image.)

Zastosowania w praktyce

Mobilna edycja zdjęć i kreatywne filtry (integracje z Google Photos — restylizacja, łączenie tła, rekadrowanie portretów).
Zasoby marketingowe i reklamowe — szybkie tworzenie koncepcji, spójne postacie marki w wielu kadrach/kątach.
Concept art i storyboardy — fuzja wielu obrazów pomaga zachować ciągłość postaci między panelami.
E-commerce / mockupy produktów — generowanie spójnych ujęć produktów w różnych kontekstach/warunkach oświetleniowych.
Szybkie prototypowanie zasobów AR/VR — wysokiej jakości wyjścia 2K/4K, które można skalować dla immersyjnych zastosowań.
Jak uzyskać dostęp do API gemini-3-pro-image (Nano Banana Pro)

Wymagane kroki

Zaloguj się na cometapi.com. Jeśli nie jesteś jeszcze naszym użytkownikiem, zarejestruj się najpierw
Uzyskaj klucz API dostępu do interfejsu. Kliknij „Add Token” w sekcji API token w centrum osobistym, pobierz klucz tokena: sk-xxxxx i zatwierdź.
Pobierz adres URL tej witryny: https://api.cometapi.com/

Sposób użycia

Wybierz endpoint „gemini-3-pro-image”, aby wysłać żądanie do API i ustaw treść żądania. Metodę żądania i treść żądania znajdziesz w dokumentacji API na naszej stronie. Dla wygody nasza strona udostępnia także test w Apifox.
Zastąp <YOUR_API_KEY> swoim rzeczywistym kluczem CometAPI z konta.
Wstaw swoje pytanie lub prośbę w pole content — na to odpowie model.
. Przetwórz odpowiedź API, aby uzyskać wygenerowaną odpowiedź.

CometAPI zapewnia w pełni kompatybilne REST API — dla płynnej migracji. Kluczowe szczegóły :

Adres bazowy: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
Nazwy modeli: gemini-3-pro-image
Uwierzytelnianie: Bearer YOUR_CometAPI_API_KEY header
Content-Type: application/json

Cennik dla Nano Banana Pro

Poznaj konkurencyjne ceny dla Nano Banana Pro, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak Nano Banana Pro może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.

nano-banana-pro（image）

variant / alias	Price
gemini-3-pro-image (1K/2K)	≈ $0.10720
gemini-3-pro-image (4K)	≈ $0.19200
gemini-3-pro-image-preview (1K/2K)	≈ $0.10720
gemini-3-pro-image-preview (4K)	≈ $0.19200
nano-banana-pro-all	$0.09600

Przykładowy kod i API dla Nano Banana Pro

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla Nano Banana Pro, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał Nano Banana Pro w Twoich projektach.

Python
JavaScript
Curl

from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Python Code Example

from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

JavaScript Code Example

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
import * as path from "node:path";
import { fileURLToPath } from "node:url";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const COMETAPI_KEY = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const BASE_URL = "https://api.cometapi.com";

const __filename = fileURLToPath(import.meta.url);
const __dirname = path.dirname(__filename);

async function main() {
  const ai = new GoogleGenAI({
    apiKey: COMETAPI_KEY,
    httpOptions: { baseUrl: BASE_URL },
  });

  const prompt =
    "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English.";
  const aspectRatio = "1:1"; // "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
  const resolution = "4K"; // "1K", "2K", "4K"

  const response = await ai.models.generateContent({
    model: "gemini-3-pro-image-preview",
    contents: prompt,
    config: {
      responseModalities: ["TEXT", "IMAGE"],
      imageConfig: {
        aspectRatio: aspectRatio,
        imageSize: resolution,
      },
    },
  });

  // Output directory
  const outputDir = path.join(__dirname, "..", "output");
  if (!fs.existsSync(outputDir)) {
    fs.mkdirSync(outputDir, { recursive: true });
  }

  for (const part of response.candidates[0].content.parts) {
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const outputPath = path.join(outputDir, "butterfly_4k.png");
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync(outputPath, buffer);
      console.log(`Image saved to: ${outputPath}`);
    }
  }
}

main();

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here

# Output directory
SCRIPT_DIR="$(cd "$(dirname "$0")" && pwd)"
OUTPUT_DIR="$SCRIPT_DIR/../output"
mkdir -p "$OUTPUT_DIR"

curl -s -X POST \
  "https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent" \
  -H "x-goog-api-key: $COMETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."}]}],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {"aspectRatio": "1:1", "imageSize": "4K"}
    }
  }' | jq -r '.candidates[0].content.parts[] | select(.inlineData) | .inlineData.data' | head -1 | base64 --decode > "$OUTPUT_DIR/butterfly_4k.png"

echo "Image saved to: $OUTPUT_DIR/butterfly_4k.png"

Wersje modelu Nano Banana Pro

Powody, dla których Nano Banana Pro posiada wiele migawek, mogą obejmować takie czynniki jak: różnice w wynikach po aktualizacjach wymagające starszych migawek dla zachowania spójności, zapewnienie programistom okresu przejściowego na adaptację i migrację, oraz różne migawki odpowiadające globalnym lub regionalnym punktom końcowym w celu optymalizacji doświadczenia użytkownika. Aby poznać szczegółowe różnice między wersjami, zapoznaj się z oficjalną dokumentacją.

Identyfikator modelu	Opis	Dostępność	Żądanie
nano-banana-pro-all	Używana technologia jest nieoficjalna, a generowanie jest niestabilne itp., format Chat	✅	Chat format
gemini-3-pro-image	Zalecany, wskazuje na najnowszy model	✅	Gemini — generowanie obrazu
gemini-3-pro-image-preview	Oficjalna wersja poglądowa	✅	Gemini — generowanie obrazu