Jak w najlepszy sposób formułować polecenia dla Nano banana Pro?

CometAPI
AnnaNov 25, 2025
Jak w najlepszy sposób formułować polecenia dla Nano banana Pro?

Google uruchomiło Nano Banana Pro (model obrazu Gemini 3 Pro Image) 20 listopada 2025 r. To model generowania i edycji obrazów o wysokiej wierności, który usprawnia oryginalny Nano Banana dzięki znacznie lepszemu renderowaniu tekstu, głębszej wiedzy o świecie oraz obsłudze łączenia wielu obrazów referencyjnych (do 14). W tym artykule omówiono, czym jest ten model, czym różni się od Nano Banana, praktyczne techniki promptowania pozwalające uzyskać najlepsze rezultaty, wysokowydajne szablony promptów Server (z kodem i zastosowaniami), wskazówki dotyczące integracji oraz zalecenia związane z bezpieczeństwem i etyką.

Oficjalna usługa Google Nano Banana Pro jest obecnie bardzo przeciążona, szczególnie dla darmowych użytkowników, którzy mogą wygenerować tylko trzy generacje obrazów o niskiej rozdzielczości. Dobra wiadomość jest taka, że CometAPI w pełni zintegrowało Gemini 3 Pro Image( Nano Banana Pro) API, i można z niego korzystać tutaj tanio i bez ograniczeń.

Czym jest Nano Banana Pro?

Nano Banana Pro to profesjonalny model Google do generowania i edycji obrazów, zbudowany na Gemini 3 Pro Image. Został zaprojektowany do pracy wizualnej wymagającej wysokiej precyzji — infografik, makiet, złożonych edycji zdjęć, niezawodnego wielojęzycznego renderowania tekstu wewnątrz obrazów oraz wyników klasy studyjnej do 4K. Google pozycjonuje go jako model obrazu w „trybie myślenia” dla użytkowników, którzy potrzebują dokładności, wierności tekstu i rozumienia kontekstu podczas tworzenia lub edycji obrazów.

Najważniejsze możliwości w skrócie

  • Lepsze renderowanie tekstu wewnątrz obrazów (czytelny tekst wielojęzyczny, długie ciągi znaków).
  • Łączenie wielu obrazów: połączenie wielu obrazów źródłowych (raporty wspominają o nawet 14).
  • Spójność obiektów/postaci: zachowanie podobieństwa między obrazami (w notatkach premierowych wspomniano o maksymalnie 5 osobach).
  • Wysoka rozdzielczość wyjściowa i kontrola studyjna: kąt kamery, oświetlenie, gradacja kolorów, lokalne edycje obszarów, eksport 2K/4K.
  • Integracje: dostępny przez aplikację Gemini, Google AI Studio, CometAPI (dla deweloperów/przedsiębiorstw) oraz partnerstwa (np. integracje z Adobe odnotowane we wczesnych doniesieniach).

Jak Nano Banana Pro wypada w porównaniu z Nano Banana?

Jaka jest różnica techniczna?

  • Tryb i kompromisy: Nano Banana (Flash) jest zoptymalizowany pod kątem szybkości i iteracji (świetny do ideacji). Nano Banana Pro uruchamia proces „myślenia”, aby dopracować kompozycję i rozumowanie, generując mniej, ale wyższej jakości wyników, lepiej nadających się do produkcji.
  • Jakość tekstu: Pro znacząco poprawia renderowanie długich ciągów, akapitów i wielojęzycznych podpisów — co przed tą premierą było znaną słabością wielu modeli obrazowych.
  • Łączenie referencji: Pro obsługuje większą kompozycję wieloobrazową (do 14 referencji) i lepszą spójność postaci/osób między edycjami. Nano Banana Flash zwykle wykorzystywał mniej referencji.
  • Osadzenie w wiedzy: Pro ma lepszy dostęp do wiedzy o świecie i potrafi lepiej tworzyć faktycznie wiarygodne diagramy lub opatrzone adnotacjami infografiki.
  • Sterowanie edycją: Lokalne edycje obszarów, zmiany kamery, transformacje oświetlenia i wieloetapowe workflow edycyjne są bardziej dopracowane w Pro.

Co zmieniło się w pipeline prompt → wynik?

Tradycyjne modele obrazowe działają według schematu prompt → szum → odszumianie. Nano Banana Pro dodaje fazę reasoningu/„myślenia” (udostępnianą użytkownikom jako wybór trybu w interfejsie użytkownika i domyślnie wykorzystywaną w wywołaniach API o wyższej wierności). Oznacza to, że model może:

  • planować układ i typografię obrazów z osadzonym tekstem;
  • egzekwować ograniczenia faktograficzne tam, gdzie wymagane są diagramy lub wizualizacje z etykietami (np. mapy lub wizualizacje techniczne);
  • utrzymywać tożsamość i spójność postaci w wielu wygenerowanych kadrach lub połączonych źródłach.

W praktyce oznacza to dłuższe, ustrukturyzowane prompty, które dostarczają: (1) co ma zostać przedstawione, (2) ograniczenia i etykiety faktograficzne, (3) instrukcje dotyczące kompozycji oraz kamery/oświetlenia, a także (4) pożądaną treść tekstową i jej rozmieszczenie, jeśli występuje. Jeśli podasz tylko jedno krótkie zdanie, nadal uzyskasz ładne wyniki — ale stracisz korzyści płynące z etapu planowania.

Praktyczne implikacje dla twórców

  • Używaj Flash (Nano Banana) do szybkiego konceptowania, storyboardów i szkiców do mediów społecznościowych.
  • Używaj Pro, gdy potrzebujesz czytelnego tekstu na obrazie, dokładnych infografik, materiałów reklamowych lub końcowych renderów w wysokiej rozdzielczości, które mogą trafić do druku lub płatnych kampanii.

Jak promptować Nano Banana Pro, aby uzyskać najlepsze rezultaty?

Ponieważ Nano Banana Pro stawia na precyzję i kontrolę, Twoje prompty powinny być jednoznaczne, ale uporządkowane. Wykorzystaj mocne strony modelu: bogate instrukcje kontekstowe, ograniczenia dotyczące tekstu oraz prośby o spójny wygląd postaci.

Anatomia wysokiej jakości promptu dla Nano Banana Pro

Powtarzalna i skuteczna struktura promptu wygląda następująco:

  1. Cel / Deliverable: Jaki dokładnie materiał chcesz otrzymać? (np. „Plakat 2K na festiwal jazzowy”)
  2. Temat i kompozycja: Kto/co znajduje się w kadrze, jego poza, kąt kamery i proporcje kompozycji (np. „portret 3/4, półzbliżenie, obiekt wycentrowany, negatywna przestrzeń po prawej”).
  3. Parametry stylistyczne: Zdjęcie czy ilustracja, szczegóły obiektywu/kamery, nastrój, paleta kolorów, w razie potrzeby artyści referencyjni.
  4. Specyfikacja tekstu i typografii (jeśli dotyczy): Dokładne brzmienie, język, styl czcionki (np. „Nagłówek: ‘Autumn Jazz — Oct 15’, użyj pogrubionego skondensowanego bezszeryfowego kroju, białego na ciemnym tle.”)
  5. Ograniczenia i bezpieczeństwo: Wytyczne marki, ograniczenia faktograficzne dla infografik (np. „Nie wyświetlaj twarzy prawdziwej osoby poza dostarczonymi zasobami”).
  6. Szczegóły wyjściowe i edycje: Rozdzielczość, proporcje obrazu i wszelkie lokalne edycje (np. „Wyjście 2048×2048 PNG, dostosuj oświetlenie twarzy obiektu o +2 EV”).

Krótki szablon podsumowujący (uzupełnij tokeny):

. Temat: . Kompozycja: . Styl: . Tekst: . Ograniczenia: . Wynik: .

Przejrzystość promptu ma znaczenie — szczególnie dla tekstu w obrazie

Jeśli obraz ma zawierać tekst, określ:

  • dokładne znaki/sformułowanie (nie proś po prostu o „podpis”),
  • język oraz wszelkie znaki diakrytyczne,
  • rodzinę czcionek lub wskazówki stylistyczne (np. „skondensowana bezszeryfowa, wersaliki, kerning -1”),
  • dokładne umiejscowienie (np. „baner w dolnych 10%, wyrównanie do lewej”).

Renderowanie tekstu w Nano Banana Pro jest lepsze niż w poprzednich modelach, ale nadal korzysta z rygorystycznych, niemal maszynowych instrukcji typograficznych.

Jak zacząć korzystać z Nano Banana Pro?

Poniżej znajdują się uporządkowane kroki oraz praktyczne techniki pozwalające uzyskać niezawodny, wysokiej jakości wynik.

Krok 0 — Wybierz odpowiedni tryb

Użyj wyboru modelu Nano Banana Pro w Gemini/CometAPI / AI Studio („tryb myślenia” / gemini-3-pro-image lub gemini-3-pro-image-preview w zależności od interfejsu). Do eksperymentów możesz przełączyć się na model non-Pro w celu szybszych iteracji, a następnie sfinalizować pracę z Pro.

Krok 1 — Zacznij od celu, nie tylko od wyglądu (H3)

Napisz 1–2 zdania określające intencję: do czego służy ten obraz, kim są odbiorcy i jakie wrażenie ma wywoływać. Przykład:

Intent: Plakat promujący webinar climate-tech skierowany do menedżerów ds. zrównoważonego rozwoju w korporacjach — nowoczesny, wiarygodny, minimalistyczny, z wyraźnym miejscem na wielojęzyczny nagłówek.

Krok 2 — Nadaj strukturę: kompozycja, punkt skupienia i skala (H3)

Jasno określ układ i relację między tekstem a obrazem. Określ widok kamery, punkt skupienia i proporcje obrazu, jeśli potrzebujesz niestandardowego formatu. Przykład:

Composition: wycentrowany produkt na białej studyjnej powierzchni, oświetlenie trzyczwarte, miękki cień; lewa kolumna o szerokości 40% na nagłówek i listę punktowaną.

Krok 3 — Używaj precyzyjnych kotwic stylistycznych (H3)

Zamiast niejasnych przymiotników („cool” / „ładny”), używaj stylów referencyjnych: „wygląd filmu Kodak Portra 400”, „płaska dwukolorowa infografika wektorowa” lub „izometryczny render produktu 3D, kinowe światło kontrowe”. Kotwice zmniejszają niejednoznaczność.

Krok 4 — Podaj tekst dokładnie tak, jak ma zostać wyrenderowany (H3)

Ponieważ Nano Banana Pro jest szczególnie mocny w renderowaniu tekstu, uwzględnij dokładne ciągi znaków i pożądany styl czcionki:

Render the headline: "SUSTAINABLE FUTURES" in bold condensed sans, all caps, 48 pt, kerning -5%, color #0B3D91.

Krok 5 — Dostarczaj zasoby i maski do edycji

W przypadku image-to-image lub lokalnych edycji przesyłaj czyste obrazy źródłowe i wyraźne maski w miejscach, które mają zostać zmienione — oznacz je np.: mask_replace_logo.png z instrukcjami replace. Nano Banana Pro obsługuje edycje wieloobrazowe i blending; uporządkowane dane wejściowe poprawiają przewidywalność.

Krok 6 — Poproś o ślad rozumowania modelu, gdy to istotne (H3)

Jeśli potrzebujesz, aby model „rozumował” na temat decyzji dotyczących układu lub wyborów tłumaczeniowych (np. różnic długości tekstu w lokalizacji), poproś o krótki opis przyjętego podejścia:

Explain: Nadaj priorytet czytelności przy tłumaczeniu na hiszpański i niemiecki; jeśli nagłówek się nie mieści, zmniejsz rozmiar czcionki maksymalnie o 12% i zwiększ interlinię.

Jakie są zaawansowane triki i szablony promptowania?

„Few-shot” chaining stylu wizualnego

Dostarcz 2–3 krótkie przykłady odniesień stylistycznych (jako opisy tekstowe lub przesłane obrazy), aby ukierunkować model na spójną estetykę w całym zestawie materiałów.

Szablon

Style examples: 1) "Polaroid, high-contrast vintage", 2) "Minimalist flat icons", 3) "HDR cinematic". Use #2 for this infographic, preserve flat iconography and two-tone palette.

Prompty „constrained transformation” do edycji

Jeśli edytujesz istniejące zdjęcie, stosuj precyzyjne instrukcje edycji:

Edit: replace sky with dusk gradient (orange→indigo), keep subject exposure constant, add soft rim light, increase saturation of jacket by 10%. Preserve EXIF camera metadata.

Precyzja instrukcji edycji zmniejsza liczbę iteracji potrzebnych do uzyskania materiału gotowego do produkcji.

Wzorzec „Infographic with factual labels” — dla wykresów, diagramów, map

Dlaczego działa: musisz podać jednoznaczne etykiety i ograniczenia, aby model mógł poprawnie renderować tekst oraz relacje przestrzenne.

Szablon

Create an infographic showing solar panel energy flow:
- Top: title "Solar Energy Flow"
- Left: sun icon with arrow to panel labeled "Insolation (kWh/m²)"
- Middle: solar panel illustration with callouts for "PV cells", "Inverter"
- Right: house icon labeled "Consumption (kWh/day)"
- Color palette: cool blues/greens, flat icons, legible labels, use metric units.

Wzorzec „Multi-image blend / character consistency”

Dlaczego działa: poinformuj model, że oczekujesz spójnego wyglądu w wielu referencjach, i podaj cechy postaci.

Szablon

Blend three reference photos into a single scene: character A (brown hair, scar on left eyebrow, worn leather jacket), character B (short curly hair, glasses). Keep consistent facial features across all deliverables; place both characters at table, mid-shot, warm tungsten lighting.

Zaawansowane wskazówki — typowe problemy i rozwiązania

Problem: nakładki tekstowe wyglądają źle

Rozwiązania: Podawaj dokładne ciągi znaków, określ rodzinę i rozmiar czcionki, poproś model o „dokładne wyrenderowanie tekstu” i dodaj instrukcje awaryjne (np. „jeśli nagłówek się nie mieści, zmniejsz go równomiernie o 10%”). Przy edycji obrazów używaj masek dla obszarów tekstowych.

Problem: niespójność postaci

Rozwiązania: Dostarcz wyraźny zestaw obrazów referencyjnych, używaj identyfikatorów lub tokenów obiektów, jeśli są obsługiwane, i dodawaj precyzyjne kotwice opisowe („długość włosów, pieprzyk, kolczyk”) zamiast ogólnych opisów.

Problem: nieoczekiwane artefakty przy dużym powiększeniu

Rozwiązania: Zażądaj wyższego samplingu wewnętrznego (jeśli API udostępnia kontrolę samplingu/guidance), poproś o 2–3 warianty i wybierz najlepszy albo renderuj w wyższej rozdzielczości pikselowej i zmniejsz obraz w postprodukcji.

Problem: zbyt wiele sprzecznych ograniczeń

Rozwiązania: Ustal priorytety: wskaż jeden główny cel (np. czytelność > ultrafotorealizm) i pozwól modelowi optymalizować właśnie pod tym kątem.

Podsumowanie

Nano Banana Pro to generacyjny krok naprzód w zadaniach wymagających połączenia wierności tekstu, przemyślanego układu i studyjnych narzędzi edycyjnych. Niezależnie od tego, czy tworzysz główne obrazy kampanii, przygotowujesz bardzo czytelne infografiki, czy wykonujesz zaawansowane inpainting i edycję zdjęć, nowy model zmniejsza dystans między briefem kreatywnym a materiałami gotowymi do produkcji. Kluczem do sukcesu jest ustrukturyzowane promptowanie, iteracja progresywna oraz integracja pochodzenia i wersjonowania z pipeline’em zasobów.

Deweloperzy mogą uzyskać dostęp do Gemini 3 Pro Image( Nano Banana Pro) API za pośrednictwem CometAPI. Aby rozpocząć, poznaj możliwości modelu CometAPI w Playground i zapoznaj się z przewodnikiem API, aby uzyskać szczegółowe instrukcje. Przed uzyskaniem dostępu upewnij się, że jesteś zalogowany do CometAPI i masz pobrany klucz API. CometAPI oferuje cenę znacznie niższą od oficjalnej, aby pomóc Ci we wdrożeniu.

Gotowy, aby zacząć?→ Zarejestruj się w CometAPI już dziś !

Jeśli chcesz poznać więcej porad, przewodników i aktualności o AI, obserwuj nas na VKX i Discord!

Dostęp do najlepszych modeli po niskich kosztach

Czytaj więcej