Home/Models/Google/Nano Banana Pro
G

Nano Banana Pro

Masukan:$1.5616/M
Keluaran:$9.3696/M
Nano Banana Pro adalah model AI untuk asistensi serbaguna dalam alur kerja yang berfokus pada teks. Model ini cocok untuk prompting bergaya instruksi guna menghasilkan, mentransformasi, dan menganalisis konten dengan struktur yang dapat dikendalikan. Penggunaan umum mencakup asisten percakapan, peringkasan dokumen, tanya jawab pengetahuan, dan otomatisasi alur kerja. Rincian teknis publik terbatas; integrasinya selaras dengan pola umum asisten AI seperti output terstruktur, prompt yang diperkuat dengan retrieval, serta pemanggilan alat atau fungsi.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Fitur dasar

  • Teks → Gambar: pembuatan berbasis prompt penuh dengan kepatuhan kuat terhadap prompt.
  • Gambar → Gambar (penyuntingan): edit yang halus dan terarah dengan konsistensi subjek/karakter yang terjaga di banyak penyuntingan.
  • Resolusi keluaran maksimum: hingga 4K (contoh dan ukuran piksel tepat yang didukung bergantung pada rasio aspek; API menyediakan prasetel 1K/2K/4K)
  • Perencanaan iteratif & koreksi mandiri: pipeline internal “multi-tahap” yang mendeteksi dan mengoreksi kesalahan visual umum (perspektif, teks, geometri halus).
  • Perenderan teks canggih di dalam gambar: teks multi-bahasa yang jelas dan terbaca (dari caption pendek hingga paragraf panjang) cocok untuk poster, mockup, dan infografik.
  • 5 karakter dan kesetiaan hingga 14 objek/gambar referensi dalam satu alur kerja.
  • Tanda air / asal-usul: semua gambar yang dihasilkan menyertakan tanda air SynthID; model menyematkan metadata C2PA untuk asal-usul di beberapa integrasi produk.

Versi & penamaan Gemini 3 Pro Image

  • gemini-3-pro-image-preview
  • gemini-3-pro-image

Detail teknis

Arsitektur

  • Lini / backbone: Nano Banana Pro dibangun di atas tumpukan gambar Gemini yang terus berkembang milik Google — khususnya arsitektur baru Gemini 3 Pro Image / GEMPIX 2 (kerangka multimodal gambar+teks berkapasitas lebih tinggi). Itu adalah evolusi dari Gemini 2.5 Flash Image (asal “nano-banana”) menjadi model gambar yang secara native multimodal dengan kemampuan penalaran visi-bahasa yang diperluas.
  • Perilaku model: multimodalitas bawaan (gambar + teks + pengetahuan dunia), pipeline eksplisit untuk penggabungan multi-gambar, dan perencana bertahap internal yang menyempurnakan keluaran melalui beberapa lintasan alih-alih menghasilkan sampel statis tunggal. Laporan awal menunjukkan penalaran geometrik/optik yang lebih kuat (kaca, pembiasan) dibanding versi sebelumnya.
  • “Berpikir” / penyempurnaan internal: Model menggunakan proses “berpikir” yang terlihat secara internal untuk menyempurnakan komposisi (API mendokumentasikan perilaku ini dan mencatat langkah internal tersebut tidak ditagihkan sebagai token gambar final).
  • Grounding & alat: Mendukung Search grounding (dapat menggabungkan fakta web ke pembuatan diagram/infografik). Juga mendukung instruksi sistem untuk kontrol yang lebih deterministik.

Parameter API kunci:

  • thinking_level (rendah / tinggi) untuk menyeimbangkan latensi vs kedalaman penalaran;
  • media_resolution (rendah/sedang/tinggi) untuk mengontrol token pembacaan OCR/detail gambar;
  • generationConfig.imageConfig untuk mengontrol rasio aspek/resolusi pada keluaran gambar.

Batas gambar:

  • Modalitas input yang didukung: Teks dan gambar (model tidak menerima audio atau video sebagai input pembuatan gambar).
  • Maks gambar per prompt: 14 (untuk pratinjau Gemini 3 Pro Image).
  • Ukuran gambar maksimum (unggah): 7 MB per gambar input.
  • Rasio aspek yang didukung: 1:1, 3:2, 16:9, 9:16, 21:9, dll.

Gambar keluaran / token: batas tinggi, dengan dukungan 4K/4096px.

Performa benchmark

Ringkasan singkat: benchmark publik/awal sejauh ini sebagian besar bersifat kualitatif/berbasis komunitas, tetapi secara konsisten melaporkan peningkatan resolusi, pengurangan artefak, dan kesetiaan fisik dibandingkan nano-banana asli (Gemini 2.5 Flash Image). “Tantangan” bernama tertentu menunjukkan peningkatan visual yang jelas, namun saat ini belum ada tabel benchmark numerik terstandar (publik) dari Google yang membandingkan v1 → v2 di seluruh metrik pembuatan gambar standar.

  • Uji komunitas kualitatif: Tepi lebih bersih, detail mikro lebih tajam, warna lebih akurat, dan kepatuhan terhadap prompt lebih setia (lebih sedikit properti terhalusinasi, karakter lebih konsisten). Perbandingan informal populer termasuk “Wine Glass Test” dan “Glass Burger Challenge”, di mana GEMPIX2 (Nano Banana Pro) menangani transparansi dan pembiasan secara signifikan lebih baik daripada build sebelumnya.
  • Penanganan teks: Nano Banana Pro menunjukkan tipografi dan penempatan teks yang terlihat meningkat di dalam gambar (kelemahan yang persisten bagi banyak model gambar). Perbandingan komunitas menunjukkan lebih sedikit glyph yang dirender kacau.
  • Laju pemrosesan / UX: kecepatan iterasi lebih cepat dan UX yang melakukan penyempurnaan multi-tahap di backend sehingga pengguna melihat hasil putaran pertama yang lebih andal (mengurangi pengulangan manual).

Keterbatasan & risiko

  • Filter konten & deteksi: Platform yang mengintegrasikan model (misalnya, Whisk/aplikasi pihak ketiga) dapat mengaktifkan deteksi selebritas atau kemiripan yang ketat dan memblokir keluaran tertentu, yang mempengaruhi alur kerja kreatif yang bergantung pada kemiripan selebritas realistis.
  • Halusinasi / kasus tepi penalaran: meski meningkat, model masih dapat menghasilkan artefak yang secara fisik tidak realistis, terutama dengan teks simbolik padat di dalam gambar atau diagram teknis tingkat tinggi — meskipun NB2 tampak mengurangi kesalahan ini dibandingkan versi sebelumnya.
  • Keamanan & penyalahgunaan: model gambar generatif dapat digunakan untuk membuat konten bermasalah atau berbahaya. Google menerapkan pembatasan, filter konten, dan tanda air SynthID untuk membantu asal-usul; namun demikian, penyalahgunaan telah terjadi (kontroversi berprofil tinggi terkait gambar yang dihasilkan Nano Banana dalam konteks yang sensitif secara politik).

Perbandingan Nano Banana Pro dengan model lain

  • Nano Banana Pro (GEMPIX 2 / Gemini 3 Pro Image) — integrasi seluler yang kuat, penggabungan multi-gambar, koreksi mandiri iteratif, 2K native/peningkatan ke 4K, terintegrasi erat ke aplikasi Google (Search, Photos, Workspace/Gemini). Terbaik untuk alur kerja yang membutuhkan edit andal, kontinuitas, dan integrasi dengan layanan Google.
  • Midjourney — unggul dalam keluaran artistik bergaya dan rekayasa prompt berbasis komunitas; biasanya tidak ditargetkan pada penggabungan multi-gambar yang akurat secara foto atau pipeline penyuntingan multimodal mendalam.
  • Stable Diffusion / bobot terbuka — sepenuhnya terbuka, sangat dapat disesuaikan, dan dapat di-host secara lokal; ekosistem checkpoint dan fine-tuning adalah keunggulan tegas untuk riset dan penggunaan luring. Lebih sedikit integrasi seluler sekali klik dan koherensi penyuntingan multi-gambar yang konsisten “siap pakai” dibanding Nano Banana Pro.
  • Seedream 4.0 (ByteDance) — baru-baru ini diposisikan secara eksplisit sebagai pesaing Nano Banana, menekankan perenderan sangat cepat, keluaran 2K, dan dukungan banyak gambar referensi (hingga enam). Diposisikan sebagai alternatif untuk profesional/kreator.

(Perbandingan ini tingkat tinggi; pilih yang “terbaik” dengan mencocokkan alat ke alur kerja Anda: keterbukaan/dapat disesuaikan → Stable Diffusion; seni bergaya → Midjourney; penyuntingan seluler terintegrasi dan konsisten dengan iterasi agresif → keluarga Nano Banana Pro/Gemini 3 Pro Image.)

Kasus penggunaan dunia nyata

  • Penyuntingan foto seluler & filter kreatif (integrasi Google Photos — restyling, penggabungan latar belakang, rekonstruksi potret).
  • Aset pemasaran & iklan — pembuatan konsep cepat, karakter brand konsisten di banyak frame/sudut.
  • Seni konsep & pembuatan papan cerita — penggabungan multi-gambar membantu menjaga kontinuitas karakter antar panel.
  • E-commerce / mockup produk — menghasilkan foto produk konsisten dalam berbagai konteks/kondisi pencahayaan.
  • Prototyping cepat untuk aset AR/VR — keluaran 2K/4K berkualitas tinggi yang dapat di-upscale untuk penggunaan imersif.
  • Cara mengakses API gemini-3-pro-image(Nano Banana Pro)

Langkah yang diperlukan

  • Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu
  • Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada API token di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
  • Dapatkan URL situs ini: https://api.cometapi.com/

Metode penggunaan

  1. Pilih endpoint “gemini-3-pro-image” untuk mengirim permintaan API dan atur badan permintaan. Metode permintaan dan badan permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda.
  2. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
  3. Masukkan pertanyaan atau permintaan Anda ke bidang konten—ini yang akan direspons oleh model.
  4. . Proses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang mulus. Rincian utama :

  • Base URL: https://api.cometapi.com/v1beta/models/gemini-3-pro-image-preview:generateContent
  • Model Names: gemini-3-pro-image
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

FAQ

Can Gemini 3 Pro Image generate 4K resolution images?

Yes, Nano Banana Pro (Gemini 3 Pro Image) supports native output up to 4K resolution with aspect ratios including 1:1, 3:2, 16:9, 9:16, and 21:9. It also supports 1K and 2K presets via the imageConfig parameter.

How does Nano Banana Pro handle text rendering inside images?

Nano Banana Pro features advanced in-image text rendering with clear, legible multi-language text support—from short captions to long paragraphs. This makes it ideal for posters, infographics, UI mockups, and marketing assets.

Can I edit images conversationally with Gemini 3 Pro Image?

Yes, Nano Banana Pro supports multi-turn conversational editing. Simply ask for changes like 'Make the background a sunset' and the model maintains visual context through Thought Signatures between turns.

What makes Nano Banana Pro different from FLUX 2 Pro or Midjourney?

Nano Banana Pro excels at iterative self-correction, consistent character preservation across multiple edits, and tight Google ecosystem integration. It handles up to 14 reference images for complex multi-image fusion workflows.

Does Nano Banana Pro use Google Search for grounded image generation?

Yes, Nano Banana Pro can use Search grounding to verify facts before generating images. For example, it can fetch current weather data to create an accurate Tokyo weather infographic.

How many reference images can Nano Banana Pro process in one request?

Nano Banana Pro supports up to 14 input images per prompt with a maximum of 7MB per image. It maintains subject and character consistency across up to 5 characters in complex multi-image fusion scenarios.

Fitur untuk Nano Banana Pro

Jelajahi fitur-fitur utama dari Nano Banana Pro, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Nano Banana Pro

Jelajahi harga kompetitif untuk Nano Banana Pro, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Nano Banana Pro dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.

nano-banana-pro(image)

variant / aliasPrice
gemini-3-pro-image (1K/2K)≈ $0.10720
gemini-3-pro-image (4K)≈ $0.19200
gemini-3-pro-image-preview (1K/2K)≈ $0.10720
gemini-3-pro-image-preview (4K)≈ $0.19200
nano-banana-pro-all$0.09600

Kode contoh dan API untuk Nano Banana Pro

Akses kode sampel komprehensif dan sumber daya API untuk Nano Banana Pro guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Nano Banana Pro dalam proyek Anda.
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL, "timeout": 600000},
    api_key=COMETAPI_KEY,
)

prompt = "Da Vinci style anatomical sketch of a dissected Monarch butterfly. Detailed drawings of the head, wings, and legs on textured parchment with notes in English."
aspect_ratio = "1:1"  # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9"
resolution = "4K"  # "1K", "2K", "4K"

response = client.models.generate_content(
    model="gemini-3-pro-image-preview",
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=["TEXT", "IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
            image_size=resolution,
        ),
    ),
)

# Output directory
OUTPUT_DIR = os.path.join(os.path.dirname(__file__), "..", "output")
os.makedirs(OUTPUT_DIR, exist_ok=True)

for part in response.parts:
    if part.text is not None:
        print(part.text)
    elif image := part.as_image():
        output_path = os.path.join(OUTPUT_DIR, "butterfly_4k.png")
        image.save(output_path)
        print(f"Image saved to: {output_path}")

Versi Nano Banana Pro

Alasan Nano Banana Pro memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
ID modelDeskripsiKetersediaanPermintaan
nano-banana-pro-allTeknologi yang digunakan tidak resmi dan generasinya tidak stabil, dll, Chat format✅Chat format
gemini-3-pro-imageDirekomendasikan, mengarah ke model terbaru✅Gemini menghasilkan gambar
gemini-3-pro-image-previewPratinjau Resmi✅Gemini menghasilkan gambar

Model Lainnya