Bagaimana Cara Menggunakan Nano Banana melalui API?(Gemini-2-5-flash-image)

CometAPI
AnnaDec 10, 2025
Bagaimana Cara Menggunakan Nano Banana melalui API?(Gemini-2-5-flash-image)

Nano Banana adalah nama panggilan komunitas (dan singkatan internal) untuk Google Gambar Flash Gemini 2.5 — model pembuatan + penyuntingan gambar multimoda berkualitas tinggi dan latensi rendah. Panduan berformat panjang ini (dengan kode, pola, langkah-langkah penerapan, dan contoh CometAPI) menunjukkan tiga metode panggilan praktis yang dapat Anda gunakan dalam produksi: (1) antarmuka Obrolan yang kompatibel dengan OpenAI (teks→gambar), (2) antarmuka resmi Google generateContent antarmuka teks→gambar, dan (3) resmi Google generateContent Antarmuka gambar→gambar menggunakan input/output Base64. Sepanjang panduan ini, Anda akan mendapatkan saran distribusi/penerapan langkah demi langkah, pengaturan lingkungan, cara mendapatkan operasi API dari CometAPI, catatan harga & tanda air, serta kiat terbaik untuk hasil yang andal dan hemat biaya.

Apa itu Nano Banana (Gambar Flash Gemini 2.5)?

Nano Banana adalah nama informal yang diberikan untuk Gemini 2.5 Flash Image, model gambar terbaru Google dalam keluarga Gemini. Dirancang untuk menghasilkan gambar fotorealistik dan pengeditan gambar presisi (pengeditan lokal, penggabungan multi-gambar, pelestarian karakter yang konsisten di seluruh pengeditan), Nano Banana tersedia melalui Google Gemini API, Google AI Studio, dan Vertex AI. Model ini dilengkapi dengan tanda air SynthID yang tidak terlihat untuk memastikan keasliannya.

Mengapa hal ini penting bagi pengembang: Nano Banana memberi Anda model multi-moda tunggal berkualitas tinggi yang dapat menangani:

  • Teks → Gambar (membuat gambar baru dari teks petunjuk)
  • Gambar → Gambar (edit/ubah foto yang disediakan)
  • Pencampuran multi-gambar (menggabungkan beberapa gambar menjadi satu komposit)
    Semua ini dapat diakses melalui situs resmi Google generateContent titik akhir (Vertex AI/Gemini API) atau melalui titik akhir yang kompatibel dengan OpenAI yang ditawarkan oleh gateway API pihak ketiga seperti CometAPI dan OpenRouter. Artinya, Anda dapat mengintegrasikan Gemini 2.5 Flash Image ke dalam basis kode yang kompatibel dengan OpenAI atau langsung menggunakan SDK resmi Google.

Apa keunggulannya

  • Pengeditan lokal yang ditargetkan (mengubah warna baju, menghapus objek, mengubah pose).
  • Mempertahankan konsistensi subjek/karakter dalam setiap penyuntingan ulang.
  • Memadukan/menggabungkan beberapa gambar menjadi suatu kesatuan yang koheren.
  • Latensi rendah dan inferensi hemat biaya dibandingkan dengan model penelitian yang lebih berat (Google memposisikan model “Flash” sebagai opsi throughput tinggi).

Bagaimana cara menyiapkan lingkungan pengembangan saya untuk memanggil Nano Banana melalui API?

Berikut adalah daftar periksa langkah demi langkah yang dapat Anda perlakukan sebagai dasar untuk salah satu dari tiga metode panggilan yang dijelaskan nanti.

Prasyarat (akun, kunci, kuota)

  1. Akun Google + Proyek Cloud — Jika Anda berencana untuk memanggil Gemini langsung melalui Google (Gemini API / Vertex AI), buat proyek Google Cloud dan aktifkan Vertex AI / Gemini API. Anda memerlukan penagihan dan peran yang sesuai (misalnya, Vertex AI Admin or Service Account dengan hak inferensi).
  2. Akses API Gemini —Beberapa model gambar Gemini adalah pratinjau/ketersediaan terbatas; Anda mungkin perlu meminta akses atau menggunakan model melalui Google AI Studio atau Vertex AI tergantung pada akun Anda.
  3. CometAPI (gerbang opsional) — Jika Anda lebih suka API yang agnostik terhadap satu vendor dan dapat memproksi berbagai model (termasuk Gemini), daftar di CometAPI untuk mendapatkan kunci API dan meninjau daftar model mereka (mereka mengekspos varian Gemini 2.5 Flash dan titik akhir yang kompatibel dengan OpenAI). CometAPI dapat menyederhanakan pengembangan dan memungkinkan Anda beralih penyedia tanpa mengubah kode aplikasi.

Perkakas lokal

  • Waktu proses bahasa: Node.js 18+, Python 3.10+ direkomendasikan.
  • Klien HTTP: fetch/axios untuk JS; requests/httpx untuk Python (atau SDK resmi).
  • Pembantu gambar: Pillow (Python) atau sharp (Node) untuk mengubah ukuran, konversi format, dan penyandian/dekodean Base64.
  • SecuritySimpan kunci dalam variabel lingkungan atau brankas rahasia (HashiCorp Vault, AWS Secrets Manager, Google Secret Manager). Jangan pernah melakukan commit pada kunci API.

Instal SDK Google/yang kompatibel (opsional)

Google menyediakan SDK dan openai Shim kompatibilitas pustaka — Anda dapat menggunakan pustaka klien OpenAI untuk Gemini dengan mengubah beberapa baris (URL dasar + kunci API), tetapi klien Gemini/Google asli direkomendasikan untuk fitur multimodal yang lengkap. Jika menggunakan CometAPI atau gateway yang kompatibel dengan OpenAI, penggunaan klien OpenAI dapat mempercepat pengembangan, contohnya:

Rute resmi Google (Python):

python -m venv venv && source venv/bin/activate
pip install --upgrade pip
pip install google-genai           # official Google GenAI SDK

pip install Pillow requests jq     # for local image handling in examples

Klien yang kompatibel dengan CometAPI/OpenAI (Python):

pip install openai requests

Bagaimana cara memilih di antara tiga metode panggilan untuk Nano Banana?

Pemilihan metode panggilan bergantung pada arsitektur, persyaratan latensi/biaya, dan apakah Anda ingin mengandalkan titik akhir resmi Google atau gateway pihak ketiga yang kompatibel dengan OpenAI. Tiga pola umum yang umum adalah:

1) Antarmuka Obrolan yang kompatibel dengan OpenAI (teks ke gambar)

Gunakan ini jika Anda sudah memiliki kode atau SDK bergaya OpenAI dan ingin beralih model dengan perubahan minimal. Banyak gateway (CometAPI, OpenRouter) mengekspos model Gemini di bawah permukaan REST yang kompatibel dengan OpenAI sehingga model Anda yang sudah ada chat or completions panggilan bekerja hanya dengan yang berbeda base_url dan nama model. Ini seringkali merupakan jalur tercepat menuju produksi jika Anda tidak ingin mengelola autentikasi Google Cloud.

2) Gemini resmi generateContent — teks ke gambar

Gunakan Google resmi generateContent melalui genai Klien (Google) atau Vertex AI jika Anda menginginkan SDK resmi yang didukung penuh dan akses ke fitur-fitur terbaru (parameter pembangkitan yang detail, streaming, API file untuk aset besar), plus penagihan/pemantauan Google Cloud. Ini direkomendasikan jika Anda membutuhkan dukungan produksi dan kontrol tingkat perusahaan.

3) Gemini resmi generateContent — gambar-ke-gambar (input/output Base64)

Gunakan ini ketika Anda harus mengirimkan gambar biner sebaris (Base64) atau menginginkan pengeditan gambar/jalur gambar-ke-gambar. Google generateContent Mendukung gambar sebaris (base64) dan API File untuk aset yang lebih besar atau dapat digunakan kembali. Respons untuk gambar yang dihasilkan/diedit biasanya dikembalikan sebagai string Base64 yang dapat Anda dekode dan simpan. Ini memberikan kontrol multimodal yang paling eksplisit.

Bagaimana saya dapat memanggil Nano Banana melalui antarmuka Obrolan yang kompatibel dengan OpenAI (teks-ke-gambar)?

Titik akhir obrolan yang kompatibel dengan OpenAI menerima serangkaian {role, content} Pesan; Anda menjelaskan gambar yang diinginkan dalam pesan pengguna, dan gateway (CometAPI atau shim kompatibilitas OpenAI) menerjemahkannya menjadi panggilan ke model Gemini yang mendasarinya. Hal ini praktis jika aplikasi Anda sudah menggunakan alur obrolan atau Anda ingin menggabungkan pembuatan teks + pembuatan gambar dalam satu pertukaran.

Tangga

1.Daftar ke CometAPI dan dapatkan kunci API: Daftar di CometAPI, buat proyek, salin kunci API Anda. CometAPI mengekspos banyak model di balik satu base_url. ()

  1. Instal klien yang kompatibel dengan OpenAI: Ular piton: pip install openai atau gunakan yang lebih baru openai/OpenAI Pembungkus SDK yang digunakan oleh banyak gateway.

  2. Arahkan SDK ke CometAPI dan panggil titik akhir penyelesaian obrolan:

curl https://api.cometapi.com/v1/chat/completions \
  -H "Authorization: Bearer $COMET_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2-5-flash-image-preview",
     "stream": true,   
     "messages": [{"role": "user", 
                   "content": "Generate a cute kitten sitting on a cloud, in a                cartoon style"}]
      }'

Catatan:

  1. stream harus benar; respons akan dikembalikan sebagai stream;

  2. Struktur respons dibungkus oleh CometAPI untuk kompatibilitas OpenAI.

  3. Responsnya mencakup gambar Base64; dekode dan simpan di klien sesuai kebutuhan:

Bagaimana cara saya menelepon Nano Banana menggunakan Gemini resmi? generateContent antarmuka teks ke gambar?

Google menyediakan API Pengembang Gemini (API Gemini) dan juga mengekspos model Gemini melalui Verteks AIUntuk akses terprogram ke Gemini 2.5 Flash Image (Nano Banana) dengan cara yang didukung, situs web resmi generateContent Metode ini merupakan titik masuk kanonik untuk pembuatan teks saja atau multimoda. Gunakan Google SDK GenAI (Ular Piton: google-genai) atau memanggil titik akhir REST secara langsung. Ini memberikan akses langsung ke parameter dan modalitas model, dan merupakan cara yang disarankan untuk menggunakan fitur-fitur lanjutan (pengeditan yang tepat, penggabungan multi-gambar) saat memanggil titik akhir Google.

1.Gunakan Google SDK GenAI (Ular Piton: google-genai)

Langkah-langkah distribusi / panggilan (ikhtisar):

  1. Dapatkan kunci API dari Google AI Studio atau buat akun layanan Vertex AI (tergantung platform).
  2. Instal SDK (pip install --upgrade google-genai) dan mengautentikasi (kunci API atau Kredensial Default Aplikasi Google).
  3. Pilih model: gemini-2.5-flash-image atau slug pratinjau yang ditampilkan dalam dokumen (slug yang tepat bergantung pada GA/status pratinjau).
  4. Memanggil client.models.generate_content(...) dengan perintah teks biasa (teks ke gambar).
  5. Membaca sandi gambar yang dikembalikan (jika dikembalikan Base64) dan simpan/simpan.

Contoh Python (klien resmi) — teks→gambar:

from google import genai
from base64 import b64decode, b64encode

client = genai.Client(api_key="YOUR_GEMINI_KEY")
prompt = {
  "content": "A hyperrealistic photo of a vintage motorcycle parked under neon lights at midnight",
  "mime_type": "text/plain"
}
# request generateContent for image output

result = client.generate_content(
  model="gemini-2-5-flash-image-preview",
  prompt=prompt,
  response_modalities=,
  image_format="PNG",
)
# handle binary or base64 in response (depends on API mode)

(Catatan: periksa API klien resmi untuk nama parameter yang tepat — contoh di atas mengikuti pola dalam dokumen Google.)

2. Panggilan Nano Pisang melalui titik akhir REST

Titik akhir EST (contoh teks ke gambar): https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent.

Opsi autentikasi: suplai header x-goog-api-key: $CometAPI_API_KEY(Buat kunci di CometAPI.)

Ini memposting perintah teks dan menyimpan gambar base64 yang dikembalikan:

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        { "text": "A photorealistic nano banana dish plated in a stylish restaurant, cinematic lighting, 3:2 aspect ratio" }
      ]
    }]
  }' \
| jq -r '.candidates.content.parts[] | select(.inline_data) | .inline_data.data' \
| base64 --decode > gemini-image.png

Catatan: Biner gambar dikembalikan sebagai base64 di candidates.content.parts.inline_data.dataContoh di atas menggunakan jq untuk mengambil data sebaris dan mendekodenya. Dokumen resmi menunjukkan alur yang sama.

Bagaimana cara saya menelepon Nano Banana menggunakan Gemini resmi? generateContent antarmuka gambar ke gambar (Base64 masuk/keluar)?

Kapan Anda harus menggunakan gambar-ke-gambar (base64 masuk/keluar)?

Gunakan gambar-ke-gambar saat Anda perlu:

  • Edit foto yang sudah ada (inpainting, transfer gaya, penggantian objek).
  • Gabungkan beberapa gambar sumber menjadi satu komposisi.
  • Mempertahankan identitas subjek di semua suntingan (salah satu kekuatan Nano Banana).

Gemini generateContent mendukung data gambar sebaris melalui Base64 (atau sebagai URI file) dan mengembalikan gambar yang dihasilkan atau diedit sebagai string Base64. Dokumen memberikan contoh eksplisit untuk menyediakan inline_data dengan mime_type dan data.

Langkah distribusi / panggilan (gambar ke gambar)

  1. Mempersiapkan gambar masukan: membaca byte file, mengodekan Base64, atau meneruskan byte mentah melalui pembantu SDK.
  2. Membangun a contents array di mana satu bagiannya adalah gambar sebaris (dengan mimeType dan data) dan bagian selanjutnya menyertakan petunjuk penyuntingan tekstual.
  3. POST untuk generateContent (SDK resmi atau REST).
  4. Menerima Respons: API mengembalikan gambar yang dihasilkan/diedit yang dikodekan sebagai string Base64. Dekode dan simpan secara lokal.

Contoh — Python (gambar-ke-gambar menggunakan byte sebaris melalui GenAI SDK)

# pip install google-genai

from google import genai
from google.genai import types
import base64

client = genai.Client(api_key="YOUR_GOOGLE_API_KEY")

# Read local image

with open("input_photo.jpg", "rb") as f:
    img_bytes = f.read()

# Using SDK helper to attach bytes as a part

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[
        types.Part.from_bytes(
            data=img_bytes,
            mime_type="image/jpeg"
        ),
        "Make a high-quality edit: change the subject's jacket color to teal, keep natural lighting and preserve the person's facial features."
    ],
)

# The returned image will typically be in response.candidates[].content.parts with base64-encoded data

# Decode and save (pseudo-access shown; check SDK response structure)
b64_out = response.candidates.content.parts.data  # example path

with open("edited.jpg","wb") as out:
    out.write(base64.b64decode(b64_out))

Contoh Python: gambar→gambar menggunakan Base64 melalui titik istirahat

import base64, json, requests

API_URL = "https://api.gemini.googleapis.com/v1/generateContent"
API_KEY = "YOUR_GEMINI_KEY"

# read and base64-encode image

with open("input.jpg","rb") as f:
    b64 = base64.b64encode(f.read()).decode("utf-8")

payload = {
  "model": "gemini-2-5-flash-image-preview",
  "input": [
    {"mime_type": "image/jpeg", "bytes_base64": b64},
    {"mime_type": "text/plain", "text": "Remove the lamppost and make the sky golden at sunset."}
  ],
  "response_modalities": 
}

resp = requests.post(API_URL, headers={"Authorization":f"Bearer {API_KEY}", "Content-Type":"application/json"}, json=payload)
resp.raise_for_status()
data = resp.json()
# data.candidates... may contain image base64 — decode and save

out_b64 = data
with open("edited.png","wb") as out:
    out.write(base64.b64decode(out_b64))

Jika Anda ingin mengaksesnya menggunakan port rest CometAPI:

curl 
--location 
--request POST "https://api.CometAPI.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent" ^ 
--header "Authorization: sk-" ^ 
--header "User-Agent: Apifox/1.0.0 (https://apifox.com)" ^ 
--header "Content-Type: application/json" ^ 
--header "Accept: */*" ^ 
--header "Host: api.CometAPI.com" ^ 
--header "Connection: keep-alive" ^ 
--data-raw "{ \"contents\":  } ], \"generationConfig\": { \"responseModalities\":  }}"

Untuk inline: baca gambar dan enkode base64. Untuk penggunaan berulang atau >20MB, unggah melalui File API dan rujuk handle file di generateContentPaling cocok untuk pengeditan dan alur kerja presisi yang memerlukan masukan gambar plus instruksi pengeditan tekstual.

Apa tips terbaik dalam bekerja dengan Nano Banana?

Rekayasa & kontrol yang cepat

  1. Bersikaplah eksplisit: sertakan rasio aspek yang diinginkan, referensi gaya (hanya nama artis jika diizinkan), lensa kamera, pencahayaan, dan komposisi. Misalnya, “Fotorealistis, 3:2, kedalaman bidang dangkal, jam emas, lensa Nikon 50mm.”
  2. Gunakan pengeditan berturut-turut: lebih suka suntingan lokal yang lebih kecil dalam beberapa lintasan daripada perintah satu kali yang besar — ​​ini menjaga konsistensi subjek. Kekuatan Nano Banana terletak pada penyuntingan iteratif.

Kebersihan gambar

  • Masukan praproses: menormalkan ruang warna, menghapus EXIF ​​yang tertanam jika privasi diperlukan, skalakan ke resolusi yang masuk akal untuk menyimpan token.
  • Keluaran pascaproses: menjalankan deteksi wajah, membersihkan artefak minor melalui filter ringan (Bantal / tajam) sebelum kembali ke pengguna.

Kebijakan keselamatan, kepatuhan & konten

  • Terapkan pemeriksaan keamanan konten otomatis (Model moderasi penglihatan atau pemeriksaan daftar hitam) sebelum menyimpan/menyajikan gambar.
  • Jika mengunggah gambar orang, ikuti undang-undang privasi yang berlaku (GDPR/CCPA) dan dapatkan persetujuan yang diperlukan.
  • Hargai kebijakan penggunaan model dan aturan hak cipta saat meminta karakter berhak cipta atau karya seni yang sudah ada.

Catatan penutup

Nano Banana (Gemini 2.5 Flash Image) merupakan langkah pragmatis dan fidelitas tinggi untuk pembuatan dan penyuntingan gambar multimoda: dirancang untuk konsistensi di seluruh penyuntingan dan penalaran multimoda yang lebih kaya. Nano Banana (Gemini 2.5 Flash Image) merupakan langkah penting dalam pembuatan/penyuntingan gambar — menawarkan konsistensi tinggi untuk penyuntingan multi-langkah dan beberapa permukaan integrasi (gateway yang kompatibel dengan OpenAI seperti CometAPI dan Google generateContent API). Untuk kecepatan adopsi, gateway seperti CometAPI memungkinkan Anda menggunakan kembali kode bergaya OpenAI. Selalu periksa kewarasan respons, patuhi kebijakan konten dan fitur asal-usul (SynthID), dan pantau biaya selama iterasi.

Mulai

CometAPI adalah platform API terpadu yang menggabungkan lebih dari 500 model AI dari penyedia terkemuka—seperti seri GPT OpenAI, Gemini Google, Claude Anthropic, Midjourney, Suno, dan lainnya—menjadi satu antarmuka yang ramah bagi pengembang. Dengan menawarkan autentikasi yang konsisten, pemformatan permintaan, dan penanganan respons, CometAPI secara drastis menyederhanakan integrasi kapabilitas AI ke dalam aplikasi Anda. Baik Anda sedang membangun chatbot, generator gambar, komposer musik, atau alur kerja analitik berbasis data, CometAPI memungkinkan Anda melakukan iterasi lebih cepat, mengendalikan biaya, dan tetap tidak bergantung pada vendor—semuanya sambil memanfaatkan terobosan terbaru di seluruh ekosistem AI.

Pengembang dapat mengakses Gambar Flash Gemini 2.5(Daftar API Nano Banana Comet gemini-2.5-flash-image-preview/gemini-2.5-flash-image entri gaya dalam katalog mereka.) melalui CometAPI, versi model terbaru yang tercantum adalah per tanggal publikasi artikel. Untuk memulai, jelajahi kemampuan model di tempat bermain dan konsultasikan Panduan API untuk petunjuk terperinci. Sebelum mengakses, pastikan Anda telah masuk ke CometAPI dan memperoleh kunci API. API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.

SHARE THIS BLOG

500+ Model dalam Satu API

Diskon hingga 20%