Apa itu Gemini 3 Flash

“Gemini 3 Flash” adalah anggota Flash/fast dalam keluarga Gemini-3: varian yang lebih ringan, berlatensi lebih rendah, dan efisien biaya dari model Gemini-3 Google yang ditujukan untuk aplikasi dengan throughput tinggi, waktu nyata, dan sensitif terhadap skala. Sebuah varian dari keluarga model Gemini API yang memungkinkan pengembang memanggil model bergaya Gemini 3 berlatensi rendah dan dioptimalkan biaya melalui API CometAPI (permukaan API yang sama dengan model Gemini lainnya). Model ini mengekspos masukan multimodal dan alat keluaran terstruktur yang sama, tetapi memprioritaskan kecepatan inferensi dan throughput.

Fitur utama :

Latensi rendah / throughput tinggi: dioptimalkan untuk respons cepat dan efisiensi biaya (titik desain Flash).
Dukungan input multimodal: teks, gambar, potongan video, dan audio di banyak varian Flash (entri model API mencantumkan jenis input yang didukung per varian).
Pemanggilan fungsi & keluaran terstruktur: pemaksaan keluaran JSON/terstruktur untuk integrasi dengan alat dan agen.
Dukungan agen/alat: terintegrasi dengan Google Search grounding, pemanggilan fungsi/alat, dan kerangka kerja agen di ekosistem Gemini.

Perbandingan Gemini 3 Flash dengan model lain

Dibandingkan Gemini-3 Pro (keluarga yang sama): Flash = dioptimalkan untuk kecepatan/biaya; Pro = penalaran lebih tinggi, fidelitas multimodal, dan Deep Think. Pilih Flash untuk UI waktu nyata; Pro untuk tugas yang sensitif terhadap akurasi.
Dibandingkan Gemini sebelumnya (2.5 Flash): keluarga Gemini-3 meningkatkan penalaran dan kinerja multimodal; titik desain Flash terus menargetkan harga/kinerja. Jika Anda saat ini menggunakan 2.5 Flash, Gemini-3 Fast/Flash dimaksudkan untuk memberikan kualitas yang lebih baik pada latensi/biaya yang serupa.

Kasus penggunaan praktis (di mana Flash unggul)

Chatbot waktu nyata & agen suara: latensi rendah untuk UI percakapan dan aplikasi streaming audio.
Dukungan pelanggan & peringkasan volume tinggi: peringkasan transkrip panjang yang hemat biaya dalam skala besar.
Inferensi edge atau tertanam di mana waktu respons penting: gunakan varian gaya flash/lite untuk SLA yang ketat.
Pipeline parsing/pemasukan dokumen massal: gunakan Flash untuk pengindeksan dan prapemrosesan; eskalasi ke Pro untuk ekstraksi/analisis bernilai tinggi.
Asisten kode waktu nyata / plugin IDE: pelengkapan kode cepat dengan biaya penagihan lebih rendah (validasi dengan Pro untuk refaktor kompleks).

Cara mengakses API Gemini 3 Flash

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada token API di personal center, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim permintaan ke API Gemini 3 Flash

Pilih endpoint “gemini-3-flash” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar adalah Gemini Generating Content dan Chat.

Masukkan pertanyaan atau permintaan Anda ke dalam bidang content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah pemrosesan, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Correction: gemini-3-flash variants (same price across variants)

Model family	Variant (model name)	Input price (USD / 1M tokens)	Output price (USD / 1M tokens)
gemini-3-flash	gemini-3-flash	$0.40	$2.40
gemini-3-flash	gemini-3-flash-preview	$0.40	$2.40
gemini-3-flash	gemini-3-flash-all	$0.40	$2.40
gemini-3-flash	gemini-3-flash-thinking	$0.40	$2.40
gemini-3-flash	gemini-3-flash-preview-thinking	$0.40	$2.40

ID model	Deskripsi	Ketersediaan	Permintaan
gemini-3-flash-all	Teknologi yang digunakan tidak resmi dan hasil generasinya tidak stabil, tetapi mendukung Direct Internet, dll, format Chat	✅	Chat
gemini-3-flash	Secara otomatis mengarah ke model terbaru	✅	Pembuatan Konten Gemini
gemini-3-flash-preview	Pratinjau resmi	✅	Pembuatan Konten Gemini