Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Masukan:$0.4/M
Keluaran:$2.4/M
Konteks:1,048,576
Keluaran Maksimum:65.5k
Gemini 3 Flash adalah model multimodal skala besar yang ringan dan efisien dari Google, yang disesuaikan untuk skenario dunia nyata yang memerlukan respons cepat dan latensi rendah.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Apa itu Gemini 3 Flash

“Gemini 3 Flash” adalah anggota Flash/fast dalam keluarga Gemini-3: varian yang lebih ringan, berlatensi lebih rendah, dan efisien biaya dari model Gemini-3 Google yang ditujukan untuk aplikasi dengan throughput tinggi, waktu nyata, dan sensitif terhadap skala. Sebuah varian dari keluarga model Gemini API yang memungkinkan pengembang memanggil model bergaya Gemini 3 berlatensi rendah dan dioptimalkan biaya melalui API CometAPI (permukaan API yang sama dengan model Gemini lainnya). Model ini mengekspos masukan multimodal dan alat keluaran terstruktur yang sama, tetapi memprioritaskan kecepatan inferensi dan throughput.

Fitur utama :

  • Latensi rendah / throughput tinggi: dioptimalkan untuk respons cepat dan efisiensi biaya (titik desain Flash).
  • Dukungan input multimodal: teks, gambar, potongan video, dan audio di banyak varian Flash (entri model API mencantumkan jenis input yang didukung per varian).
  • Pemanggilan fungsi & keluaran terstruktur: pemaksaan keluaran JSON/terstruktur untuk integrasi dengan alat dan agen.
  • Dukungan agen/alat: terintegrasi dengan Google Search grounding, pemanggilan fungsi/alat, dan kerangka kerja agen di ekosistem Gemini.

Perbandingan Gemini 3 Flash dengan model lain

  • Dibandingkan Gemini-3 Pro (keluarga yang sama): Flash = dioptimalkan untuk kecepatan/biaya; Pro = penalaran lebih tinggi, fidelitas multimodal, dan Deep Think. Pilih Flash untuk UI waktu nyata; Pro untuk tugas yang sensitif terhadap akurasi.
  • Dibandingkan Gemini sebelumnya (2.5 Flash): keluarga Gemini-3 meningkatkan penalaran dan kinerja multimodal; titik desain Flash terus menargetkan harga/kinerja. Jika Anda saat ini menggunakan 2.5 Flash, Gemini-3 Fast/Flash dimaksudkan untuk memberikan kualitas yang lebih baik pada latensi/biaya yang serupa.

Kasus penggunaan praktis (di mana Flash unggul)

  • Chatbot waktu nyata & agen suara: latensi rendah untuk UI percakapan dan aplikasi streaming audio.
  • Dukungan pelanggan & peringkasan volume tinggi: peringkasan transkrip panjang yang hemat biaya dalam skala besar.
  • Inferensi edge atau tertanam di mana waktu respons penting: gunakan varian gaya flash/lite untuk SLA yang ketat.
  • Pipeline parsing/pemasukan dokumen massal: gunakan Flash untuk pengindeksan dan prapemrosesan; eskalasi ke Pro untuk ekstraksi/analisis bernilai tinggi.
  • Asisten kode waktu nyata / plugin IDE: pelengkapan kode cepat dengan biaya penagihan lebih rendah (validasi dengan Pro untuk refaktor kompleks).

Cara mengakses API Gemini 3 Flash

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API untuk antarmuka. Klik “Add Token” pada token API di personal center, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim permintaan ke API Gemini 3 Flash

Pilih endpoint “gemini-3-flash” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. URL dasar adalah Gemini Generating Content dan Chat.

Masukkan pertanyaan atau permintaan Anda ke dalam bidang content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah pemrosesan, API akan merespons dengan status tugas dan data keluaran.

Lihat juga Gemini 3 Pro Preview API

FAQ

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Fitur untuk Gemini 3 Flash

Jelajahi fitur-fitur utama dari Gemini 3 Flash, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Gemini 3 Flash

Jelajahi harga kompetitif untuk Gemini 3 Flash, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Gemini 3 Flash dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Kode contoh dan API untuk Gemini 3 Flash

Gemini 3 Flash adalah model bahasa besar (LLM) yang hanya berbasis teks, dapat diakses melalui API yang di-host oleh CometAPI (dan dicerminkan oleh lapisan inferensi vendor). API ini mendukung pola percakapan/penyelesaian standar, respons streaming, pemanggilan fungsi/alat, keluaran JSON terstruktur, serta beberapa mode “thinking” yang dirancang untuk alur kerja bergaya agen (interleaved / preserved / turn-level thinking).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versi Gemini 3 Flash

Alasan Gemini 3 Flash memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
ID modelDeskripsiKetersediaanPermintaan
gemini-3-flash-allTeknologi yang digunakan tidak resmi dan hasil generasinya tidak stabil, tetapi mendukung Direct Internet, dll, format Chat✅Chat
gemini-3-flashSecara otomatis mengarah ke model terbaru✅Pembuatan Konten Gemini
gemini-3-flash-previewPratinjau resmi✅Pembuatan Konten Gemini

Model Lainnya