Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

Masukan:$0.4/M
Keluaran:$2.4/M
Konteks:1,048,576
Keluaran Maksimum:65.5k
Gemini 3 Flash ialah model multimodal berskala besar yang ringan dan efisien daripada Google, direka khas untuk senario dunia sebenar yang memerlukan respons pantas dan latensi rendah.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API
Versi

Apakah itu Gemini 3 Flash

“Gemini 3 Flash” ialah ahli Flash/pantas dalam keluarga Gemini-3: varian yang lebih ringan, latensi lebih rendah dan berkesan dari segi kos bagi model Gemini-3 Google yang ditujukan untuk aplikasi ber-throughput tinggi, masa nyata dan sensitif terhadap skala. Satu varian dalam keluarga model API Gemini yang membolehkan pembangun memanggil model gaya Gemini 3 berlatensi rendah dan dioptimumkan kos melalui API CometAPI (permukaan API yang sama seperti model Gemini lain). Ia menyediakan input multimodal dan alat output berstruktur yang sama tetapi mengutamakan kelajuan inferens dan throughput.

Ciri utama :

  • Latensi rendah / throughput tinggi: ditala untuk respons pantas dan kecekapan kos (titik reka bentuk Flash).
  • Sokongan input multimodal: teks, imej, petikan video dan audio dalam banyak varian Flash (entri model API menyenaraikan jenis input yang disokong bagi setiap varian).
  • Pemanggilan fungsi & output berstruktur: penguatkuasaan output JSON/berstruktur untuk integrasi dengan alat dan ejen.
  • Sokongan Ejen/Alatan: menyepadukan dengan Google Search grounding, pemanggilan fungsi/alat, dan rangka kerja ejen dalam ekosistem Gemini.

Perbandingan Gemini 3 Flash dengan model lain

  • Berbanding Gemini-3 Pro (keluarga yang sama): Flash = dioptimumkan untuk kelajuan/kos; Pro = penaakulan lebih tinggi, ketepatan multimodal, dan Deep Think. Pilih Flash untuk UI masa nyata; Pro untuk tugasan yang sensitif terhadap ketepatan.
  • Berbanding Gemini terdahulu (2.5 Flash): Keluarga Gemini-3 meningkatkan penaakulan dan prestasi multimodal; titik reka bentuk Flash terus menyasarkan harga/prestasi. Jika anda kini menggunakan 2.5 Flash, Gemini-3 Fast/Flash bertujuan memberikan kualiti yang lebih baik pada latensi/kos yang serupa.

Kes penggunaan praktikal (di mana Flash unggul)

  • Chatbot masa nyata & ejen suara: latensi rendah untuk UI perbualan dan aplikasi audio penstriman.
  • Sokongan pelanggan & peringkasan volum tinggi: peringkasan transkrip panjang yang berkesan dari segi kos pada skala.
  • Inferens edge atau terbina dalam apabila masa respons penting: gunakan varian gaya flash/lite untuk SLA yang ketat.
  • Penghuraian dokumen besar-besaran / rantaian paip pengingesan: gunakan Flash untuk pengindeksan dan pra-pemprosesan; tingkatkan ke Pro untuk pengekstrakan/penganalisisan bernilai tinggi.
  • Pembantu kod masa nyata / pemalam IDE: pelengkapan kod yang pantas dengan kos pengebilan lebih rendah (sahkan dengan Pro untuk penggubahan semula yang kompleks).

Cara mengakses API Gemini 3 Flash

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada API token di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.

Step 2: Send Requests to Gemini 3 flash API

Pilih titik akhir “gemini-3-flash” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API di laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. URL asas ialah Gemini Generating Content dan Chat.

Masukkan soalan atau permintaan anda ke dalam medan content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API akan memberikan status tugas dan data output.

Lihat juga Gemini 3 Pro Preview API

Soalan Lazim

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Ciri-ciri untuk Gemini 3 Flash

Terokai ciri-ciri utama Gemini 3 Flash, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Gemini 3 Flash

Terokai harga yang kompetitif untuk Gemini 3 Flash, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Gemini 3 Flash boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Kod contoh dan API untuk Gemini 3 Flash

Gemini 3 Flash ialah model bahasa besar berasaskan teks sahaja (LLM) yang tersedia melalui API yang dihoskan oleh CometAPI (dan dicerminkan oleh lapisan inferens vendor). API ini menyokong pola sembang/pelengkapan standard, penstriman respons, pemanggilan fungsi/alat, output JSON berstruktur, serta beberapa mod “thinking” yang direka untuk aliran kerja gaya ejen (interleaved / preserved / turn-level thinking).
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Versi Gemini 3 Flash

Sebab Gemini 3 Flash mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.
ID modelPeneranganKetersediaanPermintaan
gemini-3-flash-allTeknologi yang digunakan tidak rasmi dan penjanaan tidak stabil tetapi Direct Internet dsb., Chat format✅Chat format
gemini-3-flashSecara automatik merujuk kepada model terkini✅Penjanaan Kandungan Gemini
gemini-3-flash-previewPratonton Rasmi✅Penjanaan Kandungan Gemini

Lebih Banyak Model