ModelSokonganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Sumber
Model AIBlogPerusahaanLog PerubahanTentang
2025 CometAPI. Hak cipta terpelihara.Dasar PrivasiTerma Perkhidmatan
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Masukan:$0.08/M
Keluaran:$0.32/M
Konteks:1M
Keluaran Maksimum:65K
Model Gemini 2.5 Flash yang dioptimumkan untuk keberkesanan kos tinggi dan throughput tinggi. Model yang paling kecil dan paling berkesan dari segi kos, dibina untuk penggunaan berskala besar.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API
Versi

Perincian Teknikal

  • Penaakulan Adaptif: Gemini 2.5 Flash-Lite menyokong pemikiran atas permintaan, membolehkan pembangun memperuntukkan sumber pengkomputeran hanya apabila penaakulan mendalam diperlukan.
  • Integrasi Alat: Keserasian penuh dengan alat asli Gemini 2.5, termasuk Grounding with Google Search, Code Execution, URL Context dan Function Calling untuk aliran kerja multimodal yang lancar.
  • Model Context Protocol (MCP): Memanfaatkan MCP Google untuk mendapatkan data web masa nyata, memastikan respons terkini dan relevan secara kontekstual.
  • Pilihan Penerapan: Tersedia melalui CometAPI, Gemini API, Vertex AI dan Google AI Studio, dengan laluan pratonton untuk pengguna awal mencuba dan memberikan maklum balas.

Prestasi Penanda Aras Gemini 2.5 Flash-Lite

  • Latensi: Mencapai sehingga 50% lebih rendah pada masa tindak balas median berbanding Gemini 2.5 Flash, dengan latensi bawah 100 ms pada penanda aras standard pengelasan dan peringkasan.
  • Kadar Aliran: Dioptimumkan untuk beban kerja bervolum tinggi, mengekalkan puluhan ribu permintaan seminit tanpa kemerosotan prestasi.
  • Harga-Prestasi: Menunjukkan pengurangan 25% dalam kos per 1,000 token berbanding versi Flash, menjadikannya pilihan Pareto-optimal untuk penerapan peka kos.
  • Penerimaan Industri: Pengguna awal melaporkan integrasi yang lancar ke dalam saluran pengeluaran, dengan metrik prestasi yang sejajar dengan atau melebihi unjuran awal.

Gemini 2.5 Flash Lite


Kes Penggunaan Ideal

  • Tugas Frekuensi Tinggi, Kerumitan Rendah: Pelabelan automatik, analisis sentimen dan terjemahan pukal
  • Aliran Kerja Peka Kos: Pengekstrakan data daripada korpus dokumen besar, peringkasan kelompok berkala
  • Senario Edge dan Mudah Alih: Apabila latensi kritikal tetapi bajet sumber terhad

Keterbatasan Gemini 2.5 Flash-Lite

  • Status Pratonton: Mungkin mengalami perubahan API sebelum GA; integrasi perlu mengambil kira kemungkinan lonjakan versi.
  • Tiada Penalaan Halus On-the-Fly: Tidak boleh memuat naik berat model tersuai; bergantung pada kejuruteraan prompt dan mesej sistem.
  • Kreativiti Berkurang: Ditala untuk tugas deterministik dan kadar aliran tinggi; kurang sesuai untuk penjanaan terbuka atau penulisan “kreatif”.
  • Had Sumber: Skala secara linear hanya sehingga ~16 vCPU; selebihnya, peningkatan kadar aliran berkurangan.
  • Kekangan Multimodal: Menyokong input imej/audio tetapi dengan fideliti terhad; tidak sesuai untuk tugasan visi berat atau transkripsi audio.
  • Pertukaran Tetingkap Konteks: Walaupun menerima sehingga 1 M token, inferens praktikal pada skala tersebut mungkin mengalami penurunan kadar aliran.

Ciri-ciri untuk Gemini 2.5 Flash Lite

Terokai ciri-ciri utama Gemini 2.5 Flash Lite, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Gemini 2.5 Flash Lite

Terokai harga yang kompetitif untuk Gemini 2.5 Flash Lite, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Gemini 2.5 Flash Lite boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Kod contoh dan API untuk Gemini 2.5 Flash Lite

Akses kod sampel yang komprehensif dan sumber API untuk Gemini 2.5 Flash Lite bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh Gemini 2.5 Flash Lite dalam projek anda.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versi Gemini 2.5 Flash Lite

Sebab Gemini 2.5 Flash Lite mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.
version
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking

Lebih Banyak Model

A

Claude Opus 4.6

Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 ialah model bahasa besar kelas “Opus” oleh Anthropic, dikeluarkan pada Februari 2026. Ia diposisikan sebagai tulang belakang untuk kerja berpengetahuan dan aliran kerja penyelidikan — menambah baik penaakulan berkonteks panjang, perancangan berbilang langkah, penggunaan alat (termasuk aliran kerja perisian berasaskan ejen), dan tugas penggunaan komputer seperti penjanaan slaid dan hamparan automatik.
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 ialah model Sonnet kami yang paling berkeupayaan setakat ini. Ia merupakan peningkatan menyeluruh terhadap kemahiran model yang meliputi pengaturcaraan, penggunaan komputer, penaakulan konteks panjang, perancangan agen, kerja berasaskan pengetahuan, dan reka bentuk. Sonnet 4.6 turut menampilkan tetingkap konteks 1M token dalam beta.
O

GPT-5.4 nano

Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano direka untuk tugasan yang amat mengutamakan kelajuan dan kos, seperti pengelasan, pengekstrakan data, pemeringkatan dan sub-agen.
O

GPT-5.4 mini

Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini membawa kekuatan GPT-5.4 ke dalam model yang lebih pantas dan lebih cekap, direka untuk beban kerja berskala besar.
A

Claude Mythos Preview

A

Claude Mythos Preview

Akan datang
Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview ialah model terdepan kami yang paling berkemampuan setakat ini, dan menunjukkan lonjakan yang ketara dalam skor pada banyak penanda aras penilaian berbanding model terdepan kami sebelum ini, Claude Opus 4.6.
X

mimo-v2-pro

Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro ialah model asas perdana daripada Xiaomi, menampilkan lebih daripada 1T jumlah parameter dan panjang konteks 1M, yang dioptimumkan secara mendalam untuk senario berasaskan agen. Ia sangat mudah disesuaikan dengan rangka kerja agen umum seperti OpenClaw. Ia berada pada peringkat teratas global dalam penanda aras standard PinchBench dan ClawBench, dengan prestasi yang diperhatikan menghampiri Opus 4.6. MiMo-V2-Pro direka untuk berperanan sebagai otak sistem agen, menyelaras aliran kerja yang kompleks, memacu tugasan kejuruteraan pengeluaran, dan menyampaikan hasil secara boleh dipercayai.

Blog Berkaitan

Adakah API Gemini 2.5 Pro percuma rosak? Perubahan pada kuota percuma pada tahun 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Adakah API Gemini 2.5 Pro percuma rosak? Perubahan pada kuota percuma pada tahun 2025

Google telah memperketat peringkat percuma untuk Gemini API dengan ketara: Gemini 2.5 Pro telah dikeluarkan daripada peringkat percuma dan permintaan percuma harian Gemini 2.5 Flash telah dipotong secara drastik (laporan: ~250 → ~20/hari). Itu tidak bermakna model tersebut “mati” secara kekal untuk eksperimen — tetapi ia bermakna akses percuma pada hakikatnya telah dilucutkan bagi banyak kes penggunaan dunia sebenar.