ModelDukunganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Sumber Daya
Model AIBlogPerusahaanCatatan PerubahanTentang
2025 CometAPI. Semua hak dilindungi undang-undang.Kebijakan PrivasiSyarat dan Ketentuan Layanan
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

Masukan:$0.08/M
Keluaran:$0.32/M
Konteks:1M
Keluaran Maksimum:65K
Model Gemini 2.5 Flash yang dioptimalkan untuk efisiensi biaya tinggi dan throughput tinggi. Model terkecil, paling hemat biaya, dirancang untuk penggunaan skala besar.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Detail Teknis

  • Penalaran Adaptif: Gemini 2.5 Flash-Lite mendukung pemikiran sesuai kebutuhan, memungkinkan pengembang mengalokasikan sumber daya komputasi hanya saat penalaran yang lebih mendalam diperlukan.
  • Integrasi Alat: Kompatibel penuh dengan alat native Gemini 2.5, termasuk Grounding with Google Search, Code Execution, URL Context, dan Function Calling untuk alur kerja multimodal yang mulus.
  • Model Context Protocol (MCP): Memanfaatkan MCP milik Google untuk mengambil data web waktu nyata, memastikan respons terbaru dan relevan secara kontekstual.
  • Opsi Penyebaran: Tersedia melalui CometAPI, Gemini API, Vertex AI, dan Google AI Studio, dengan jalur pratinjau bagi para pengadopsi awal untuk bereksperimen dan memberikan masukan .

Performa Benchmark dari Gemini 2.5 Flash-Lite

  • Latensi: Mencapai waktu respons median hingga 50% lebih rendah dibandingkan Gemini 2.5 Flash, dengan latensi khas di bawah 100 ms pada tolok ukur klasifikasi dan peringkasan standar.
  • Throughput: Dioptimalkan untuk beban kerja bervolume tinggi, mempertahankan puluhan ribu permintaan per menit tanpa degradasi kinerja.
  • Performa Biaya: Menunjukkan pengurangan 25% pada biaya per 1.000 token dibandingkan versi Flash-nya, menjadikannya pilihan Pareto-optimal untuk penerapan yang sensitif terhadap biaya.
  • Adopsi Industri: Pengguna awal melaporkan integrasi yang mulus ke pipeline produksi, dengan metrik kinerja yang selaras dengan atau melampaui proyeksi awal .

Gemini 2.5 Flash Lite


Kasus Penggunaan Ideal

  • Tugas Frekuensi Tinggi, Kompleksitas Rendah: Pelabelan otomatis, analisis sentimen, dan terjemahan massal
  • Pipeline Sensitif Biaya: Ekstraksi data dari korpus dokumen besar, peringkasan batch berkala
  • Skenario Edge dan Mobile: Saat latensi krusial tetapi anggaran sumber daya terbatas

Keterbatasan Gemini 2.5 Flash-Lite

  • Status Pratinjau: Dapat mengalami perubahan API sebelum GA; integrasi harus mengantisipasi kemungkinan kenaikan versi.
  • Tanpa Fine-Tuning On-the-Fly: Tidak dapat mengunggah bobot kustom; andalkan rekayasa prompt dan pesan sistem.
  • Kreativitas Berkurang: Disetel untuk tugas deterministik ber-throughput tinggi; kurang cocok untuk generasi terbuka atau penulisan “kreatif”.
  • Batas Sumber Daya: Menskalakan secara linear hanya hingga ~16 vCPU; di atas ini, peningkatan throughput berkurang.
  • Keterbatasan Multimodal: Mendukung masukan gambar/audio tetapi dengan fidelitas terbatas; tidak ideal untuk tugas visi berat atau transkripsi audio.
  • Trade-off Jendela Konteks : Meskipun menerima hingga 1 M token, inferensi praktis pada skala tersebut mungkin mengalami penurunan throughput.

Fitur untuk Gemini 2.5 Flash Lite

Jelajahi fitur-fitur utama dari Gemini 2.5 Flash Lite, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Gemini 2.5 Flash Lite

Jelajahi harga kompetitif untuk Gemini 2.5 Flash Lite, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Gemini 2.5 Flash Lite dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Kode contoh dan API untuk Gemini 2.5 Flash Lite

Akses kode sampel komprehensif dan sumber daya API untuk Gemini 2.5 Flash Lite guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Gemini 2.5 Flash Lite dalam proyek Anda.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Versi Gemini 2.5 Flash Lite

Alasan Gemini 2.5 Flash Lite memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
version
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite

Model Lainnya

A

Claude Opus 4.6

Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 adalah model bahasa besar kelas “Opus” dari Anthropic, dirilis pada Februari 2026. Model ini diposisikan sebagai andalan untuk pekerjaan berbasis pengetahuan dan alur kerja riset — meningkatkan penalaran dalam konteks panjang, perencanaan multi-langkah, penggunaan alat (termasuk alur kerja perangkat lunak berbasis agen), serta tugas penggunaan komputer seperti pembuatan slide dan spreadsheet secara otomatis.
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 adalah model Sonnet kami yang paling mumpuni sejauh ini. Ini merupakan peningkatan menyeluruh atas keahlian model di bidang pemrograman, penggunaan komputer, penalaran konteks panjang, perencanaan agen, pekerjaan berbasis pengetahuan, dan desain. Sonnet 4.6 juga menyertakan jendela konteks 1M token dalam tahap beta.
O

GPT-5.4 nano

Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano dirancang untuk tugas-tugas di mana kecepatan dan biaya paling penting, seperti klasifikasi, ekstraksi data, pemeringkatan, dan sub-agen.
O

GPT-5.4 mini

Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini menghadirkan keunggulan GPT-5.4 ke model yang lebih cepat dan lebih efisien, dirancang untuk beban kerja bervolume tinggi.
A

Claude Mythos Preview

A

Claude Mythos Preview

Segera hadir
Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview adalah model frontier kami yang paling mumpuni hingga saat ini, dan menunjukkan lompatan skor yang mencolok pada banyak tolok ukur evaluasi dibandingkan dengan model frontier kami sebelumnya, Claude Opus 4.6.
X

mimo-v2-pro

Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro adalah model fondasi unggulan Xiaomi, dengan total lebih dari 1T parameter dan panjang konteks 1M, yang dioptimalkan secara mendalam untuk skenario agentic. Model ini sangat mudah beradaptasi dengan kerangka agent umum seperti OpenClaw. Model ini berada di jajaran teratas global dalam tolok ukur standar PinchBench dan ClawBench, dengan performa yang dirasakan mendekati Opus 4.6. MiMo-V2-Pro dirancang untuk berfungsi sebagai otak sistem agent, mengorkestrasi alur kerja yang kompleks, mendorong tugas rekayasa produksi, dan memberikan hasil secara andal.

Blog Terkait

Apakah Free Gemini 2.5 Pro API sedang bermasalah? Perubahan kuota gratis pada 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Apakah Free Gemini 2.5 Pro API sedang bermasalah? Perubahan kuota gratis pada 2025

Google telah sangat memperketat tingkatan gratis untuk Gemini API: Gemini 2.5 Pro telah dihapus dari tingkatan gratis dan permintaan gratis harian Gemini 2.5 Flash dipangkas secara drastis (laporan: ~250 → ~20/hari). Itu tidak berarti model tersebut “mati” selamanya untuk eksperimen — tetapi hal itu berarti akses gratis secara efektif telah dipangkas habis untuk banyak kasus penggunaan di dunia nyata.