Google DeepMind hari ini telah mengumumkan pengembangan ketara kepada keluarga Gemini 2.5nya, memperkenalkan keluaran stabil Gemini 2.5 Pro dan Gemini 2.5 Flash bersama pratonton model Gemini 2.5 Flash‑Lite yang serba baharu. Kemas kini ini mencerminkan komitmen berterusan Google untuk menawarkan spektrum model AI yang mengimbangi kos, kelajuan dan prestasi untuk pelbagai beban kerja .
Keluaran Stabil: Gemini 2.5 Pro & Flash
Pada 17 Jun 2025, Google menandakan ketersediaan umum Gemini 2.5 Pro dan Gemini 2.5 Flash. Varian Pro memberikan kuasa penaakulan maksimum dan disesuaikan untuk tugasan kerumitan tinggi seperti penjanaan kod lanjutan, analisis saintifik dan sintesis data berskala besar. Sebaliknya, Gemini 2.5 Flash menawarkan pilihan peringkat pertengahan yang dioptimumkan untuk kegunaan harian yang menuntut kependaman rendah—sesuai untuk chatbots, ringkasan dan penciptaan kandungan pada skala.
Gambaran Keseluruhan: Tiga Model dalam Keluarga Gemini -2.5
| model | status | Kekuatan | Kes Penggunaan Ideal |
|---|---|---|---|
| Gemini 2.5 Flash‑Lite (pratonton) | Preview | Terpantas & termurah; multimodal; penaakulan yang boleh dikawal; alat-didayakan | Tugasan volum tinggi seperti chatbots, ringkasan, carian |
| Gemini 2.5 Flash | Stabil | Seimbang: kependaman rendah, penaakulan yang baik, multimodal | Perbualan masa nyata, sokongan pelanggan |
| Gemini 2.5 Pro | Stabil | Paling berkebolehan: penaakulan mendalam, konteks besar, multimodal | Penyelidikan, pengekodan kompleks, tugas saintifik |

Gemini 2.5 Flash‑Lite: Pratonton Sorotan
Kependaman ultra rendah & penjimatan kos: Direka bentuk untuk aplikasi masa nyata volum tinggi seperti terjemahan, klasifikasi dan ringkasan. Mempunyai inferens yang lebih pantas dan kos setiap panggilan yang lebih rendah berbanding kedua-dua 2.0 Flash‑Lite dan versi Flash penuh.
Prestasi asas yang lebih baik: Mengungguli model Flash‑Lite yang terdahulu merentas penanda aras dalam penjanaan kod, logik, matematik, penaakulan pelbagai mod dan sains.
Kos dan kecekapan: Harga Flash‑Lite (pratonton): ~$0.10 setiap token input 1M dan ~$0.40 setiap token keluaran 1M—jauh lebih murah daripada Flash ($0.30/$2.50) dan Pro ($1.25/$10) .
Keupayaan penuh Gemini -2.5:
- Pemikiran Terkawal: Pengguna boleh menetapkan "belanjawan berfikir" (had token) kepada kelajuan perdagangan untuk kedalaman—Flash‑Lite boleh menogol ini mengikut keperluan.
- Input Multimodal: Menyokong teks, imej, audio dan video (termasuk klip selama sejam), dengan kebolehan untuk menghuraikan carta, UI, adegan, ringkasan acara .
- Integrasi Alat: Termasuk Carian Google, pelaksanaan kod dan tetingkap konteks sejuta token, sepadan dengan keupayaan Flash dan Pro.
Kedudukan pada Keluk Prestasi Harga
Google meletakkan Flash‑Lite berkelajuan tinggi dan kos rendah di Sempadan Pareto, bermakna ia adalah antara model yang paling jimat kos lagi mampu di seluruh dunia (). Dalam penilaian perbandingan, Flash‑Lite mewakili nilai terbaik: bijak lagi mampu milik .
Mengenai Flash dan Pro
- Gemini 2.5 Flash: Model pemikiran stabil, kependaman rendah, pelbagai mod. Diposisikan di bawah Pro tetapi secara kasarnya setanding dengan keupayaan GPT-4o, dengan kelajuan dan kecekapan kos yang unggul ().
- Gemini 2.5 Pro: Model tercanggih Google. Terkenal kerana mengendalikan video/audio berjam-jam, kod dan matematik yang kompleks serta penaakulan konteks yang besar. Juga memperkenalkan "belanjawan berfikir" terpilih dan kualiti kod yang dipertingkatkan untuk berfungsi sebagai AI perdana yang stabil jangka panjang.
Penggunaan & Harga
- Ketersediaan: Ketiga-tiga model boleh diakses melalui Google AI Studio, Google Cloud Vertex AI, Dan Aplikasi Gemini .
- Kos struktur (Harga AI Vertex mulai 16 Jun 2025):
- setiap: $1.25/1M input, $10/1M output (lebih tinggi melebihi 200K token)
- flash: $0.15/1M input, $3.50/1M output dalam mod "berfikir"—dan termasuk 1,500 gesaan dibumikan percuma setiap hari ()
- Flash‑Lite (pratonton): ~$0.10/$0.40 setiap 1 juta token
Bermula
CometAPI menyediakan antara muka REST bersatu yang mengagregatkan ratusan model AI—di bawah titik akhir yang konsisten, dengan pengurusan kunci API terbina dalam, kuota penggunaan dan papan pemuka pengebilan. Daripada menyesuaikan berbilang URL vendor dan bukti kelayakan.
Pembangun boleh mengakses API Gemini 2.5 Flash-Lite (pratonton). melalui CometAPI, model terkini yang disenaraikan adalah pada tarikh penerbitan artikel. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.
