Google melancarkan model Gemini 2.5 Flash-Lite baharu

Google DeepMind hari ini telah mengumumkan pengembangan ketara kepada keluarga Gemini 2.5nya, memperkenalkan keluaran stabil Gemini 2.5 Pro dan Gemini 2.5 Flash bersama pratonton model Gemini 2.5 Flash‑Lite yang serba baharu. Kemas kini ini mencerminkan komitmen berterusan Google untuk menawarkan spektrum model AI yang mengimbangi kos, kelajuan dan prestasi untuk pelbagai beban kerja .

Keluaran Stabil: Gemini 2.5 Pro & Flash

Pada 17 Jun 2025, Google menandakan ketersediaan umum Gemini 2.5 Pro dan Gemini 2.5 Flash. Varian Pro memberikan kuasa penaakulan maksimum dan disesuaikan untuk tugasan kerumitan tinggi seperti penjanaan kod lanjutan, analisis saintifik dan sintesis data berskala besar. Sebaliknya, Gemini 2.5 Flash menawarkan pilihan peringkat pertengahan yang dioptimumkan untuk kegunaan harian yang menuntut kependaman rendah—sesuai untuk chatbots, ringkasan dan penciptaan kandungan pada skala.

Gambaran Keseluruhan: Tiga Model dalam Keluarga Gemini -2.5

model	status	Kekuatan	Kes Penggunaan Ideal
Gemini 2.5 Flash‑Lite (pratonton)	Preview	Terpantas & termurah; multimodal; penaakulan yang boleh dikawal; alat-didayakan	Tugasan volum tinggi seperti chatbots, ringkasan, carian
Gemini 2.5 Flash	Stabil	Seimbang: kependaman rendah, penaakulan yang baik, multimodal	Perbualan masa nyata, sokongan pelanggan
Gemini 2.5 Pro	Stabil	Paling berkebolehan: penaakulan mendalam, konteks besar, multimodal	Penyelidikan, pengekodan kompleks, tugas saintifik

Google melancarkan model Gemini 2.5 Flash-Lite baharu

Gemini 2.5 Flash‑Lite: Pratonton Sorotan

Kependaman ultra rendah & penjimatan kos: Direka bentuk untuk aplikasi masa nyata volum tinggi seperti terjemahan, klasifikasi dan ringkasan. Mempunyai inferens yang lebih pantas dan kos setiap panggilan yang lebih rendah berbanding kedua-dua 2.0 Flash‑Lite dan versi Flash penuh.

Prestasi asas yang lebih baik: Mengungguli model Flash‑Lite yang terdahulu merentas penanda aras dalam penjanaan kod, logik, matematik, penaakulan pelbagai mod dan sains.

Kos dan kecekapan: Harga Flash‑Lite (pratonton): ~$0.10 setiap token input 1M dan ~$0.40 setiap token keluaran 1M—jauh lebih murah daripada Flash ($0.30/$2.50) dan Pro ($1.25/$10) .

Keupayaan penuh Gemini -2.5:

Pemikiran Terkawal: Pengguna boleh menetapkan "belanjawan berfikir" (had token) kepada kelajuan perdagangan untuk kedalaman—Flash‑Lite boleh menogol ini mengikut keperluan.
Input Multimodal: Menyokong teks, imej, audio dan video (termasuk klip selama sejam), dengan kebolehan untuk menghuraikan carta, UI, adegan, ringkasan acara .
Integrasi Alat: Termasuk Carian Google, pelaksanaan kod dan tetingkap konteks sejuta token, sepadan dengan keupayaan Flash dan Pro.

Kedudukan pada Keluk Prestasi Harga

Google meletakkan Flash‑Lite berkelajuan tinggi dan kos rendah di Sempadan Pareto, bermakna ia adalah antara model yang paling jimat kos lagi mampu di seluruh dunia (). Dalam penilaian perbandingan, Flash‑Lite mewakili nilai terbaik: bijak lagi mampu milik .

Mengenai Flash dan Pro

Gemini 2.5 Flash: Model pemikiran stabil, kependaman rendah, pelbagai mod. Diposisikan di bawah Pro tetapi secara kasarnya setanding dengan keupayaan GPT-4o, dengan kelajuan dan kecekapan kos yang unggul ().
Gemini 2.5 Pro: Model tercanggih Google. Terkenal kerana mengendalikan video/audio berjam-jam, kod dan matematik yang kompleks serta penaakulan konteks yang besar. Juga memperkenalkan "belanjawan berfikir" terpilih dan kualiti kod yang dipertingkatkan untuk berfungsi sebagai AI perdana yang stabil jangka panjang.

Penggunaan & Harga

Ketersediaan: Ketiga-tiga model boleh diakses melalui Google AI Studio, Google Cloud Vertex AI, Dan Aplikasi Gemini .
Kos struktur (Harga AI Vertex mulai 16 Jun 2025):
setiap: $1.25/1M input, $10/1M output (lebih tinggi melebihi 200K token)
flash: $0.15/1M input, $3.50/1M output dalam mod "berfikir"—dan termasuk 1,500 gesaan dibumikan percuma setiap hari ()
Flash‑Lite (pratonton): ~$0.10/$0.40 setiap 1 juta token

Bermula

CometAPI menyediakan antara muka REST bersatu yang mengagregatkan ratusan model AI—di bawah titik akhir yang konsisten, dengan pengurusan kunci API terbina dalam, kuota penggunaan dan papan pemuka pengebilan. Daripada menyesuaikan berbilang URL vendor dan bukti kelayakan.

Pembangun boleh mengakses API Gemini 2.5 Flash-Lite (pratonton). melalui CometAPI, model terkini yang disenaraikan adalah pada tarikh penerbitan artikel. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.