Google I/O 2025 mengeluarkan kemas kini terbaharu model siri Gemini 2.5

CometAPI
AnnaMay 25, 2025
Google I/O 2025 mengeluarkan kemas kini terbaharu model siri Gemini 2.5

Pada Google I/O 2025, yang diadakan di Mountain View, California, pasukan Google DeepMind dan Google AI telah memperkenalkan peningkatan ketara pada model bahasa besar siri Gemini 2.5 mereka. Kemas kini ini merangkumi kedua-dua Gemini 2.5 Pro and Gemini 2.5 Flash varian, memperkenalkan keupayaan penaakulan lanjutan, output audio asli, sokongan berbilang bahasa, perlindungan keselamatan dan peningkatan kecekapan yang besar. Secara kolektif, peningkatan ini bertujuan untuk memperkasakan pembangun, perusahaan dan pengguna akhir dengan perkhidmatan AI yang lebih dipercayai, semula jadi dan menjimatkan kos merentas Google AI Studio, Gemini API dan Vertex AI .

Penambahbaikan Gemini 2.5 Pro

Deep Think: Penaakulan Pelbagai Hipotesis yang Dipertingkatkan

Ciri marquee untuk 2.5 Pro ialah Fikir Dalam, mod penaakulan percubaan yang membolehkan model menjana, membandingkan dan memperhalusi berbilang laluan penyelesaian secara dalaman sebelum menghasilkan output akhirnya. Penanda aras awal menunjukkan kehebatan Deep Think: ia mendahului peperiksaan matematik USAMO 2025, di atas LiveCodeBench untuk pengekodan peringkat persaingan dan mendapat markah 84.0% pada ujian penaakulan multimodal MMMU .

Mulai Bulan ini, Deep Think tersedia untuk "penguji yang dipercayai" melalui API Gemini. Google berkata ia memerlukan lebih banyak masa untuk penilaian keselamatan sebelum menjadikan Deep Think tersedia secara meluas.

Google I/O 2025 mengeluarkan kemas kini terbaharu model siri Gemini 2.5

Audio Asli dan Dialog Berbilang Bahasa

Membina keupayaan teksnya, Gemini 2.5 Pro kini menyokong output audio asli merentasi 24 bahasa. Ciri ini menyediakan prosodi sedar konteks dan infleksi emosi, menjadikan interaksi AI berasa lebih manusiawi. Di samping audio, sistem dialog model menyesuaikan nada secara dinamik—menguatkan empati dalam aplikasi perkhidmatan pelanggan dan pendidikan. Demo awal termasuk sembang suara masa nyata dengan penekanan bernuansa dan panduan kod berbilang bahasa, menyerlahkan dorongan Google ke arah AI yang benar-benar boleh berbual.

Keselamatan dan Kebolehpercayaan

Peningkatan keselamatan dalam 2.5 Pro memfokuskan pada mengurangkan serangan suntikan segera tidak langsung. Rangka kerja yang dikemas kini menggunakan sanitasi input yang lebih ketat dan penapisan konteks dinamik, penting untuk industri terkawal yang mengendalikan data sensitif. Menurut blog pembangun Google, perlindungan ini mengurangkan kerentanan sehingga 40% dalam penilaian pasukan merah dalaman, meletakkan asas untuk penggunaan perusahaan yang lebih luas.

Gemini 2.5 Pengoptimuman Denyar

Kecekapan dan Kepantasan

Gemini 2.5 Flash, adik beradik 2.5 Pro yang dioptimumkan kependaman, telah dibaik pulih untuk 22% kecekapan pengiraan lebih tinggi dan masa tindak balas yang lebih pantas. Semasa ucaptama, Demis Hassabis menyatakan bahawa Flash kini "berprestasi lebih baik dalam hampir setiap dimensi" berbanding pendahulunya, dengan ketersediaan pratonton untuk pembangun dalam Google AI Studio, Vertex AI dan apl mudah alih Gemini. Pelancaran ketersediaan umum dijadualkan pada awal Jun 2025 .Versi terkini Gemini 2.5 flash dikeluarkan pada masa ini ialah gemini-2.5-flash-preview-05-20 di Google I/O 2025.

Keupayaan Multimodal Diperluaskan

Kedua-dua varian Flash dan Pro berkongsi kebolehan penaakulan multimodal baharu, membolehkan pengguna mengulang semula teks, imej, audio dan juga input video. Kes penggunaan ketara yang ditunjukkan pada I/O termasuk visualisasi fraktal yang dijana daripada satu gesaan dan saluran paip "Video untuk Belajar Apl" yang menukar video pengajaran kepada pengalaman pendidikan interaktif.

Kemas Kini Ekosistem Pembangun

Penyepaduan Google AI Studio

Google AI Studio kini menawarkan akses lancar kepada Gemini 2.5 Pro dan Flash. Editor kod asli membenamkan model secara langsung, membolehkan pembangun menjana apl web sedia pengeluaran melalui gesaan mudah. Templat permulaan mempamerkan tugas daripada ejen perbualan dengan audio kepada papan pemuka analisis data masa nyata, mengurangkan kitaran prototaip dari minggu ke minit .

Kemajuan API Gemini

. API Gemini menerima beberapa kemas kini:

  • Panggilan Fungsi Diperkemas: Takrif skema yang dipermudahkan mengurangkan usaha penyepaduan sebanyak 30%.
  • Kawalan Belanjawan Berfikir: Pembangun kini boleh mendail dalam kedalaman penaakulan untuk pertukaran prestasi kos.
  • Aliran Kerja Agen: Titik akhir baharu menyokong orkestrasi ejen berbilang langkah melalui Projek Mariner, membolehkan AI melaksanakan secara autonomi sehingga 10 tugasan terpaut (cth, pengambilan data, ringkasan dan penjanaan laporan) dengan satu panggilan.

Ketersediaan Umum Bantuan Kod Gemini

Gemini 2.5 kuasa Bantuan Kod Gemini untuk individu dan integrasi GitHub, kini tersedia secara umum secara percuma dan berbayar. Alat ini cemerlang dalam transformasi kod, penjanaan UI bahagian hadapan dan pemfaktoran semula automatik, memenuhi keperluan pengaturcara baru dan jurutera berpengalaman .

Ketersediaan dan Harga

. Siri Gemini 2.5 boleh diakses oleh semua pelanggan Google Cloud melalui Vertex AI, dengan peringkat prestasi ditentukan oleh tahap langganan:

  • AI Pro ($19.99/bulan) memberikan akses kepada Gemini 2.5 Flash dan ciri standard 2.5 Pro.
  • AI Ultra ($249.99/bulan) membuka kunci Deep Think, pemprosesan keutamaan dan rangkaian penuh keupayaan multimodal dan ejen, bersama-sama dengan perkhidmatan yang digabungkan seperti storan awan 30 TB dan YouTube Premium .

Kesimpulan dan Pandangan

Dengan kemas kini Gemini 2.5 Pro dan Flash terkini, Google menetapkan penanda aras baharu untuk penaakulan AI, interaktiviti dan produktiviti pembangun. Penilaian pelbagai hipotesis Deep Think, digabungkan dengan audio asli, kemajuan keselamatan dan peningkatan kecekapan, membuka jalan kepada sistem AI yang lebih pintar, boleh dipercayai dan boleh diakses. Apabila model ini dilancarkan pada bulan Jun, penyepaduan mereka merentas Google AI Studio, Gemini API dan Vertex AI akan mempercepatkan inovasi—daripada pembantu pengekodan yang lebih bijak kepada alat pendidikan yang mendalam—membentuk semula cara individu dan organisasi memanfaatkan kecerdasan buatan.

Bermula

CometAPI menyediakan antara muka REST bersatu yang mengagregatkan ratusan model AI—termasuk keluarga Gemini—di bawah titik akhir yang konsisten, dengan pengurusan kunci API terbina dalam, kuota penggunaan dan papan pemuka pengebilan. Daripada menyesuaikan berbilang URL vendor dan bukti kelayakan.

Pembangun boleh mengakses Gemini 2.5 Flash Pra API  (model:gemini-2.5-flash-preview-05-20) dan API Gemini 2.5 Pro (model:gemini-2.5-pro-preview-05-06) dan lain-lain melalui CometAPI. Untuk bermula, terokai keupayaan model di Taman Permainan dan rujuk Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API.

Baca Lagi

500+ Model dalam Satu API

Sehingga 20% Diskaun