Gemini 2.5 Pro I/O: Penjelasan Terperinci Fungsi

Gemini 2.5 Pro Edisi I/O mewakili kemas kini penting kepada model AI utama Google DeepMind, memberikan kehebatan pengekodan yang tiada tandingan, keupayaan input/output yang diperluas dan aliran kerja pembangun yang diperhalusi. Dikeluarkan lebih awal sebelum Google I/O 2025, edisi pratonton ini meningkatkan bahagian hadapan dan pembangunan UI dengan mendapatkan tempat teratas pada Papan Pendahulu Arena WebDev, mencapai pemahaman video terkini dan memperkenalkan peningkatan yang mantap dalam panggilan fungsi dan pengurangan ralat. Harga yang sama dengan pendahulunya—pada $1.25 per juta token masuk dan $10 per juta token keluar—ia menawarkan penyelesaian kos efektif berbanding pesaing sambil mengekalkan tetingkap konteks 200,000 token yang murah hati. Fungsi I/O berbilang mod seperti "video ke kod" dan penjanaan aplikasi sejurus tunggal memudahkan prototaip dan sokongan daripada pemimpin industri menekankan nilai praktikalnya. Memandang ke hadapan, Google merancang untuk memperluaskan kapasiti konteks dan menyepadukan ciri I/O lanjutan, mengukuhkan kedudukan Gemini sebagai alat yang amat diperlukan untuk cabaran pengekodan dunia sebenar .

Apakah Gemini 2.5 Pro Edisi I/O?

Kejadian dan garis masa keluaran

Gemini 2.5 Pro Edisi I/O telah diumumkan pada 6 Mei 2025, sebagai pratonton awal yang direka untuk memberi pemaju permulaan yang lebih awal sebelum persidangan pembangun I/O Google lewat bulan itu . Edisi ini menggantikan keluaran 25 Mac (03-25) dengan model yang dikemas kini berlabel "05-06," secara automatik menghalakan pengguna Gemini 2.5 Pro sedia ada ke versi baharu tanpa sebarang tindakan diperlukan .

Apakah yang membezakan Edisi I/O?

Tidak seperti kemas kini standard yang memfokuskan pada pengoptimuman bahagian belakang, Edisi I/O menekankan keupayaan pengekodan yang lebih kukuh dalam kedua-dua transformasi kod bahagian hadapan dan asas . Ia memperkenalkan fungsi I/O multimodal yang diperhalusi—seperti pemahaman video dan penjanaan aplikasi interaktif—yang mengembangkan utiliti model melangkaui teks dan kod ke dalam domain media yang lebih kaya.

Apakah penambahbaikan tajuk dalam Gemini 2.5 Pro?

Bagaimanakah prestasi pengekodan telah dinaikkan?

Gemini 2.5 Pro kini menyampaikan keupayaan penjanaan kod dan pemfaktoran semula yang "diperbaiki dengan ketara", mengendalikan tugas penstrukturan semula bahagian belakang yang kompleks dengan abstraksi peringkat "pembangun kanan" dan pilihan seni bina. Dalam penanda aras Kognisi dalaman, ia meluluskan kes ujian pembangun lanjutan buat kali pertama, mempamerkan reka bentuk semula modul yang mantap, penulisan semula API dan pelaksanaan logik berbilang langkah tanpa penalaan halus tambahan.

Tambahan pula, kebolehpercayaan panggilan fungsinya telah dipertingkatkan: kadar ralat telah menurun dengan ketara manakala kadar pencetus telah meningkat, membolehkan pembinaan aliran kerja agen yang lebih lancar yang merantai panggilan berbilang fungsi . Pembangun sedia ada yang menggunakan API Gemini akan menemui peralihan yang lancar, kerana sistem secara automatik lalai kepada model yang dinaik taraf tanpa sebarang perubahan kod yang diperlukan .

Apakah keupayaan bahagian hadapan dan UI yang telah ditambahkan?

Dalam bidang pembangunan bahagian hadapan, Gemini 2.5 Pro naik ke kedudukan #1 di papan pendahulu Arena WebDev—kedudukan keutamaan manusia bagi model AI untuk membina aplikasi web yang berfungsi dan menyenangkan dari segi estetik—melepasi Claude 3.7 Sonnet dan versi Gemini sebelumnya dengan lebih 140 mata ELO .

Model ini boleh menterjemahkan mockup reka bentuk secara automatik ke dalam komponen HTML, CSS dan JavaScript yang sedia pengeluaran, lengkap dengan reka letak responsif dan penggayaan yang konsisten. Ia mengiktiraf elemen visual seperti interaksi butang, tipografi, jarak dan animasi, menghasilkan semula mereka dengan setia untuk memastikan modul UI baharu digabungkan secara lancar dengan sistem reka bentuk sedia ada. Sebagai contoh, pembangun yang menggunakan Apl Pemula Gemini 95 boleh meminta "pemain video dipadankan gaya", dan model itu akan membuat kesimpulan token reka bentuk projek dan mengeluarkan komponen sedia untuk digunakan dalam beberapa saat.

Bagaimanakah Gemini 2.5 Pro menggabungkan pemahaman video dengan penjanaan kod?

Gemini 2.5 Pro memanjangkan keupayaan multimodal aslinya ke dalam video: ia mencapai skor 84.8 peratus pada penanda aras VideoMME baharu, kedudukan antara model besar "pemahaman video" teratas yang tersedia . Dengan memanfaatkan kekuatan ini, pembangun boleh membekalkan klip YouTube dan menerima aplikasi pembelajaran atau demonstrasi interaktif sepenuhnya—lengkap dengan kandungan yang diekstrak, skrin UI tersuai dan skrip logik asas .

Demo "Video untuk Belajar Apl" Google AI Studio menggambarkan aliran kerja ini: video tutorial diserap, perkara utama dipetakan kepada modul interaktif dan apl pendidikan siap dihasilkan tanpa campur tangan manusia . Kemajuan ini menandakan peralihan daripada "kod dipacu bahasa" ke arah penciptaan "produk dipacu video" dalam landskap AI multimodal.

Di mana dan bagaimana pembangun boleh mengakses Gemini 2.5 Pro?

Platform dan model harga yang manakah digunakan?

Gemini 2.5 Pro Edisi I/O tersedia serta-merta melalui API Gemini dalam Google AI Studio dan melalui Vertex AI untuk pelanggan perusahaan. Keluaran pratonton mengekalkan harga yang sama seperti versi sebelumnya, memastikan tiada kos tambahan untuk pengguna awal .

Secara lalai, semua panggilan API sedia ada yang menyasarkan titik akhir Gemini 2.5 diubah hala secara automatik ke model Pro baharu (05‑06), menghapuskan overhed migrasi untuk pasukan pembangunan . Kad model terperinci, mendokumentasikan hasil penanda aras dan perubahan ciri, telah diterbitkan bersama keluaran untuk ketelusan.

CometAPI sudah menyokong panggilan API Gemini 2.5 Pro I/O (nama model : ggemini-2.5-pro-preview-05-06).

Bagaimanakah Gemini 2.5 Pro dibandingkan dengan pesaingnya?

Gemini 2.5 Pro

Sejauh manakah kedudukan WebDev Arenanya dominan?

Dengan Skor Arena 1419.95, Gemini 2.5 Pro mendahului papan WebDev Arena, mengatasi Claude 3.7 Sonnet (1357.10) dan GPT‑4.1 (1261.35) dengan margin yang ketara. Lonjakan ini mencerminkan keutamaan pengguna untuk gabungan Gemini bagi kesetiaan reka bentuk, kebolehselenggaraan kod dan penggilap UI.

Apakah yang didedahkan oleh penanda aras AI yang lebih luas?

Di luar bahagian hadapan, Gemini 2.5 Pro meluaskan kelebihannya merentasi penaakulan umum dan penanda aras pengekodan. Pada LMArena—komposit ujian pemahaman AI dan penyelesaian masalah—ia mendahului 39 mata ELO berbanding pesaing terdekat, menurut Ketua Pegawai Eksekutif Google DeepMind Demis Hassabis.

Kehebatan multimodalnya, merangkumi teks, audio, imej, video dan kod, terus membezakannya dalam pasaran di mana penaakulan AI bersepadu dengan pantas menjadi kepentingan meja.

Apakah kes penggunaan dunia sebenar yang menyerlahkan keupayaannya?

Prototaip apl daripada satu gesaan

Salah satu ciri Edisi I/O yang paling dipuji ialah keupayaannya untuk menjana apl web interaktif penuh daripada gesaan bersendirian. Dalam apl Gemini, pengguna boleh memasukkan tema reka bentuk atau corak visual dan menerima kod lengkap untuk aplikasi berfungsi, memendekkan kitaran prototaip secara mendadak.

Aliran kerja dan penyepaduan agen

Model yang dipertingkatkan menguasakan aliran kerja agenik yang canggih, seperti yang ditunjukkan oleh penyepaduan dengan Replit Agent dan ejen kod Kursor. Saluran paip ini mengautomasikan tugas yang kompleks seperti refaktor penghalaan bahagian belakang dan penggayaan komponen UI dengan campur tangan manusia yang minimum.

Apakah maklum balas yang telah diberikan oleh pembangun?

Pengendorsan pemimpin industri

Silas Alberti dari Kognisi memuji kematangan model itu, memetik keupayaannya untuk melakukan refactor berskala besar dengan kualiti membuat keputusan peringkat kanan. Michele Catasta dari Replit menekankan keseimbangan "keupayaan berbanding kependaman" yang unggul, dengan menyatakan kesesuaiannya untuk tugas sensitif kependaman . Paul Couvert, pendidik AI dan pengasas BlueShell, dan Pietro Schirano, Ketua Pegawai Eksekutif EverArt, menekankan kekuatannya dalam penjanaan kod dan UI melalui sokongan media sosial .

Penyepaduan dalam platform seperti Replit dan Cursor

Ujian dalaman kursor menunjukkan kegagalan panggilan alat yang lebih sedikit dan kebolehpercayaan yang dipertingkatkan, mendorong syarikat untuk menyepadukan Edisi I/O ke dalam ejen kod terasnya. Begitu juga, Replit sedang meneroka integrasi yang lebih mendalam untuk bantuan pengekodan masa nyata, memanfaatkan panggilan fungsi yang dipertingkatkan model dan I/O berbilang mod.

Mula Pantas

CometAPI menyediakan akses kepada lebih 500 model AI, termasuk sumber terbuka dan model multimodal khusus untuk sembang, imej, kod dan banyak lagi. Kekuatan utamanya terletak pada memudahkan proses integrasi AI yang kompleks secara tradisional. Dengan itu, akses kepada alatan AI terkemuka seperti Claude, OpenAI, Deepseek dan Gemini tersedia melalui langganan tunggal yang bersatu. Anda boleh menggunakan API dalam CometAPI untuk mencipta muzik dan karya seni, menjana video dan membina aliran kerja anda sendiri

CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan API Gemini 2.5 Pro, dan anda akan mendapat $1 dalam akaun anda selepas mendaftar dan log masuk! Selamat datang untuk mendaftar dan mengalami CometAPI.CometAPI membayar semasa anda pergi,API Gemini 2.5 Pro (nama model: gemini-2.5-pro-preview-05-06) dalam Harga CometAPI distrukturkan seperti berikut:

Token Input: $1 / M token
Token Output: $8 / M token

Untuk penyepaduan pantas, sila lihat Dokumen API