Gemini 2.5 Pro I/O: Penjelasan Fungsi Secara Rinci

CometAPI
AnnaMay 8, 2025
Gemini 2.5 Pro I/O: Penjelasan Fungsi Secara Rinci

Gemini 2.5 Pro I/O Edition merupakan pembaruan penting bagi model AI andalan Google DeepMind, yang menghadirkan kecakapan pengodean yang tak tertandingi, kemampuan input/output yang diperluas, dan alur kerja pengembang yang disempurnakan. Dirilis lebih awal sebelum Google I/O 2025, edisi pratinjau ini meningkatkan pengembangan frontend dan UI dengan mengamankan posisi teratas di WebDev Arena Leaderboard, mencapai pemahaman video terkini, dan memperkenalkan peningkatan yang kuat dalam pemanggilan fungsi dan pengurangan kesalahan. Dengan harga yang sama dengan pendahulunya—dengan harga 1.25 per juta token masuk dan 10 per juta token keluar—produk ini menawarkan solusi hemat biaya dibandingkan pesaing sambil mempertahankan jendela konteks 200,000 token yang besar. Fungsi I/O multimodal seperti "video to code" dan pembuatan aplikasi dengan perintah tunggal menyederhanakan pembuatan prototipe, dan dukungan dari para pemimpin industri menggarisbawahi nilai praktisnya. Ke depannya, Google berencana untuk memperluas kapasitas konteks dan mengintegrasikan fitur I/O tingkat lanjut, memperkuat posisi Gemini sebagai alat yang sangat diperlukan untuk tantangan pengkodean dunia nyata.

Apa itu Gemini 2.5 Pro I/O Edition?

Genesis dan jadwal rilis

Edisi Gemini 2.5 Pro I/O diumumkan pada tanggal 6 Mei 2025, sebagai pratinjau awal yang dirancang untuk memberi pengembang kesempatan memulai sebelum konferensi pengembang Google I/O akhir bulan itu. Edisi ini menggantikan rilis tanggal 25 Maret (03-25) dengan model yang diperbarui yang diberi label “05-06,” yang secara otomatis mengarahkan pengguna Gemini 2.5 Pro yang ada ke versi baru tanpa perlu tindakan apa pun.

Apa yang membedakan Edisi I/O?

Tidak seperti pembaruan standar yang difokuskan pada pengoptimalan backend, Edisi I/O menekankan kemampuan pengodean yang jauh lebih kuat dalam transformasi kode front-end dan fundamental. Edisi ini memperkenalkan fungsi I/O multimodal yang disempurnakan—seperti pemahaman video dan pembuatan aplikasi interaktif—yang memperluas utilitas model di luar teks dan kode ke domain media yang lebih kaya.

Apa saja peningkatan utama pada Gemini 2.5 Pro?

Bagaimana kinerja pengkodean ditingkatkan?

Gemini 2.5 Pro kini menghadirkan kemampuan pembuatan dan pemfaktoran ulang kode yang "sangat ditingkatkan", menangani tugas-tugas restrukturisasi back-end yang rumit dengan abstraksi dan pilihan arsitektur tingkat "pengembang senior". Dalam tolok ukur Cognition internal, ia lulus uji kasus pengembang tingkat lanjut untuk pertama kalinya, memamerkan desain ulang modul yang tangguh, penulisan ulang API, dan implementasi logika multi-langkah tanpa penyempurnaan tambahan.

Lebih jauh lagi, keandalan pemanggilan fungsinya telah ditingkatkan: tingkat kesalahan telah menurun secara substansial sementara tingkat pemicu telah meningkat, memungkinkan konstruksi alur kerja agen yang lebih lancar yang merangkai beberapa pemanggilan fungsi. Pengembang yang sudah ada yang menggunakan API Gemini akan menemukan transisi yang mulus, karena sistem secara otomatis kembali ke model yang ditingkatkan tanpa perubahan kode yang diperlukan.

Kemampuan front‑end dan UI apa yang telah ditambahkan?

Dalam bidang pengembangan front-end, Gemini 2.5 Pro naik ke posisi #1 di papan peringkat WebDev Arena—peringkat preferensi manusia untuk model AI dalam membangun aplikasi web yang fungsional dan menarik secara estetika—melampaui Claude 3.7 Sonnet dan versi Gemini sebelumnya dengan lebih dari 140 poin ELO.

Model ini dapat secara otomatis menerjemahkan rancangan tiruan menjadi komponen HTML, CSS, dan JavaScript yang siap produksi, lengkap dengan tata letak responsif dan gaya yang konsisten. Model ini mengenali elemen visual seperti interaksi tombol, tipografi, spasi, dan animasi, mereproduksinya dengan tepat untuk memastikan modul UI baru berpadu mulus dengan sistem desain yang ada. Misalnya, pengembang yang menggunakan Aplikasi Gemini 95 Starter dapat meminta "pemutar video yang sesuai dengan gaya", dan model akan menyimpulkan token desain proyek dan menghasilkan komponen yang siap digunakan dalam hitungan detik.

Bagaimana Gemini 2.5 Pro memadukan pemahaman video dengan pembuatan kode?

Gemini 2.5 Pro memperluas kemampuan multimoda bawaannya ke dalam video: ia mencapai skor 84.8 persen pada tolok ukur VideoMME baru, yang menempati peringkat teratas di antara model besar "pemahaman video" yang tersedia. Dengan memanfaatkan kekuatan ini, pengembang dapat menyediakan klip YouTube dan menerima aplikasi pembelajaran atau demonstrasi yang sepenuhnya interaktif—lengkap dengan konten yang diekstrak, layar UI khusus, dan skrip logika yang mendasarinya.

Demo “Video to Learning App” dari Google AI Studio menggambarkan alur kerja ini: video tutorial dimasukkan, poin-poin utama dipetakan ke modul-modul interaktif, dan aplikasi pendidikan yang telah selesai dibuat tanpa campur tangan manusia. Kemajuan ini menandakan peralihan dari “kode berbasis bahasa” ke arah pembuatan “produk berbasis video” dalam lanskap AI multimoda.

Di mana dan bagaimana pengembang dapat mengakses Gemini 2.5 Pro?

Platform dan model harga mana yang berlaku?

Edisi Gemini 2.5 Pro I/O segera tersedia melalui API Gemini di Google AI Studio dan melalui Vertex AI untuk pelanggan perusahaan. Rilis pratinjau mempertahankan harga yang sama dengan versi sebelumnya, sehingga tidak ada biaya tambahan bagi pengguna awal.

Secara default, semua panggilan API yang ada yang menargetkan titik akhir Gemini 2.5 secara otomatis dialihkan ke model Pro baru (05‑06), sehingga menghilangkan beban migrasi bagi tim pengembangan. Kartu model terperinci, yang mendokumentasikan hasil tolok ukur dan perubahan fitur, telah diterbitkan bersamaan dengan rilis untuk transparansi.

CometAPI sudah mendukung pemanggilan Gemini 2.5 Pro I/O API (nama model: ggemini-2.5-pro-preview-05-06).

Bagaimana Gemini 2.5 Pro dibandingkan dengan pesaingnya?

Gemini 2.5 Pro

Seberapa dominan peringkat WebDev Arena-nya?

Dengan Skor Arena sebesar 1419.95, Gemini 2.5 Pro memimpin papan WebDev Arena, mengungguli Claude 3.7 Sonnet (1357.10) dan GPT‑4.1 (1261.35) dengan selisih yang signifikan. Lonjakan ini mencerminkan preferensi pengguna terhadap kombinasi kesetiaan desain, kemudahan pemeliharaan kode, dan polesan UI Gemini.

Apa yang terungkap dari tolok ukur AI yang lebih luas?

Di luar front-end, Gemini 2.5 Pro memperluas keunggulannya di seluruh tolok ukur penalaran umum dan pengkodean. Di LMArena—gabungan dari pengujian pemahaman AI dan pemecahan masalah—ia unggul 39 poin ELO atas pesaing terdekatnya, menurut CEO Google DeepMind Demis Hassabis.

Keahlian multimodalnya, yang mencakup teks, audio, gambar, video, dan kode, terus membedakannya di pasar di mana penalaran AI terintegrasi dengan cepat menjadi hal yang lumrah.

Kasus penggunaan dunia nyata apa yang menonjolkan kemampuannya?

Pembuatan prototipe aplikasi dari satu perintah

Salah satu fitur Edisi I/O yang paling dipuji adalah kemampuannya untuk menghasilkan aplikasi web interaktif penuh dari satu perintah tunggal. Di dalam aplikasi Gemini, pengguna dapat memasukkan tema desain atau pola visual dan menerima kode lengkap untuk aplikasi yang berfungsi, sehingga secara drastis mempersingkat siklus pembuatan prototipe.

Alur kerja dan integrasi agen

Model yang disempurnakan ini mendukung alur kerja agen yang canggih, seperti yang dicontohkan oleh integrasi dengan Replit Agent dan agen kode Cursor. Alur kerja ini mengotomatiskan tugas-tugas rumit seperti refaktor perutean backend dan penataan komponen UI dengan intervensi manusia yang minimal.

Masukan apa yang diberikan pengembang?

Dukungan pemimpin industri

Silas Alberti dari Cognition memuji kematangan model tersebut, dengan menyebutkan kemampuannya untuk melakukan refaktor skala besar dengan kualitas pengambilan keputusan tingkat senior. Michele Catasta dari Replit menekankan keseimbangan "kemampuan atas latensi" yang unggul, dengan mencatat kesesuaiannya untuk tugas-tugas yang sensitif terhadap latensi. Paul Couvert, pendidik AI dan pendiri BlueShell, dan Pietro Schirano, CEO EverArt, menggarisbawahi kekuatannya dalam pembuatan kode dan UI melalui dukungan media sosial.

Integrasi pada platform seperti Replit dan Cursor

Pengujian internal Cursor menunjukkan lebih sedikit kegagalan pemanggilan alat dan peningkatan keandalan, yang mendorong perusahaan untuk mengintegrasikan Edisi I/O ke dalam agen kode intinya. Demikian pula, Replit sedang menjajaki integrasi yang lebih mendalam untuk bantuan pengodean waktu nyata, memanfaatkan pemanggilan fungsi model yang ditingkatkan dan I/O multimodal.

Ringkas

CometAPI menyediakan akses ke lebih dari 500 model AI, termasuk model multimoda sumber terbuka dan khusus untuk obrolan, gambar, kode, dan banyak lagi. Kekuatan utamanya terletak pada penyederhanaan proses integrasi AI yang secara tradisional rumit. Dengannya, akses ke alat AI terkemuka seperti Claude, OpenAI, Deepseek, dan Gemini tersedia melalui satu langganan terpadu. Anda dapat menggunakan API di CometAPI untuk membuat musik dan karya seni, membuat video, dan membangun alur kerja Anda sendiri

API Komet menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda mengintegrasikan Gemini 2.5 Pro API, dan Anda akan mendapatkan $1 di akun Anda setelah mendaftar dan masuk! Selamat datang untuk mendaftar dan mencoba CometAPI.CometAPI membayar sesuai pemakaian,Gemini 2.5 Pro API (nama model : gemini-2.5-pro-preview-05-06) dalam Harga CometAPI disusun sebagai berikut:

  • Token Masukan: $1 / M token
  • Token Keluaran: $8 / M token

Untuk integrasi cepat, silakan lihat Dokumen API

SHARE THIS BLOG

Baca Selengkapnya

500+ Model dalam Satu API

Diskon hingga 20%