Google Luncurkan Model Imagen 4, Imagen 4 Ultra dan Veo 3 di Google I/O 2025

Google akan segera meluncurkan model AI generatif generasi berikutnya—Gambar 4, Gambar 4 Ultra, dan Veo 3—selama konferensi pengembang Google I/O tahunannya pada 20 Mei 2025Kebocoran awal pengenal pratinjau (misalnya, imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview) menandakan peluncuran bertahap dan beberapa tingkatan kapabilitas di seluruh domain sintesis gambar dan video. Imagen 4 bertujuan untuk memberikan peningkatan signifikan dalam fotorealisme, ketepatan perintah, dan konsistensi gaya dibandingkan Imagen 3, sementara varian "Ultra" mungkin menawarkan resolusi yang lebih tinggi atau mode kinerja khusus. Di sisi video, Veo 3 menjanjikan kontinuitas klip-ke-klip yang lebih koheren dan kepatuhan gaya yang kuat dibandingkan dengan Veo 2. Ketiga model diharapkan terintegrasi erat dengan ekosistem AI Gemini Google, yang memungkinkan transisi mulus dari perintah teks ke gambar atau video dalam alur kerja yang sama.

Pratinjau Pengenal dan Strategi Peluncuran

Pratinjau Bertahap: Referensi internal seperti

imagen-4.0-generate-preview-05-20
imagen-4.0-ultra-generate-exp-05-20
veo-3.0-generate-preview

Google Luncurkan Model Imagen 4, Imagen 4 Ultra dan Veo 3 di Google I/O 2025

Telah muncul dalam repositori kode dan pratinjau API, menunjukkan niat Google untuk menawarkan tingkatan performa standar dan "Ultra" untuk pembuatan gambar, serta pratinjau model video tingkat lanjut untuk penguji awal.

Peluncuran Google I/O:

Pengenal ini sangat menyarankan Google akan memamerkan dan berpotensi memberikan akses pratinjau kepada pengembang di I/O pada 20 Mei 2025, mencerminkan peluncuran sebelumnya untuk Imagen 3 dan Veo 2.

Apa yang Baru di Imagen 4

Fotorealisme dan Kesetiaan

Peningkatan Rendering: Imagen 4 dilaporkan mencapai detail fotorealistik yang lebih baik, mengurangi artefak, dan meningkatkan akurasi warna. Rumor awal menunjukkan peningkatan dalam memahami perintah yang rumit, seperti pencahayaan atau pantulan yang bernuansa.
Kepatuhan yang Cepat:Model ini diharapkan dapat mengikuti instruksi pengguna dengan lebih tepat, menghasilkan gambar yang lebih sesuai dengan arahan konten dan gaya (misalnya, “lukisan cat minyak matahari terbenam di atas pegunungan”).

Konsistensi Gaya

Kohesi Multi-Gambar: Imagen 4 dirancang untuk mempertahankan gaya visual yang konsisten di berbagai keluaran, memberikan manfaat untuk kasus penggunaan seperti pembuatan papan cerita atau katalog produk, di mana keseragaman sangat penting.
Varian Ultra: Tingkat “Ultra” (imagen‑4.0‑ultra) kemungkinan menawarkan keluaran beresolusi lebih tinggi atau pengoptimalan khusus (misalnya, fidelitas ultra tinggi untuk media cetak) untuk profesional perusahaan dan kreatif.

Apa yang Baru di Veo 3

Peningkatan Koherensi

Kontinuitas Klip-ke-Klip: Veo 3 bertujuan untuk menghasilkan rangkaian video di mana pengambilan gambar yang berurutan mempertahankan pembingkaian, pencahayaan, dan penampilan karakter yang konsisten, mengatasi keterbatasan dalam Veo 2 seputar penyimpangan visual dari waktu ke waktu.
Kesetiaan Gaya:Model ini berfokus pada replikasi gaya artistik atau sinematik dengan lebih tepat, sehingga lebih mudah untuk menghasilkan video dalam estetika yang diinginkan (misalnya, animasi noir, pastel).

Integrasi Watermarking SynthID

Watermarking Digital: Memanfaatkan teknologi SynthID DeepMind (diperkenalkan dengan Veo 2), Veo 3 akan menyematkan tanda air yang tidak terlihat untuk membantu mengidentifikasi konten yang dihasilkan AI dan mengurangi penyalahgunaan.

Integrasi dengan Gemini AI

Akses Tanpa Batas:Baik Imagen 4 maupun Veo 3 diharapkan dapat diakses langsung melalui antarmuka Google Gemini—memungkinkan pengguna menghasilkan gambar atau video dalam perintah berbasis obrolan atau melalui antarmuka produk seperti Google Photos dan Google Slides.
Permata Gemini:“Gems” AI yang disesuaikan dapat menggabungkan model-model ini, yang memungkinkan pengguna untuk membuat asisten khusus (misalnya, Gem perencanaan perjalanan yang menghasilkan gambar rencana perjalanan dan video ikhtisar) dan membagikannya di pasar yang mirip dengan GPT Store milik ChatGPT.

Ketersediaan dan Langkah Berikutnya

Preview publik:Pengembang dan penguji perusahaan dapat menerima undangan untuk bereksperimen dengan Imagen 4 (standar dan Ultra) dan Veo 3 mulai 20 Mei 2025 di Google I/O, dengan peluncuran yang lebih luas ke Labs dan Vertex AI dalam minggu-minggu berikutnya.

Umpan Balik dan Iterasi: Seperti peluncuran sebelumnya, Google kemungkinan akan meminta masukan pengguna untuk menyempurnakan filter keamanan, ketahanan tanda air, dan pengoptimalan kinerja sebelum ketersediaan umum.

Tonton Ruang Ini:pengembang yang berminat harus memantau API Komet.

API model baru akan dicantumkan di CometAPI, dan dijanjikan akan memberikan harga yang lebih rendah daripada Google untuk memudahkan integrasi Anda. Harap terus perhatikan Dokumen API.