Veo 3.1 akan datang (dan apakah khabar angin): apa yang kita tahu dan Apa yang akan dibawanya?

Veo 3.1 Akan Datang: Saya lihat ialah keluarga model penjanaan video AI Google (Veo 3 / Veo 3 Fast adalah terkini). Google baru-baru ini telah menghantar peningkatan besar Veo 3 (menegak 9:16, 1080p, Veo 3 Fast, harga yang lebih rendah) dan terdapat khabar angin / siaran sosial Bahawa Veo 3.1 akan berlaku — tetapi Google telah melakukannya tidak menerbitkan buletin keluaran Veo 3.1 rasmi lagi. Saya akan menyenaraikan fakta yang disahkan, kemungkinan/perubahan yang dijangkakan, dan perbandingan langsung dengan OpenAI Sora 2.

Servis Saya lihat is

Saya lihat ialah barisan model video generatif Google (DeepMind / Google Cloud / keluarga Gemini) yang menukar teks atau imej kepada video pendek — dan (dalam Veo 3) menjana audio secara asli (kesan bunyi, audio ambien dan dialog). Ia ditawarkan pada Google Cloud (Vertex AI / Gemini API) untuk pembangun dan perusahaan, dan termasuk tanda air asal terbina dalam / SynthID pada output.

Servis Veo 3 sudah dibawa

Teks → video and imej → video keupayaan (termasuk pratonton imej-ke-video).
Penjanaan audio asli (muzik, bunyi ambien, dialog) — Veo 3 memperkenalkan audio kelas pertama.
Dua varian: Veo 3 dan berkualiti tinggi Saya nampak 3 Fast (dioptimumkan untuk kelajuan/lelaran).
Ketersediaan platform: tersedia dalam Vertex AI / Gemini API (pratonton berbayar → kemas kini ketersediaan umum pada pertengahan 2025).
Keselamatan/sumber: Penanda air SynthID dan sesetengah generasi menggunakan kawalan/kelulusan untuk penjanaan orang/kanak-kanak.

Jadi - apa itu Veo 3.1 dijangka membawa?

status: Setakat ini tiada halaman produk Veo 3.1 rasmi daripada Google yang menerangkan nota keluaran penuh. Walau bagaimanapun, berbilang siaran Google dev / siaran komuniti dan tweet menunjukkan kemas kini tambahan jangka pendek (berlabel "Veo 3.1") yang dijangka menumpukan pada penambahbaikan berulang kepada sokongan audio, kualiti dan format dan bukannya penulisan semula generasi baharu sepenuhnya.

Berikut adalah beberapa kesimpulan yang saya buat berdasarkan siaran x dan ciri-ciri Veo3:

Audio asli yang dipertingkatkan (dialog, penyegerakan bibir berbilang suara) —dialog yang lebih bersih, pencampuran dan penspasian SFX yang lebih baik). Veo 3 sudah menjana audio secara asli; Veo 3.1 boleh meningkatkan realisme dialog dan sokongan bahasa untuk memadankan peningkatan terkini yang sedang dihantar oleh pesaing.
Laluan yang lebih pantas/murah untuk beberapa output biasa (lebih banyak pariti dan pengoptimuman Veo 3 Fast).
Imej → video yang dipertingkatkan dan konsistensi watak/pose yang lebih baik dalam klip berbilang bingkai.
Nisbah aspek / kawalan resolusi diperluas (lebih fleksibel 9:16/16:9 dan 1080p merentas konfigurasi). Google sudah menambah menegak + 1080p; Veo 3.1 boleh mengembangkan kawalan tersebut.
Klip yang lebih panjang / penutup 8 saat yang santai — permintaan komuniti dan pelan hala tuju Google sebelum ini mencadangkan peningkatan tempoh adalah sasaran yang berkemungkinan (Veo 3 hari ini dioptimumkan untuk klip 8 saat).
Imej yang lebih baik→kesetiaan video dan sokongan imej-ke-video yang dilanjutkan (penambahbaikan kepada realisme, kesinambungan gerakan), membina imej → pratonton video dalam Veo 3.

Veo 3.1 akan datang (dan apakah khabar angin): apa yang kita tahu dan Apa yang akan dibawanya?

Bandingkan Veo 3 / (dijangka) Veo 3.1 → OpenAI Sora 2

Fokus utama

Veo 3 (Google): video pendek, kesetiaan tinggi 8 saat daripada gesaan teks/imej; audio asli; disepadukan ke dalam Gemini/Gemini API dan Vertex AI; dioptimumkan untuk kegunaan pengeluaran dan penyepaduan API pembangun.
Sora 2 (OpenAI): Model video+audio unggul OpenAI yang menekankan realisme fizikal, gerakan koheren, dialog dan bunyi yang disegerakkan serta aplikasi sosial (Sora) yang disertakan dengan sistem cameo/persetujuan untuk menyepadukan keserupaan pengguna dan banyak menumpukan pada realisme dan kawalan keselamatan.

Kekuatan

Veo (sekarang): penyepaduan pembangun/perusahaan yang kukuh (Vertex AI, Gemini API), pilihan harga pengeluaran, laluan yang jelas untuk pelanggan awan, varian menegak/1080p + pantas. Baik untuk perniagaan membina saluran paip.
Sora 2: ketepatan fizikal yang luar biasa dan penyegerakan berbilang modal (dialog + visual), dan apl yang dihadapi pengguna yang disepadukan dengan aliran kerja sosial (ciri kameo, penyederhanaan). Bagus untuk pencipta yang mahukan adegan naratif yang realistik dan ekosistem apl.

Cara mengakses Veo sekarang — dan cara bersedia untuk Veo 3.1

Cuba dalam Gemini (pengguna / web / mudah alih): Penjanaan Veo didedahkan dalam apl Gemini (ketik pilihan "video" dalam bar gesaan). Tahap akses (Pro / Ultra) mempengaruhi varian Veo yang boleh anda gunakan.
Secara pemrograman / perusahaan: gunakan API in CometAPI (ID model Veo tersedia dalam dokumen model). CometAPI menyediakan veo3-pro, veo3-fast dan veo3. Untuk butiran, sila rujuk Veo 3 's doc.

Petua praktikal (pembangun): untuk meminta output menegak, tetapkan aspectRatio parameter (cth "9:16") dan semak konfigurasi model (Veo 3 lwn Veo 3 Fast) dan pelan anda untuk had peleraian (720p lwn 1080p).

Bagaimana untuk mengakses Sora 2 (hari ini)

Aplikasi Sora: Sora 2 dilancarkan dengan apl Sora (pelancaran terhad jemputan di AS & Kanada semasa pelancaran). OpenAI menunjukkan akses yang lebih luas dan pengembangan API kemudian. Jika anda ingin mencuba Sora 2 sekarang, semak CpmetAPI's Sora 2 muka surat. CometAPI telah pun menyokong sora 2 API dan menghasilkan ~10 saat klip sosial dan penekanan pada realisme gerakan untuk orang ramai.

Bermula

CometAPI ialah platform API bersatu yang mengagregatkan lebih 500 model AI daripada pembekal terkemuka—seperti siri GPT OpenAI, Google Gemini, Anthropic's Claude, Midjourney, Suno dan banyak lagi—menjadi satu antara muka mesra pembangun. Dengan menawarkan pengesahan yang konsisten, pemformatan permintaan dan pengendalian respons, CometAPI secara dramatik memudahkan penyepaduan keupayaan AI ke dalam aplikasi anda. Sama ada anda sedang membina chatbots, penjana imej, komposer muzik atau saluran paip analitik terdorong data, CometAPI membolehkan anda mengulangi dengan lebih pantas, mengawal kos dan kekal sebagai vendor-agnostik—semuanya sambil memanfaatkan penemuan terkini merentas ekosistem AI.

Pembangun boleh mengakses API Veo 3.1 melalui CometAPI, versi model terkini sentiasa dikemas kini dengan laman web rasmi. Untuk memulakan, terokai keupayaan model dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.

Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !