Ciri utama

Penjanaan multimodal (video + audio) — Sora-2-Pro menjana bingkai video bersama audio yang disegerakkan (dialog, bunyi ambien, SFX) dan bukannya menghasilkan video dan audio secara berasingan.
Kesetiaan lebih tinggi / peringkat “Pro” — ditala untuk kesetiaan visual yang lebih tinggi, babak yang lebih mencabar (pergerakan kompleks, oklusi, dan interaksi fizikal), serta konsistensi per-babak yang lebih lama berbanding Sora-2 (bukan Pro). Ia mungkin mengambil masa lebih lama untuk render berbanding model Sora-2 standard.
Kepelbagaian input — menyokong prompt teks tulen, dan boleh menerima bingkai input imej atau imej rujukan untuk memandu komposisi (aliran kerja input_reference).
Cameo / suntikan rupa — boleh memasukkan rupa pengguna yang dirakam ke dalam babak terjana dengan aliran kerja persetujuan dalam aplikasi.
Kemunasabahan fizikal: peningkatan kekekalan objek dan kesetiaan pergerakan (cth., momentum, keapungan), mengurangkan artifak “teleport” yang tidak realistik yang lazim pada sistem terdahulu.
Kebolehkawalan: menyokong prompt berstruktur dan arahan pada peringkat shot agar pencipta boleh menetapkan kamera, pencahayaan, dan jujukan berbilang shot.

Perincian teknikal & permukaan integrasi

Keluarga model: Sora 2 (asas) dan Sora 2 Pro (varian berkualiti tinggi).
Modaliti input: prompt teks, rujukan imej, dan rakaman pendek video/audio cameo untuk rupa.
Modaliti output: video berkod (dengan audio) — parameter didedahkan melalui endpoint /v1/videos (pemilihan model melalui model: "sora-2-pro"). Permukaan API mengikut keluarga endpoint video OpenAI untuk operasi create/retrieve/list/delete.

Latihan & seni bina (ringkasan awam): OpenAI menerangkan Sora 2 sebagai dilatih pada data video berskala besar dengan pasca-latihan untuk memperbaiki simulasi dunia; butiran khusus (saiz model, set data tepat, dan tokenisasi) tidak dihuraikan secara terperinci kepada umum. Jangkakan komputasi berat, tokenizer video khusus/seni bina terspesialis dan komponen penjajaran multimodal.

Endpoint API & aliran kerja: tunjukkan aliran kerja berasaskan tugas: hantar permintaan penciptaan POST (model="sora-2-pro"), terima id tugas atau lokasi, kemudian tinjau atau tunggu sehingga siap dan muat turun fail hasil. Parameter lazim dalam contoh yang diterbitkan termasuk prompt, seconds/duration, size/resolution, dan input_reference untuk permulaan berpandukan imej.

Parameter tipikal :

model: "sora-2-pro"
prompt: penerangan babak dalam bahasa semula jadi, pilihan dengan petunjuk dialog
seconds / duration: panjang klip sasaran ( Pro menyokong kualiti tertinggi dalam tempoh yang tersedia)
size / resolution: laporan komuniti menunjukkan Pro menyokong sehingga 1080p dalam banyak kes penggunaan.

Input kandungan: fail imej (JPEG/PNG/WEBP) boleh dibekalkan sebagai bingkai atau rujukan; apabila digunakan, imej hendaklah sepadan dengan resolusi sasaran dan bertindak sebagai sauh komposisi.

Perilaku rendering: Pro ditala untuk memprioritikan koherens bingkai-ke-bingkai dan fizik yang realistik; ini lazimnya bermaksud masa komputasi yang lebih panjang dan kos per klip yang lebih tinggi berbanding varian bukan Pro.

Prestasi penanda aras

Kekuatan kualitatif: OpenAI menambah baik realisme, konsistensi fizik, dan audio yang disegerakkan** berbanding model video terdahulu. Keputusan VBench lain menunjukkan Sora-2 dan derivatifnya berada di atau hampir puncak model tertutup kontemporari dan koherens temporal.

Pemasa/kelajuan bebas (contoh penanda aras): Sora-2-Pro mengambil purata ~2.1 minutes untuk klip 1080p selama 20 saat dalam satu perbandingan, manakala pesaing (Runway Gen-3 Alpha Turbo) lebih pantas (~1.7 minutes) pada tugas yang sama — pertukaran ialah kualiti vs latensi render dan pengoptimuman platform.

Batasan (praktikal & keselamatan)

Fizik/konsistensi tidak sempurna — bertambah baik tetapi tidak sempurna; artifak, pergerakan tidak semula jadi, atau ralat penyegerakan audio masih boleh berlaku.
Kekangan durasi & komputasi — klip panjang memerlukan komputasi intensif; banyak aliran kerja praktikal mengehadkan klip kepada durasi pendek (cth., satu digit hingga puluhan saat yang rendah untuk output berkualiti tinggi).
Risiko privasi / persetujuan — suntikan rupa (“cameo”) menimbulkan risiko persetujuan dan salah maklumat/disinformasi; OpenAI mempunyai kawalan keselamatan dan mekanisme pembatalan yang jelas dalam aplikasi, namun integrasi yang bertanggungjawab diperlukan.
Kos & latensi — render berkualiti Pro boleh lebih mahal dan lebih perlahan daripada model lebih ringan atau pesaing; ambil kira pengebilan per‑saat/per‑render dan penggiliran.
Penapisan kandungan keselamatan — penjanaan kandungan berbahaya atau berhak cipta adalah terhad; model dan platform merangkumi lapisan keselamatan dan pemoderasian.

Kes penggunaan biasa dan disyorkan

Kes penggunaan:

Prototip pemasaran & iklan — pantas mencipta bukti konsep sinematik.
Pravisualisasi — papan cerita, blocking kamera, visualisasi shot.
Kandungan sosial pendek — klip bergaya dengan dialog dan SFX yang disegerakkan.
Cara mengakses API Sora 2 Pro

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI. Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.

cometapi-key

Langkah 2: Hantar Permintaan ke API Sora 2 Pro

Pilih endpoint “sora-2-pro” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. base url is office Create video

Masukkan soalan atau permintaan anda ke dalam medan content—ini ialah perkara yang akan direspons oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan dan Sahkan Keputusan

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas pemprosesan, API memberikan status tugas dan data output.

Latihan / simulasi dalaman — jana visual senario untuk penyelidikan RL atau robotik (dengan berhati-hati).
Produksi kreatif — apabila digabungkan dengan suntingan manusia (cantum klip pendek, gred, gantikan audio).

Model Name	Tags	Orientation	Resolution	Price
sora-2-pro	videos	Portrait	720x1280	$0.24 / sec
sora-2-pro	videos	Landscape	1280x720	$0.24 / sec
sora-2-pro	videos	Portrait (High Res)	1024x1792	$0.40 / sec
sora-2-pro	videos	Landscape (High Res)	1792x1024	$0.40 / sec
sora-2-pro-all	-	Universal / All	-	$0.80000

Sora 2 Pro

Ciri utama

Perincian teknikal & permukaan integrasi

Prestasi penanda aras

Batasan (praktikal & keselamatan)

Kes penggunaan biasa dan disyorkan

Langkah 1: Daftar untuk Kunci API

Langkah 2: Hantar Permintaan ke API Sora 2 Pro

Langkah 3: Dapatkan dan Sahkan Keputusan

Soalan Lazim

Adakah Sora 2 Pro menjana audio yang disegerakkan dengan video?

Apakah resolusi dan tempoh yang disokong oleh Sora 2 Pro?

Bagaimanakah Sora 2 Pro berbeza daripada Sora 2 standard?

Bolehkah Sora 2 Pro menggunakan imej rujukan untuk membimbing penjanaan video?

Adakah Sora 2 Pro menyokong suntikan rupa (cameo)?

Berapa lamakah masa yang diambil oleh Sora 2 Pro untuk merender video?

Apakah penambahbaikan fizik yang ditawarkan oleh Sora 2 Pro?

Bilakah saya patut memilih Sora 2 Pro berbanding Google Veo 3?

Ciri-ciri untuk Sora 2 Pro

Harga untuk Sora 2 Pro

Kod contoh dan API untuk Sora 2 Pro

Lebih Banyak Model