Sora 2 ialah model teks-ke-video pertama yang tersedia secara umum daripada OpenAI, boleh diakses secara programatik melalui kedua-dua OpenAI API rasmi dan rangkaian pengagregator yang semakin berkembang. Model harga adalah luar biasa berbanding model teks (pengebilan adalah setiap saat video yang dijana dan bukannya setiap token), dan soalan praktikal yang ditanya pembangun sebelum mengintegrasi adalah berbeza daripada API LLM. Berapakah kos sebenar satu klip? Berapa lama masa generasi diambil? Apakah had kadar? Apa yang berubah apabila anda mengakses Sora melalui pengagregator dan bukan terus dari OpenAI?
Artikel ini ialah rujukan yang kami harap wujud ketika kami mula menilai ciri penjanaan video kami sendiri. Rangkaiannya disusun untuk pembangun yang sudah melepasi “adakah Sora menarik?” dan kini perlu menjawab “berapa kosnya, apa yang diperlukan untuk integrasi, dan apa yang perlu saya tahu sebelum saya membuat komitmen?”
Bacaan ringkas: Sora 2 (model standard) berharga $0.10 setiap saat video yang dijana pada 720p. Sora 2 Pro berharga $0.30 setiap saat pada 720p atau $0.50 setiap saat pada 1024p. Klip 10 saat tipikal berharga $1.00 pada model standard dan $5.00 pada Pro di HD. Masa generasi adalah async; jangka 30–90 saat masa sebenar (wall-clock) untuk klip 5–10 saat. Akses memerlukan akaun OpenAI berbayar pada peringkat penggunaan minimum tier 2.
Keadaan akses Sora API pada 2026
Sora 2 dilancarkan dalam OpenAI API pada 7 Oktober 2025, dan akses tersedia secara berterusan sejak itu. Pengenal pasti model ialah sora-2 (dengan ID snapshot semasa sora-2-2025-12-08), dan varian ketelitian lebih tinggi ialah sora-2-pro. Kedua-duanya menyokong penjanaan teks-ke-video dan imej-ke-video, dengan output audio yang disegerakkan. Pada 10 Januari 2026, akses pengguna peringkat percuma melalui produk ChatGPT telah dihentikan, yang menumpukan penggunaan Sora peringkat pembangun sama ada kepada langganan ChatGPT berbayar atau akses API terus.
Terdapat tiga laluan untuk menggunakan Sora secara programatik:
- OpenAI direct API. Laluan kanonik. Pengebilan setiap saat, berbayar sahaja, memerlukan tambah nilai minimum $10 untuk mencapai tier penggunaan 2 yang membuka akses model Sora. SDK dan REST API kedua-duanya disokong.
- Azure OpenAI. Laluan perusahaan Microsoft, mencerminkan kadar rasmi OpenAI dengan tambahan overhed langganan Azure dan ciri pematuhan perusahaan. Harga setiap saat yang sama; permukaan operasi berbeza.
- Pengagregator. Perkhidmatan yang mendedahkan Sora di belakang API bersatu mereka sendiri. Kebanyakan pengagregator meneruskan harga setiap saat OpenAI pada pariti; nilainya adalah operasi (satu kelayakan, satu bil, SDK yang sama seperti trafik model teks anda). Sesetengah pengagregator menawarkan struktur tarif mereka sendiri, yang kami bincangkan kemudian dalam artikel.
Harga Sora 2 setiap saat video
Harga Sora disusun mengikut tier model dan resolusi output, dengan kadar setiap saat yang didarabkan dengan durasi klip untuk memberikan kos penjanaan. Disahkan daripada halaman harga rasmi OpenAI setakat Mei 2026:
| Model | Resolusi | Durasi disokong | Harga per saat | Klip 10 saat |
|---|---|---|---|---|
| Sora 2 (standard) | 720p | 4s, 8s, 12s | $0.10 | $1.00 |
| Sora 2 Pro | 720p | 10s, 15s, 25s | $0.30 | $3.00 |
| Sora 2 Pro | 1024p (1792×1024) | 10s, 15s, 25s | $0.50 | $5.00 |
Nota tentang struktur harga. Harga adalah mengikut output, bukan input; tiada pengebilan input berasaskan token untuk Sora seperti model teks. Pengkondisian imej (menghantar imej rujukan untuk memacu penjanaan) tidak mengubah kadar setiap saat. Pilihan durasi bagi setiap tier model adalah tetap: anda tidak boleh meminta klip 7 saat pada model standard, hanya 4, 8, atau 12 saat.
Dua implikasi praktikal yang wajar diperjelaskan. Pertama: model harga lebih hampir kepada bil rendering video berbanding bil LLM. Kos didorong oleh durasi output, bukan oleh betapa kompleksnya prompt anda atau berapa banyak token yang ia mengandungi. Kedua: perbezaan kos antara Sora 2 dan Sora 2 Pro pada HD adalah 5x setiap saat: klip 10 saat berharga $1.00 pada standard dan $5.00 pada Pro pada 1024p. Memilih tier yang betul untuk tugasan ialah tuil kos terbesar yang anda ada, dan wajar untuk berhati-hati tentang beban kerja mana yang benar-benar memerlukan ketelitian lebih tinggi Pro.
Had kadar dan kuota
Had kadar Sora dianjurkan di sekitar sistem tier penggunaan standard OpenAI. Butiran penting khusus untuk Sora:
- Keperluan tier minimum: Tier 2, dicapai dengan menambah nilai sekurang-kurangnya $10 kredit API. Tier 1 (lalai untuk akaun baharu) tidak termasuk akses model Sora.
- Had generasi serentak: Mengikut dokumentasi had kadar OpenAI, penjanaan video serentak dihadkan mengikut tier, biasanya bilangan kecil generasi in-flight pada tier lebih rendah, berskala dengan tier penggunaan. Siling tepat ditetapkan pada asas per-akaun dan dapat dilihat dalam papan pemuka OpenAI. Untuk beban kerja volum tinggi, rancang untuk akses tier-3 atau tier-4 dari hari pertama.
- Permintaan kuota: Had kebergantungan serentak yang lebih tinggi melebihi siling tier lalai boleh diminta melalui borang peningkatan had kadar OpenAI. Kelulusan adalah khusus beban kerja dan tidak serta-merta; untuk pelancaran produksi dengan lonjakan permintaan yang boleh diramal, minta peningkatan beberapa minggu sebelum pelancaran.
Perlu diketahui: had kadar pada Sora dikumpulkan secara berbeza daripada had kadar model teks pada akaun yang sama. Pasukan yang menjalankan trafik Sora berat tidak menjejaskan bajet had kadar yang tersedia untuk panggilan GPT-5.5 mereka. Sebaliknya, trafik GPT-5.5 yang besar tidak menjejaskan bajet Sora. Rancang keduanya sebagai soalan kapasiti berasingan.
Masa generasi: apa yang sebenarnya dijangka
Sora adalah async secara reka bentuk. Anda menghantar permintaan penjanaan, menerima ID tugasan, dan memantau (atau webhook kembali) untuk penyiapan. Masa sebenar (wall-clock) antara permintaan dan penyiapan bergantung pada durasi dan resolusi output, beban semasa pada infrastruktur OpenAI, dan sama ada tugasan beratur di belakang yang lain pada akaun anda.
Jangkaan realistik berdasarkan tingkah laku yang diperhatikan:
| Output | Masa sebenar tipikal | Nota |
|---|---|---|
| Sora 2 standard, 4s @ 720p | 20–45 saat | Laluan terpantas; baik untuk iterasi |
| Sora 2 standard, 8s @ 720p | 40–90 saat | Durasi produksi paling lazim |
| Sora 2 standard, 12s @ 720p | 60–120 saat | Kandungan sosial bentuk panjang |
| Sora 2 Pro, 10s @ 720p | 60–150 saat | Kualiti premium; ~3x kos berbanding standard |
| Sora 2 Pro, 15s @ 1024p | 120–240 saat | Full HD, barisan lebih panjang pada waktu puncak |
| Sora 2 Pro, 25s @ 1024p | 200–360 saat | Durasi maksimum; harga skala secara linear |
Dua implikasi operasi:
- Bajet latensi berorientasi pengguna perlu difikir semula. Jika produk anda menjangka penjanaan video berasa responsif kepada tindakan pengguna, julat 30–90 saat untuk klip pendek bermaksud anda memerlukan UX yang menangani penantian: penunjuk kemajuan, kerja selari yang boleh dilakukan pengguna semasa video dijana, atau pra-penjanaan untuk senario yang boleh diramal. Menganggap Sora seperti panggilan API segerak ialah kesilapan seni bina paling lazim yang dilakukan pasukan.
- Polling berbanding webhook adalah penting. Polling naif (gelung ketat memukul endpoint status) membazirkan kedua-dua bajet had kadar anda dan pengiraan model. Gunakan backoff eksponen dengan jitter, atau sediakan panggilan balik webhook jika persekitaran anda menyokongnya. Corak polling yang berkesan dalam produksi ialah memeriksa pada sela 10 saat untuk minit pertama, kemudian sela 30 saat selepas itu, dengan had masa tamat tegar pada julat atas jangkaan model untuk durasi yang diminta.
Parameter yang disokong dan struktur prompt
Permukaan API Sora sengaja ringkas berbanding model penjanaan imej seperti DALL-E 3. Terdapat lebih sedikit dail untuk diputar, tetapi dail yang ada adalah penting. Parameter utama:
- model: sora-2 atau sora-2-pro. Pilihan ini menentukan kedua-dua harga dan pilihan durasi/resolusi yang tersedia seperti dalam jadual harga di atas.
- prompt: Teks bentuk bebas yang menerangkan adegan. Sora mengendalikan arahan sinematik (sudut kamera, pergerakan, pencahayaan), tindakan watak, dan butiran persekitaran. Model sensitif kepada struktur prompt: mulakan dengan penetapan adegan, kemudian tindakan, kemudian arahan teknikal, menghasilkan hasil yang lebih boleh dipercayai berbanding satu perenggan padat.
- image: Imej rujukan pilihan untuk penjanaan imej-ke-video. Rujukan bertindak sebagai sauh bingkai pertama; model menjana pergerakan keluar dari titik permulaan itu. Berguna untuk demo produk, kesinambungan watak, dan apa-apa senario di mana rupa statik subjek tidak boleh dikompromi.
- duration: Durasi dalam saat. Dihalang kepada pilihan diskret untuk model yang dipilih (4/8/12 untuk sora-2, 10/15/25 untuk sora-2-pro). Kos skala secara linear dengan durasi.
- size: Resolusi. 720x1280 (potret) atau 1280x720 (landskap) pada model standard; menambah 1024x1792 / 1792x1024 pada Pro. Nisbah aspek tersirat dalam pilihan size.
Ketiadaan yang ketara. Sora pada masa ini tidak mendedahkan kawalan seed melalui API awam (jadi kebolehulangan merentas larian tidak dijamin), dan juga tidak mendedahkan kawalan gaya individu seperti Midjourney atau model imej lain. Model ini berpendirian; kejuruteraan prompt ialah tuil utama, bukan penalaan parameter.
Contoh ringkas permintaan penjanaan Sora 2, menggunakan OpenAI Python SDK:
| from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Cipta tugasan penjanaan videojob = client.videos.create(model="sora-2",prompt=("A wide-angle shot of a snow-capped mountain at sunrise. ""The camera slowly tracks left as the first light hits the peak. ""Cinematic, golden hour, 4K-quality lighting."),size="1280x720",duration=8,)# Poll untuk penyiapanwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Penjanaan gagal: {job.error}")print(f"Status semasa: {job.status}")time.sleep(10)print(f"Video sedia: {video_url}") |
|---|
Contoh kos terperinci
Harga setiap saat menjadikan kos boleh diramal, tetapi hanya selepas anda jelas tentang bentuk beban kerja anda. Tiga senario perwakilan:
Senario 1: Demo produk pendek untuk halaman arahan SaaS
Klip 5 saat yang menunjukkan UI produk beraksi, dijana sekali dan digunakan sebagai video hero pada laman pemasaran. Anda menjangka iterasi 5–10 kali untuk mendapatkan klip yang memuaskan sebelum penerbitan.
Kos pada Sora 2 standard pada 720p: 5s × $0.10 = $0.50 setiap penjanaan. Dengan 8 iterasi untuk mencapai potongan akhir: $4.00. Kos pada Sora 2 Pro pada 1024p untuk versi akhir yang diterbitkan: 5s × $0.50 = $2.50 (sekali ambil). Jumlah kos projek: kira-kira $6.50 untuk larian iterasi ditambah versi akhir HD.
Senario 2: Kumpulan 50 klip untuk kempen pemasaran
50 klip produk unik sepanjang 8 saat, setiap satu berdasarkan perihalan ciri berbeza, semuanya pada Sora 2 standard pada 720p. Tiada bajet iterasi; anda menerima penjanaan pertama.
Kos: 50 × 8s × $0.10 = $40.00. Tambah bajet iterasi 30% untuk klip yang tidak menjadi pada cubaan pertama (50 × 0.30 = 15 ulangan × 8s × $0.10 = $12). Jumlah: kira-kira $52.00 untuk kempen.
Senario 3: Ciri video jana-pengguna dalam produk pengguna
Pengguna dalam apl anda menjana klip 6 saat atas permintaan, pada Sora 2 standard pada 720p. Penggunaan purata: 1,000 klip sehari. Anda mengenakan pengguna $0.50 setiap penjanaan dan menerima perbezaan kos sebagai margin unit.
Kos setiap klip pengguna: 6s × $0.10 = $0.60. Dengan harga pengguna $0.50, beban kerja adalah rugi pada tier standard: setiap penjanaan menelan kos $0.10 lebih daripada yang dibayar pengguna. Tier standard 720p memerlukan harga pengguna sekurang-kurangnya $0.65 untuk pulang modal sebelum overhed infrastruktur. Pada 30,000 klip sebulan: bil Sora bulanan $18,000. Ini ialah jenis semakan ekonomi unit yang wajar dilakukan sebelum melancarkan sebarang ciri video berorientasi pengguna.
Kesimpulan merentas tiga senario: penjanaan video memang mampu milik untuk beban kerja pemasaran dan kandungan satu kali, di mana kiraan iterasi terhad dan kos per aset akhir adalah yang penting. Ia jauh lebih mencabar untuk ciri berorientasi pengguna pada skala, di mana kos per penjanaan mesti melepasi harga dibayar pengguna ditambah overhed produk. Nyatakan dengan jelas beban kerja mana yang anda harga sebelum komited.
Akses terus OpenAI berbanding akses pengagregator
Dengan Sora tersedia melalui pelbagai laluan, soalan praktikal bagi kebanyakan pasukan ialah yang mana satu untuk diintegrasi. Jawapan jujur bergantung pada selebih stack anda.
Apa yang sama
Kualiti output, masa penjanaan pada lapisan model, parameter yang disokong, dan harga setiap saat biasanya sama tanpa mengira laluan, kerana kebanyakan pengagregator meneruskan harga OpenAI pada pariti, dan model itu sendiri ialah model yang sama. Jika anda memilih laluan semata-mata berdasarkan kualiti output, pilihannya setara.
Apa yang berbeza
- Permukaan pengebilan. Akses terus OpenAI mengebil melalui akaun OpenAI anda; pengagregator mengebil melalui sistem kredit atau langganan mereka sendiri. Bagi pasukan yang sudah mengurus pengebilan OpenAI untuk penggunaan model teks, laluan terus tidak menambah perkara baharu. Bagi pasukan yang menjalankan beban kerja pelbagai penyedia (LLM daripada Anthropic, model imej daripada Black Forest Labs, video daripada Sora), pengagregator menyatukan semua itu ke satu invois.
- Observabiliti. Papan pemuka OpenAI memaparkan penggunaan Sora per permintaan dengan jelas. Papan pemuka pengagregator berbeza dalam sejauh mana mereka mengendalikan beban kerja penjanaan video; sesetengahnya mempunyai observabiliti video khusus; yang lain menganggap video sebagai panggilan API generik. Patut disemak sebelum komited jika observabiliti adalah keutamaan.
- Pengumpulan had kadar. Pada OpenAI terus, had kadar Sora anda terikat kepada akaun dan tier OpenAI anda. Pada pengagregator, had mungkin dikumpulkan merentas pangkalan pelanggan pengagregator dalam sesetengah kes, atau diperuntukkan per pelanggan dalam kes lain. Untuk beban kerja produksi volum tinggi, tanya pengagregator bagaimana mereka mengendalikan peruntukan had kadar sebelum integrasi.
- Sikap geografi dan pematuhan. OpenAI terus diproses melalui infrastruktur OpenAI dengan pilihan kediaman data yang OpenAI sediakan. Sesetengah pengagregator berpangkalan di bidang kuasa di mana peraturan kediaman data berbeza; yang lain menghala permintaan melalui infrastruktur AS OpenAI tanpa mengira. Untuk beban kerja terkawal, ini adalah penentu, dan wajar untuk meminta pasukan jualan pengagregator mengesahkannya secara bertulis.
Bagaimana CometAPI sesuai
CometAPI mendedahkan Sora 2 dan Sora 2 Pro bersama lebih 500 model lain di belakang satu endpoint serasi OpenAI, dengan satu kelayakan dan pengebilan bersatu. Harga Sora melalui CometAPI menjejak kadar setiap saat OpenAI; nilai operasinya ialah menggabungkan penggunaan Sora dengan trafik model lain anda pada satu invois. Untuk pasukan yang menjalankan beban kerja campuran (model teks daripada pelbagai penyedia, penjanaan imej, dan video Sora), ini ialah hujah teras. Untuk pasukan yang hanya menggunakan Sora dan hanya satu atau dua model teks, penjimatan operasi adalah lebih kecil dan akses terus OpenAI ialah pilihan yang beralasan.
Pertimbangan produksi
Beberapa corak yang patut dibuat dengan betul sebelum Sora menghampiri trafik produksi:
- Pengendalian kitar hayat tugasan async. Anggap setiap penjanaan Sora sebagai tugasan jangka panjang, bukan permintaan. Simpan ID tugasan serta-merta semasa penciptaan; teruskan selepas pelayan dimulakan semula dengan dapat menyambung semula polling untuk tugasan in-flight; tangani kes di mana tugasan siap semasa pekerja anda luar talian. Ini ialah kebersihan sistem teragih standard tetapi sering diabaikan pada awal kerana Sora ialah API async pertama yang diintegrasi pasukan.
- Fallback webhook. Jika platform menyokong webhook untuk acara penyiapan (OpenAI API menyokongnya), gunakannya. Webhook menghapuskan keperluan untuk polling dan mengurangkan kedua-dua tekanan had kadar anda dan pembaziran pengiraan oleh pemeriksaan status yang kerap. Polling ialah fallback untuk persekitaran yang tidak boleh mendedahkan endpoint webhook.
- Mod kegagalan yang menelan kos. OpenAI tidak mengebil untuk penjanaan yang gagal, tetapi penyiapan separa dan permintaan ulangan yang berjaya pada percubaan kedua memang menanggung kos. Dalam produksi, log kos setiap ulangan dan beri amaran jika kadar ulangan melebihi jangkaan, kerana itu biasanya isyarat isu dasar kandungan dengan prompt yang anda hantar, yang lebih murah diperbaiki pada lapisan prompt daripada diserap dalam bil.
- Dasar kandungan dan pengeluaran produksi. Sora terikat oleh dasar penggunaan OpenAI, yang mengehadkan kategori kandungan tertentu. Untuk pengeluaran produksi (terutamanya yang berorientasi pengguna di mana prompt sebahagiannya di bawah kawalan pengguna), semak dokumentasi dasar kandungan rasmi OpenAI dan reka penghadang huluan sewajarnya. Memaut ke dasar OpenAI ialah rujukan yang betul; dokumentasi itu ialah sumber kebenaran dan berubah lebih kerap daripada artikel ini.
Apa yang perlu dibina dahulu
Bacaan jujur tentang beban kerja Sora yang bersedia untuk produksi hari ini, yang berada di sempadan, dan yang masih pramatang:
Sedia produksi hari ini
Beban kerja pemasaran dan kreatif di mana iterasi terhad dan kos per aset akhir ialah metrik yang betul. Video demo produk, kandungan kempen media sosial, video hero untuk halaman arahan, bahan latihan dalaman. Ekonominya berfungsi, mod kegagalan difahami dengan baik, dan cerita latensi (30–90 saat untuk klip pendek) boleh diterima apabila manusia dalam kitaran ialah pasukan kandungan dan bukan pengguna akhir.
Di sempadan
Ciri penjanaan video berorientasi pengguna di mana kos per klip perlu melepasi harga yang dibayar pengguna. Ini boleh dilakukan tetapi memerlukan ekonomi unit yang teliti: hadkan durasi yang boleh diminta pengguna, gunakan Sora 2 standard pada 720p sebagai lalai, caj harga yang ada margin berbanding kos per klip. Gelombang awal-2026 aplikasi penjanaan video pengguna kebanyakannya dalam kategori ini, dan yang mempunyai ekonomi mampan semuanya berhati-hati dalam mengehadkan apa yang boleh dijana pengguna.
Pramatang
Video bentuk panjang pada skala (apa-apa melebihi 25 saat, kerana itu ialah siling durasi Sora terkini), senario masa nyata volum tinggi di mana latensi masa sebenar lebih penting daripada dolar, dan aplikasi yang mengharapkan kawalan per bingkai atau kebolehulangan berasaskan seed. Ini ialah beban kerja untuk ditinjau semula apabila permukaan keupayaan Sora berkembang, bukan dipaksa muat hari ini.
Pembingkaian: Sora 2 benar-benar sedia produksi untuk beban kerja kandungan dengan manusia dalam kitaran. Ia boleh dilaksanakan untuk ciri berorientasi pengguna dengan ekonomi unit yang berhati-hati. Ia pramatang untuk video bentuk panjang dan untuk kes penggunaan yang memerlukan parameter yang Sora belum dedahkan. Bina untuk apa yang sedia hari ini; jejak yang belum sedia.
Mencubanya pada beban kerja anda: Semua varian Sora 2 dan Sora 2 Pro tersedia pada CometAPI bersama model teks yang mungkin sudah anda gunakan. Kredit percubaan percuma membolehkan anda menjana beberapa klip pada harga standard tanpa sebarang persediaan selain menghalakan klien serasi OpenAI sedia ada anda ke endpoint CometAPI.
