Akses API Sora pada tahun 2026: Harga, Had Kadar, dan Apa yang Sebenarnya Tersedia melalui Agregator

Sora 2 ialah model teks-ke-video pertama yang tersedia secara umum daripada OpenAI, boleh diakses secara programatik melalui kedua-dua OpenAI API rasmi dan set laluan agregator yang semakin berkembang. Model penetapan harga adalah luar biasa berbanding model teks (pengebilan adalah per saat video yang dijana, bukan per token), dan soalan praktikal yang ditanya pembangun sebelum mengintegrasi adalah berbeza daripada untuk API LLM. Berapakah kos sebenar bagi satu klip? Berapa lama masa penjanaan? Apakah had kadar? Apa yang berubah apabila anda mengakses Sora melalui agregator dan bukan terus daripada OpenAI?

Artikel ini ialah rujukan yang kami harap wujud ketika kami mula merangka ciri penjanaan video kami sendiri. Penulisan ini distruktur untuk pembangun yang sudah melepasi “adakah Sora menarik?” dan kini perlu menjawab “apakah kosnya, apa yang diperlukan untuk integrasi, dan apa yang perlu saya tahu sebelum saya komited?”

Bacaan pantas: Sora 2 (model standard) berharga $0.10 per saat video yang dijana pada 720p. Sora 2 Pro berharga $0.30 per saat pada 720p atau $0.50 per saat pada 1024p. Klip 10 saat tipikal berharga $1.00 pada model standard dan $5.00 pada Pro pada HD. Masa penjanaan adalah asinkron; jangkakan 30–90 saat masa nyata untuk klip 5–10 saat. Akses memerlukan akaun OpenAI berbayar pada sekurang-kurangnya tingkat penggunaan 2.

Keadaan akses API Sora pada tahun 2026

Sora 2 dilancarkan dalam OpenAI API pada 7 Oktober 2025, dan akses telah tersedia berterusan sejak itu. Pengenal model ialah sora-2 (dengan ID snapshot semasa sora-2-2025-12-08), dan varian fideliti lebih tinggi ialah sora-2-pro. Kedua-duanya menyokong penjanaan teks-ke-video dan imej-ke-video, dengan output audio yang diselaraskan. Sehingga 10 Januari 2026, akses pengguna peringkat percuma melalui produk ChatGPT telah dihentikan, yang menumpukan penggunaan Sora bertaraf pembangun sama ada pada langganan ChatGPT berbayar atau akses API terus.

Terdapat tiga laluan untuk menggunakan Sora secara programatik:

OpenAI direct API. Laluan kanonik. Pengebilan per saat, berbayar sahaja, memerlukan tambah nilai minimum $10 untuk mencapai tingkat penggunaan 2 yang membuka akses model Sora. SDK dan REST API kedua-duanya disokong.
Azure OpenAI. Laluan perusahaan Microsoft, mencerminkan kadar rasmi OpenAI dengan tambahan kos langganan Azure dan ciri pematuhan perusahaan. Penetapan harga per saat yang sama; permukaan operasi berbeza.
Agregator. Perkhidmatan yang mendedahkan Sora di belakang API bersepadu mereka sendiri. Kebanyakan agregator meneruskan penetapan harga per saat OpenAI pada pariti; nilainya adalah operasi (satu kelayakan, satu bil, SDK yang sama seperti trafik model teks anda). Sesetengah agregator menawarkan struktur tarif mereka sendiri, yang kami bincangkan kemudian dalam artikel.

Penetapan harga Sora 2 per saat video

Harga Sora distruktur mengikut tingkat model dan resolusi output, dengan kadar per saat yang didarabkan dengan tempoh klip untuk memberikan kos penjanaan. Disahkan daripada halaman penetapan harga rasmi OpenAI setakat Mei 2026:

Model	Resolusi	Tempoh yang disokong	Harga per saat	Klip 10 saat
Sora 2 (standard)	720p	4s, 8s, 12s	$0.10	$1.00
Sora 2 Pro	720p	10s, 15s, 25s	$0.30	$3.00
Sora 2 Pro	1024p (1792×1024)	10s, 15s, 25s	$0.50	$5.00

Nota tentang struktur harga. Harga adalah berdasarkan output, bukan input; tiada pengebilan input berasaskan token untuk Sora seperti untuk model teks. Pengkondisian imej (menghantar imej rujukan untuk mengukuhkan penjanaan) tidak mengubah kadar per saat. Pilihan tempoh bagi setiap tingkat model adalah tetap: anda tidak boleh meminta klip 7 saat pada model standard, hanya 4, 8, atau 12 saat.

Dua implikasi praktikal yang wajar dijelaskan. Pertama: model penetapan harga lebih menghampiri bil pemaparan video berbanding bil LLM. Kos dipacu oleh tempoh output, bukan oleh betapa kompleksnya prompt anda atau berapa banyak token yang dikandungnya. Kedua: perbezaan kos antara Sora 2 dan Sora 2 Pro pada HD ialah 5x per saat: klip 10 saat berharga $1.00 pada standard dan $5.00 pada Pro pada 1024p. Memilih tingkat yang tepat untuk tugas adalah tuas kos terbesar yang anda miliki, dan berbaloi untuk berhati-hati tentang beban kerja yang benar-benar memerlukan fideliti lebih tinggi Pro.

Had kadar dan kuota

Had kadar Sora dianjurkan mengelilingi sistem tingkat penggunaan standard OpenAI. Butiran penting untuk Sora secara khusus:

Keperluan tingkat minimum: Tingkat 2, dicapai dengan menambah sekurang-kurangnya $10 kredit API. Tingkat 1 (lalai untuk akaun baharu) tidak termasuk akses model Sora.
Had penjanaan serentak: Mengikut dokumentasi had kadar OpenAI, penjanaan video serentak dihadkan mengikut tingkat, lazimnya sejumlah kecil penjanaan dalam penerbangan pada tingkat lebih rendah, meningkat dengan tingkat penggunaan. Siling tepat ditetapkan bagi setiap akaun dan boleh dilihat dalam papan pemuka OpenAI. Untuk beban kerja volum tinggi, rancang untuk akses tingkat 3 atau tingkat 4 dari hari pertama.
Permintaan kuota: Had serentak lebih tinggi melangkaui siling tingkat lalai boleh diminta melalui borang peningkatan had kadar OpenAI. Kelulusan adalah khusus beban kerja dan tidak serta-merta; untuk pelancaran produksi dengan lonjakan permintaan yang boleh diramal, minta peningkatan beberapa minggu sebelum pelancaran.

Perlu diketahui: had kadar pada Sora dikumpulkan secara berbeza daripada had kadar model teks pada akaun yang sama. Pasukan yang menjalankan trafik Sora yang berat tidak menjejaskan bajet kadar tersedia mereka untuk panggilan GPT-5.5. Sebaliknya, trafik GPT-5.5 yang besar tidak menghakis bajet Sora. Rancang kedua-duanya sebagai persoalan kapasiti berasingan.

Masa penjanaan: apa yang sebenarnya dijangka

Sora adalah asinkron secara reka bentuk. Anda menghantar permintaan penjanaan, menerima ID kerja, dan meninjau (atau webhook semula) untuk penyiapan. Masa nyata antara permintaan dan penyiapan bergantung pada tempoh dan resolusi output, beban semasa pada infrastruktur OpenAI, dan sama ada kerja beratur di belakang yang lain pada akaun anda.

Jangkaan realistik berdasarkan tingkah laku yang diperhatikan:

Keluaran	Masa nyata tipikal	Nota
Sora 2 standard, 4s @ 720p	20–45 saat	Laluan terpantas; sesuai untuk iterasi
Sora 2 standard, 8s @ 720p	40–90 saat	Tempoh produksi paling lazim
Sora 2 standard, 12s @ 720p	60–120 saat	Kandungan sosial bentuk panjang
Sora 2 Pro, 10s @ 720p	60–150 saat	Kualiti premium; ~3x kos berbanding standard
Sora 2 Pro, 15s @ 1024p	120–240 saat	Full HD, masa beratur lebih panjang pada waktu puncak
Sora 2 Pro, 25s @ 1024p	200–360 saat	Tempoh maksimum; harga meningkat secara linear

Dua akibat operasi:

Bajet kependaman berorientasikan pengguna perlu difikir semula. Jika produk anda mengharapkan penjanaan video terasa responsif terhadap tindakan pengguna, julat 30–90 saat untuk klip pendek bermaksud anda memerlukan UX yang menangani penantian: penunjuk kemajuan, kerja selari yang pengguna boleh lakukan semasa video dijana, atau pra-penjanaan untuk senario yang boleh diramal. Menganggap Sora seperti panggilan API segerak ialah kesilapan seni bina paling lazim yang dibuat pasukan.
Polling berbanding webhook adalah penting. Polling naif (gelung ketat menghentam endpoint status) membazirkan bajet had kadar anda dan compute model. Gunakan backoff eksponen dengan jitter, atau sediakan panggilan balik webhook jika persekitaran anda menyokongnya. Pola polling yang berfungsi baik dalam produksi ialah meninjau pada sela 10 saat untuk minit pertama, kemudian sela 30 saat selepas itu, dengan had tamat pada sempadan atas jangkaan model untuk tempoh yang diminta.

Parameter yang disokong dan struktur prompt

Permukaan API Sora sengaja ringkas berbanding model penjanaan imej seperti DALL-E 3. Tuil yang boleh dilaras lebih sedikit, tetapi yang ada adalah penting. Parameter penting:

model: sora-2 atau sora-2-pro. Pilihan ini memacu kedua-dua penetapan harga dan pilihan tempoh/resolusi tersedia seperti yang ditunjukkan dalam jadual harga di atas.
prompt: Teks bebas menerangkan adegan. Sora mengendalikan arahan sinematik (sudut kamera, pergerakan, pencahayaan), aksi watak, dan perincian persekitaran. Model sensitif kepada struktur prompt: mulakan dengan penetapan adegan, kemudian aksi, kemudian arahan teknikal, menghasilkan keputusan yang lebih boleh diharap berbanding satu perenggan padat.
image: Imej rujukan pilihan untuk penjanaan imej-ke-video. Rujukan bertindak sebagai sauh bingkai pertama; model menjana pergerakan keluar dari titik permulaan itu. Berguna untuk demo produk, kesinambungan watak, dan sebarang senario di mana rupa statik subjek tidak boleh dikompromi.
duration: Tempoh dalam saat. Dihadkan kepada pilihan diskret untuk model yang dipilih (4/8/12 untuk sora-2, 10/15/25 untuk sora-2-pro). Kos meningkat secara linear dengan tempoh.
size: Resolusi. 720x1280 (potret) atau 1280x720 (landskap) pada model standard; menambah 1024x1792 / 1792x1024 pada Pro. Nisbah aspek adalah tersirat dalam pilihan saiz.

Ketiadaan ketara. Sora pada masa ini tidak mendedahkan kawalan seed melalui API awam (jadi kebolehulangan merentas run tidak dijamin), dan tidak mendedahkan kawalan gaya individu seperti Midjourney atau model imej lain. Model ini berpendirian; kejuruteraan prompt ialah tuil utama, bukan pelarasan parameter.

Contoh ringkas permintaan penjanaan Sora 2, menggunakan OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Cipta tugas penjanaan videojob = client.videos.create(model="sora-2",prompt=("Tangkapan sudut lebar gunung bersalji ketika matahari terbit. ""Kamera perlahan-lahan menjejak ke kiri ketika cahaya pertama menyinari puncak. ""Sinematik, waktu emas, pencahayaan berkualiti 4K."),size="1280x720",duration=8,)# Tinjau sehingga selesaiwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Penjanaan gagal: {job.error}")print(f"Status semasa: {job.status}")time.sleep(10)print(f"Video sedia: {video_url}")

Contoh pengiraan kos

Penetapan harga per saat menjadikan kos boleh diramal, tetapi hanya apabila anda jelas tentang bentuk beban kerja anda. Tiga senario wakil:

Senario 1: Demo produk pendek untuk halaman utama SaaS

Klip 5 saat menunjukkan UI produk beraksi, dijana sekali dan digunakan sebagai video hero di laman pemasaran. Anda menjangka beriterasi 5–10 kali untuk mendapatkan klip yang memuaskan sebelum diterbitkan.

Kos pada Sora 2 standard di 720p: 5s × $0.10 = $0.50 per penjanaan. Dengan 8 iterasi untuk mencapai potongan akhir: $4.00. Kos pada Sora 2 Pro di 1024p untuk versi akhir yang diterbitkan: 5s × $0.50 = $2.50 (sekali ambil). Jumlah kos projek: kira-kira $6.50 untuk larian iterasi ditambah HD akhir.

Senario 2: Satu kelompok 50 klip untuk kempen pemasaran

50 klip produk unik berdurasi 8 saat, masing-masing berdasarkan penerangan ciri yang berbeza, semuanya pada Sora 2 standard di 720p. Tiada bajet iterasi; anda menerima penjanaan pertama.

Kos: 50 × 8s × $0.10 = $40.00. Tambah bajet iterasi 30% untuk klip yang tidak menjadi pada percubaan pertama (50 × 0.30 = 15 percubaan semula × 8s × $0.10 = $12). Jumlah: kira-kira $52.00 untuk kempen.

Senario 3: Ciri video yang dijana pengguna dalam produk pengguna

Pengguna dalam aplikasi anda menjana klip 6 saat atas permintaan, pada Sora 2 standard di 720p. Penggunaan purata: 1,000 klip sehari. Anda mengenakan caj $0.50 per penjanaan dan menerima perbezaan kos sebagai margin unit.

Kos per klip pengguna: 6s × $0.10 = $0.60. Dengan harga pengguna $0.50, beban kerja ini rugi pada tingkat standard: setiap penjanaan berharga $0.10 lebih daripada bayaran pengguna. Tingkat standard 720p memerlukan harga pengguna sekurang-kurangnya $0.65 untuk pulang modal sebelum kos infrastruktur. Pada 30,000 klip sebulan: bil Sora bulanan $18,000. Ini ialah jenis semakan ekonomi unit yang wajar dilakukan sebelum melancarkan sebarang ciri video berorientasikan pengguna.

Kesimpulan merentas tiga senario: penjanaan video benar-benar mampu milik untuk beban kerja pemasaran dan kandungan sekali gus, di mana bilangan iterasi terhad dan kos per aset akhir ialah metrik yang penting. Ia jauh lebih mencabar untuk ciri berorientasikan pengguna pada skala, di mana kos per penjanaan perlu melepasi harga yang dibayar pengguna ditambah overhead produk. Nyatakan dengan jelas beban kerja yang anda harga sebelum komited.

Akses terus OpenAI berbanding akses melalui agregator

Dengan Sora tersedia melalui pelbagai laluan, persoalan praktikal untuk kebanyakan pasukan ialah laluan mana untuk diintegrasi. Jawapan jujur bergantung pada selebihnya timbunan anda.

Apa yang sama

Kualiti output, masa penjanaan di lapisan model, parameter yang disokong, dan penetapan harga per saat lazimnya sama tanpa mengira laluan, kerana kebanyakan agregator meneruskan penetapan harga OpenAI pada pariti, dan model itu sendiri adalah model yang sama. Jika anda memilih laluan semata-mata berdasarkan kualiti output, pilihan ini tidak membezakan.

Apa yang berbeza

Permukaan pengebilan. Akses terus OpenAI dibil melalui akaun OpenAI anda; agregator mengebil melalui sistem kredit atau langganan mereka sendiri. Untuk pasukan yang sudah mengurus pengebilan OpenAI bagi penggunaan model teks, laluan terus tidak menambah perkara baharu. Untuk pasukan yang menjalankan beban kerja berbilang penyedia (LLM daripada Anthropic, model imej daripada Black Forest Labs, video daripada Sora), agregator menggabungkan semuanya pada satu invois.
Pemerhatian. Papan pemuka OpenAI memaparkan penggunaan Sora per permintaan dengan jelas. Papan pemuka agregator berbeza dalam sejauh mana ia mengendalikan beban kerja penjanaan video secara khusus; ada yang mempunyai pemerhatian video binaan khusus; yang lain menganggap video sebagai panggilan API umum. Berbaloi diperiksa sebelum komited jika pemerhatian ialah keutamaan.
Pengumpulan had kadar. Pada OpenAI terus, had kadar Sora anda diikat kepada akaun dan tingkat OpenAI anda. Pada agregator, had kadangkala dikumpulkan merentas pangkalan pelanggan agregator, atau diperuntukkan per pelanggan dalam kes lain. Untuk beban kerja produksi volum tinggi, tanya agregator bagaimana mereka mengendalikan peruntukan had kadar sebelum integrasi.
Kedudukan geografi dan pematuhan. OpenAI terus diproses melalui infrastruktur OpenAI dengan pilihan penempatan data yang OpenAI sediakan. Sesetengah agregator berpusat di bidang kuasa di mana peraturan penempatan data berbeza; yang lain merutekan permintaan melalui infrastruktur AS OpenAI tanpa mengira. Untuk beban kerja terkawal, ini adalah penentu, dan ia ialah perkara yang berbaloi diminta daripada pasukan jualan agregator secara bertulis.

Bagaimana CometAPI sesuai

CometAPI mendedahkan Sora 2 dan Sora 2 Pro bersama 500+ model lain di belakang satu endpoint serasi OpenAI, dengan satu kelayakan dan pengebilan bersepadu. Penetapan harga Sora melalui CometAPI menjejaki kadar per saat OpenAI; nilainya yang operasi ialah menggabungkan penggunaan Sora dengan selebih trafik model anda pada satu invois. Bagi pasukan yang menjalankan beban kerja campuran (model teks daripada pelbagai penyedia, penjanaan imej, dan video Sora), ini ialah hujah teras. Bagi pasukan yang hanya menggunakan Sora dan hanya satu atau dua model teks, penjimatan operasi adalah lebih kecil dan akses terus OpenAI ialah pilihan yang defensif.

Pertimbangan produksi

Beberapa pola yang berbaloi dibuat dengan betul sebelum Sora mendekati trafik produksi:

Pengendalian kitar hayat kerja asinkron. Layan setiap penjanaan Sora sebagai kerja jangka panjang, bukan permintaan. Kekalkan ID kerja serta-merta ketika penciptaan; bertahan daripada but semula pelayan dengan kebolehan menyambung semula polling untuk kerja dalam penerbangan; tangani kes di mana kerja selesai ketika pekerja anda luar talian. Ini ialah kebersihan sistem teragih standard tetapi sering diabaikan pada mulanya kerana Sora ialah API asinkron pertama yang pasukan integrasi.
Fallback webhook. Jika platform menyokong webhook untuk acara penyiapan (OpenAI API menyokong), gunakanlah. Webhook menghapuskan keperluan polling dan mengurangkan kedua-dua tekanan had kadar anda dan compute terbazir daripada semakan status yang kerap. Polling ialah fallback untuk persekitaran yang tidak boleh mendedahkan endpoint webhook.
Mod kegagalan yang menelan kos. OpenAI tidak mengebil untuk penjanaan yang gagal, tetapi penyiapan separa dan permintaan diulang yang berjaya pada percubaan kedua memang menanggung kos. Dalam produksi, logkan kos setiap percubaan semula dan beri amaran jika kadar percubaan semula melebihi jangkaan, kerana itu biasanya isyarat isu dasar kandungan dengan prompt yang anda hantar, yang lebih murah dibetulkan pada lapisan prompt daripada menyerapnya dalam bil.
Dasar kandungan dan penyebaran produksi. Sora diikat oleh dasar penggunaan OpenAI, yang mengehadkan kategori kandungan tertentu. Untuk penyebaran produksi (terutamanya yang berorientasikan pengguna di mana prompt sebahagiannya di bawah kawalan pengguna), semak dokumentasi dasar kandungan rasmi OpenAI dan reka pengawal hulu mengikut keperluan. Memaut keluar ke dasar OpenAI ialah rujukan yang tepat; dokumentasi itu ialah sumber kebenaran dan berubah lebih kerap daripada artikel ini.

Apa yang perlu dibina dahulu

Pandangan jujur tentang beban kerja Sora yang sedia untuk produksi hari ini, yang berada di ambang, dan yang masih pramatang:

Sedia untuk produksi hari ini

Beban kerja pemasaran dan kandungan kreatif di mana iterasi adalah terhad dan kos per aset akhir ialah metrik yang betul. Video demo produk, kandungan kempen media sosial, video hero untuk halaman pendaratan, bahan latihan dalaman. Ekonominya berfungsi, mod kegagalan difahami dengan baik, dan cerita kependaman (30–90 saat untuk klip pendek) boleh diterima apabila manusia dalam gelung ialah pasukan kandungan dan bukan pengguna akhir.

Di ambang

Ciri penjanaan video berorientasikan pengguna di mana kos per klip perlu melepasi harga yang dibayar pengguna. Ini boleh dilaksanakan tetapi memerlukan ekonomi unit yang teliti: hadkan tempoh yang boleh diminta pengguna, gunakan Sora 2 standard pada 720p sebagai lalai, caj harga yang mempunyai margin di atas kos per klip. Gelombang awal 2026 aplikasi penjanaan video pengguna kebanyakannya dalam kategori ini, dan yang ekonominya mampan semuanya berhati-hati dalam mengehadkan apa yang boleh dijana pengguna.

Pramatang

Video bentuk panjang pada skala (apa-apa melebihi 25 saat, kerana itu ialah siling tempoh semasa Sora), senario masa nyata volum tinggi di mana kependaman masa nyata lebih penting daripada dolar, dan aplikasi yang mengharapkan kawalan per bingkai atau kebolehulangan berasaskan seed. Ini ialah beban kerja untuk dikaji semula apabila permukaan keupayaan Sora berkembang, bukan dipaksa muat hari ini.

Rangka: Sora 2 benar-benar sedia untuk produksi bagi beban kerja kandungan dengan manusia dalam gelung. Ia boleh dilaksanakan untuk ciri berorientasikan pengguna dengan ekonomi unit yang teliti. Ia pramatang untuk video bentuk panjang dan kes penggunaan yang memerlukan parameter yang Sora belum dedahkan. Binalah untuk perkara yang sedia hari ini; jejak yang belum lagi.

Mencubanya pada beban kerja anda: Semua varian Sora 2 dan Sora 2 Pro tersedia di CometAPI bersama model teks yang mungkin sudah anda gunakan. Kredit percubaan percuma membolehkan anda menjana beberapa klip pada harga standard tanpa sebarang persediaan selain menghalakan klien serasi OpenAI sedia ada anda ke endpoint CometAPI.