Akses API Sora pada 2026: Harga, Batas Laju, dan Apa yang Sebenarnya Tersedia Melalui Agregator

CometAPI
AnnaMay 21, 2026
Akses API Sora pada 2026: Harga, Batas Laju, dan Apa yang Sebenarnya Tersedia Melalui Agregator

Sora 2 adalah model text-to-video pertama dari OpenAI yang tersedia secara umum, dapat diakses secara terprogram melalui OpenAI API resmi dan sejumlah rute agregator yang terus bertambah. Model penetapan harga berbeda dari model teks (penagihan per detik video yang dihasilkan alih-alih per token), dan pertanyaan praktis yang diajukan pengembang sebelum integrasi juga berbeda dari API LLM. Berapa biaya sebuah klip? Berapa lama waktu generasinya? Apa batas lajunya (rate limit)? Apa yang berubah jika Anda mengakses Sora melalui agregator dibanding langsung ke OpenAI?

Artikel ini adalah referensi yang kami harap sudah ada saat kami mulai merencanakan fitur pembuatan video kami sendiri. Tulisan ini disusun untuk pengembang yang sudah melewati tahap "apakah Sora menarik?" dan kini perlu menjawab "berapa biayanya, apa yang diperlukan untuk integrasi, dan apa yang perlu saya ketahui sebelum berkomitmen?"

Bacaan singkat: Sora 2 (model standar) berharga $0,10 per detik video yang dihasilkan pada 720p. Sora 2 Pro berharga $0,30 per detik pada 720p atau $0,50 per detik pada 1024p. Klip 10 detik tipikal berharga $1,00 di model standar dan $5,00 di Pro pada HD. Waktu generasi bersifat async; harapkan 30–90 detik waktu aktual (wall-clock) untuk klip 5–10 detik. Akses memerlukan akun OpenAI berbayar minimal pada usage tier 2.

Keadaan akses Sora API pada 2026

Sora 2 diluncurkan di OpenAI API pada 7 Oktober 2025, dan aksesnya terus tersedia sejak itu. Pengenal model adalah sora-2 (dengan snapshot ID saat ini sora-2-2025-12-08), dan varian fidelitas lebih tinggi adalah sora-2-pro. Keduanya mendukung pembuatan video dari teks (text-to-video) dan dari gambar (image-to-video), dengan keluaran audio tersinkron. Per 10 Januari 2026, akses konsumen gratis melalui produk ChatGPT dihentikan, yang memusatkan penggunaan Sora tingkat pengembang ke langganan ChatGPT berbayar atau akses API langsung.

Ada tiga jalur untuk menggunakan Sora secara terprogram:

  • OpenAI direct API. Rute kanonis. Penagihan per detik, hanya berbayar, memerlukan top-up minimal $10 untuk mencapai usage tier 2 yang membuka akses model Sora. SDK dan REST API sama-sama didukung.
  • Azure OpenAI. Rute enterprise dari Microsoft, mencerminkan tarif resmi OpenAI dengan tambahan overhead langganan Azure dan fitur kepatuhan enterprise. Harga per detik yang sama; permukaan operasional berbeda.
  • Agregator. Layanan yang mengekspos Sora di balik API terpadu mereka. Sebagian besar agregator meneruskan harga per detik OpenAI pada paritas; nilainya bersifat operasional (satu kredensial, satu tagihan, SDK yang sama seperti trafik model teks Anda). Beberapa agregator menawarkan struktur tarif mereka sendiri, yang kami bahas nanti dalam artikel.

Harga Sora 2 per detik video

Harga Sora disusun berdasarkan tier model dan resolusi keluaran, dengan tarif per detik yang dikalikan durasi klip untuk mendapatkan biaya pembuatan. Diverifikasi dari halaman harga resmi OpenAI per Mei 2026:

ModelResolusiDurasi yang didukungHarga per detikKlip 10 detik
Sora 2 (standar)720p4s, 8s, 12s$0.10$1.00
Sora 2 Pro720p10s, 15s, 25s$0.30$3.00
Sora 2 Pro1024p (1792×1024)10s, 15s, 25s$0.50$5.00

Catatan tentang struktur harga. Penetapan harga berdasarkan keluaran, bukan masukan; tidak ada penagihan input berbasis token untuk Sora seperti pada model teks. Image conditioning (memberikan gambar referensi untuk mengikat generasi) tidak mengubah tarif per detik. Opsi durasi untuk tiap tier model bersifat tetap: Anda tidak dapat meminta klip 7 detik pada model standar, hanya 4, 8, atau 12 detik.

Dua implikasi praktis yang perlu ditegaskan. Pertama: model penetapan harga lebih mirip tagihan perenderan video ketimbang tagihan LLM. Biaya didorong oleh durasi keluaran, bukan oleh seberapa kompleks prompt Anda atau berapa banyak tokennya. Kedua: perbedaan biaya antara Sora 2 dan Sora 2 Pro pada HD adalah 5x per detik: klip 10 detik berharga $1,00 pada standar dan $5,00 pada Pro di 1024p. Memilih tier yang tepat untuk tugas adalah tuas biaya terbesar yang Anda miliki, dan patut dipikirkan dengan saksama beban kerja mana yang benar-benar membutuhkan fidelitas lebih tinggi dari Pro.

Batas laju (rate limit) dan kuota

Batas laju Sora diatur di sekitar sistem usage tier standar OpenAI. Detail yang relevan khusus untuk Sora:

  • Persyaratan tier minimum: Tier 2, dicapai dengan top-up setidaknya $10 kredit API. Tier 1 (default untuk akun baru) tidak termasuk akses model Sora.
  • Batas generasi bersamaan: Menurut dokumentasi rate limit OpenAI, pembuatan video bersamaan dibatasi oleh tier, umumnya sejumlah kecil job in-flight pada tier lebih rendah, meningkat seiring tier penggunaan. Batas atas yang tepat ditetapkan per akun dan terlihat di dasbor OpenAI. Untuk beban kerja volume tinggi, rencanakan akses tier-3 atau tier-4 sejak awal.
  • Permintaan kuota: Batas konkuren lebih tinggi di luar plafon tier default dapat diminta melalui formulir peningkatan rate limit OpenAI. Persetujuan spesifik pada beban kerja dan tidak instan; untuk peluncuran produksi dengan lonjakan permintaan yang dapat diperkirakan, ajukan peningkatan beberapa minggu sebelum peluncuran.

Perlu diketahui: rate limit pada Sora dipool secara berbeda dari rate limit model teks pada akun yang sama. Tim yang menjalankan trafik Sora berat tidak memengaruhi anggaran rate yang tersedia untuk panggilan GPT-5.5 mereka. Sebaliknya, trafik GPT-5.5 besar tidak mengurangi anggaran Sora. Rencanakan keduanya sebagai pertanyaan kapasitas terpisah.

Waktu generasi: apa yang benar-benar diharapkan

Sora bersifat async secara desain. Anda mengirim permintaan generasi, mendapatkan ID job, dan melakukan polling (atau webhook balik) untuk penyelesaian. Waktu aktual (wall-clock) antara permintaan dan penyelesaian bergantung pada durasi dan resolusi keluaran, beban saat ini pada infrastruktur OpenAI, dan apakah job Anda masuk antrean di belakang job lain pada akun Anda.

Ekspektasi realistis berdasarkan perilaku yang diamati:

KeluaranWaktu aktual tipikalCatatan
Sora 2 standar, 4s @ 720p20–45 detikJalur tercepat; bagus untuk iterasi
Sora 2 standar, 8s @ 720p40–90 detikDurasi produksi paling umum
Sora 2 standar, 12s @ 720p60–120 detikKonten sosial berdurasi lebih panjang
Sora 2 Pro, 10s @ 720p60–150 detikKualitas premium; ~3x biaya dibanding standar
Sora 2 Pro, 15s @ 1024p120–240 detikFull HD, antrean lebih lama pada jam sibuk
Sora 2 Pro, 25s @ 1024p200–360 detikDurasi maksimum; harga berskala linear

Dua konsekuensi operasional:

  • Anggaran latensi user-facing perlu dipikir ulang. Jika produk Anda mengharapkan pembuatan video terasa responsif terhadap aksi pengguna, rentang 30–90 detik untuk klip pendek berarti Anda butuh UX yang menangani waktu tunggu: indikator progres, pekerjaan paralel yang bisa dilakukan pengguna saat video dibuat, atau pragen (pre-generation) untuk skenario yang dapat diprediksi. Memperlakukan Sora seperti panggilan API sinkron adalah kesalahan arsitektur paling umum yang dilakukan tim.
  • Polling versus webhook penting. Polling naif (loop ketat yang sering memukul endpoint status) menghamburkan anggaran rate limit Anda dan komputasi model. Gunakan exponential backoff dengan jitter, atau siapkan webhook callback jika lingkungan Anda mendukungnya. Pola polling yang bekerja baik di produksi adalah polling tiap 10 detik untuk menit pertama, lalu tiap 30 detik setelahnya, dengan batas waktu keras pada ambang atas yang diharapkan untuk durasi yang diminta.

Parameter yang didukung dan struktur prompt

Permukaan API Sora sengaja lebih sederhana dibanding model pembuatan gambar seperti DALL-E 3. Tombolnya lebih sedikit, tetapi yang ada penting. Parameter yang relevan:

  • model: sora-2 atau sora-2-pro. Pilihan ini menentukan harga dan opsi durasi/resolusi yang tersedia seperti pada tabel harga di atas.
  • prompt: Teks bebas yang mendeskripsikan adegan. Sora menangani pengarahan sinematik (sudut kamera, pergerakan, pencahayaan), aksi karakter, dan detail lingkungan. Model peka terhadap struktur prompt: memulai dengan penetapan adegan, lalu aksi, kemudian arahan teknis, menghasilkan hasil yang lebih andal daripada satu paragraf padat.
  • image: Gambar referensi opsional untuk pembuatan image-to-video. Referensi bertindak sebagai jangkar frame pertama; model menghasilkan gerakan keluar dari titik awal tersebut. Berguna untuk demo produk, kontinuitas karakter, dan skenario di mana penampilan statis subjek tidak bisa dinegosiasikan.
  • duration: Durasi dalam detik. Dibatasi pada opsi diskret untuk model yang dipilih (4/8/12 untuk sora-2, 10/15/25 untuk sora-2-pro). Biaya berskala linear dengan durasi.
  • size: Resolusi. 720x1280 (potret) atau 1280x720 (lanskap) pada model standar; menambah 1024x1792 / 1792x1024 pada Pro. Rasio aspek tersirat dalam pemilihan size.

Hal yang tidak tersedia. Sora saat ini tidak mengekspos kontrol seed melalui API publik (jadi reprodusibilitas lintas run tidak dijamin), juga tidak mengekspos kontrol gaya individual seperti Midjourney atau model gambar lainnya. Model ini opinionated; rekayasa prompt adalah tuas utama, bukan penyetelan parameter.

Contoh sederhana permintaan pembuatan Sora 2, menggunakan OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Buat job pembuatan videojob = client.videos.create(model="sora-2",prompt=("A wide-angle shot of a snow-capped mountain at sunrise. ""The camera slowly tracks left as the first light hits the peak. ""Cinematic, golden hour, 4K-quality lighting."),size="1280x720",duration=8,)# Polling untuk penyelesaianwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Pembuatan gagal: {job.error}")print(f"Status saat ini: {job.status}")time.sleep(10)print(f"Video siap: {video_url}")

Contoh perhitungan biaya

Harga per detik membuat biaya dapat diprediksi, tetapi hanya setelah Anda jelas tentang bentuk beban kerja Anda. Tiga skenario representatif:

Skenario 1: Demo produk pendek untuk landing page SaaS

Klip 5 detik yang menampilkan UI produk beraksi, dibuat sekali dan digunakan sebagai video hero di situs pemasaran. Anda memperkirakan iterasi 5–10 kali untuk mendapatkan klip yang memuaskan sebelum dipublikasikan.

Biaya pada Sora 2 standar di 720p: 5s × $0.10 = $0.50 per generasi. Dengan 8 iterasi untuk mencapai potongan final: $4.00. Biaya pada Sora 2 Pro di 1024p untuk versi final yang dipublikasikan: 5s × $0.50 = $2.50 (satu kali). Total biaya proyek: kira-kira $6.50 untuk iterasi plus final HD.

Skenario 2: Batch 50 klip untuk kampanye pemasaran

50 klip produk unik berdurasi 8 detik, masing-masing berdasarkan deskripsi fitur berbeda, semuanya pada Sora 2 standar di 720p. Tidak ada anggaran iterasi; Anda menerima generasi pertama.

Biaya: 50 × 8s × $0.10 = $40.00. Tambahkan anggaran iterasi 30% untuk klip yang tidak pas pada percobaan pertama (50 × 0.30 = 15 percobaan ulang × 8s × $0.10 = $12). Total: kira-kira $52.00 untuk kampanye.

Skenario 3: Fitur video buatan pengguna dalam produk konsumen

Pengguna di aplikasi Anda membuat klip 6 detik sesuai permintaan, pada Sora 2 standar di 720p. Rata-rata penggunaan: 1.000 klip per hari. Anda mengenakan biaya $0.50 per generasi dan menerima selisih biaya sebagai margin unit.

Biaya per klip pengguna: 6s × $0.10 = $0.60. Dengan harga pengguna $0.50, beban kerja ini merugi pada tier standar: setiap generasi berbiaya $0.10 lebih besar dari yang dibayar pengguna. Tier standar 720p memerlukan harga pengguna setidaknya $0.65 untuk impas sebelum overhead infrastruktur. Pada 30.000 klip per bulan: tagihan Sora bulanan $18.000. Ini adalah jenis pemeriksaan unit economics yang layak dilakukan sebelum meluncurkan fitur video untuk pengguna mana pun.

Intisari di tiga skenario: pembuatan video benar-benar terjangkau untuk beban kerja pemasaran dan konten ad-hoc, di mana jumlah iterasi terbatas dan metrik yang penting adalah biaya per aset final. Ini jauh lebih menantang untuk fitur user-facing berskala besar, di mana biaya per generasi harus melampaui harga yang dibayar pengguna plus overhead produk. Tegaskan dengan jelas beban kerja mana yang Anda hargai sebelum berkomitmen.

Akses langsung OpenAI versus akses melalui agregator

Dengan Sora tersedia melalui berbagai rute, pertanyaan praktis bagi sebagian besar tim adalah rute mana yang harus diintegrasikan. Jawaban jujurnya bergantung pada tumpukan (stack) Anda yang lain.

Yang sama

Kualitas keluaran, waktu generasi pada lapisan model, parameter yang didukung, dan harga per detik biasanya identik terlepas dari rute, karena sebagian besar agregator meneruskan harga OpenAI pada paritas, dan modelnya sendiri adalah model yang sama. Jika Anda memilih rute murni berdasarkan kualitas keluaran, pilihannya setara.

Yang berbeda

  • Permukaan penagihan. Akses langsung OpenAI menagih melalui akun OpenAI Anda; agregator menagih melalui sistem kredit atau langganan mereka sendiri. Untuk tim yang sudah mengelola penagihan OpenAI untuk penggunaan model teks, rute langsung tidak menambah hal baru. Untuk tim yang menjalankan beban kerja multi-penyedia (LLM dari Anthropic, model gambar dari Black Forest Labs, video dari Sora), agregator mengonsolidasikan semuanya ke satu invoice.
  • Observabilitas. Dasbor OpenAI menampilkan penggunaan Sora pada tingkat permintaan dengan rapi. Dasbor agregator bervariasi dalam seberapa baik mereka menangani beban kerja pembuatan video secara spesifik; beberapa memiliki observabilitas video yang dibangun khusus; yang lain memperlakukan video sebagai panggilan API generik. Perlu diperiksa sebelum berkomitmen jika observabilitas adalah prioritas.
  • Pooling rate limit. Pada OpenAI langsung, rate limit Sora terikat ke akun dan tier OpenAI Anda. Pada agregator, batasnya dalam beberapa kasus dipool di seluruh basis pelanggan agregator, atau ditetapkan per pelanggan di kasus lain. Untuk beban kerja produksi volume tinggi, tanyakan kepada agregator bagaimana mereka menangani alokasi rate limit sebelum integrasi.
  • Postur geografis dan kepatuhan. OpenAI langsung diproses melalui infrastruktur OpenAI dengan opsi residensi data yang disediakan OpenAI. Beberapa agregator berbasis di yurisdiksi dengan aturan residensi data yang berbeda; yang lain merutekan permintaan melalui infrastruktur OpenAI di AS apa pun yang terjadi. Untuk beban kerja teregulasi, ini sangat menentukan, dan ini adalah hal yang layak diminta secara tertulis dari tim penjualan agregator.

Posisi CometAPI

CometAPI mengekspos Sora 2 dan Sora 2 Pro bersama 500+ model lain di balik satu endpoint yang kompatibel dengan OpenAI, dengan satu kredensial dan penagihan terpadu. Harga Sora melalui CometAPI mengikuti tarif per detik OpenAI; nilai operasionalnya adalah mengonsolidasikan penggunaan Sora dengan trafik model Anda yang lain pada satu invoice. Untuk tim yang menjalankan beban kerja campuran (model teks dari banyak penyedia, pembuatan gambar, dan video Sora), ini adalah argumen inti. Untuk tim yang hanya menggunakan Sora dan hanya satu atau dua model teks, penghematan operasionalnya lebih kecil dan akses langsung OpenAI adalah pilihan yang dapat dipertahankan.

Pertimbangan produksi

Beberapa pola yang layak dipersiapkan dengan benar sebelum Sora menyentuh trafik produksi:

  • Penanganan siklus hidup job async. Perlakukan setiap pembuatan Sora sebagai job berjalan lama, bukan permintaan. Simpan ID job segera saat dibuat; tetap hidup melewati restart server dengan kemampuan melanjutkan polling untuk job in-flight; tangani kasus di mana job selesai saat worker Anda offline. Ini adalah kebersihan sistem terdistribusi standar tetapi sering dilewati pada awal karena Sora adalah API async pertama yang diintegrasikan tim.
  • Fallback webhook. Jika platform mendukung webhook untuk event penyelesaian (OpenAI API mendukungnya), gunakan. Webhook menghilangkan kebutuhan polling dan mengurangi tekanan rate limit Anda serta komputasi yang terbuang dari pengecekan status yang sering. Polling adalah fallback untuk lingkungan yang tidak dapat mengekspos endpoint webhook.
  • Mode kegagalan yang berbiaya. OpenAI tidak menagih untuk pembuatan yang gagal, tetapi penyelesaian parsial dan permintaan yang diulang yang berhasil pada upaya kedua memang menimbulkan biaya. Di produksi, catat biaya setiap retry dan beri peringatan jika tingkat retry melebihi ekspektasi, karena itu biasanya sinyal masalah kebijakan konten pada prompt yang Anda kirim, yang lebih murah diperbaiki di lapisan prompt daripada diserap dalam tagihan.
  • Kebijakan konten dan penerapan produksi. Sora dibatasi oleh kebijakan penggunaan OpenAI, yang membatasi kategori konten tertentu. Untuk penerapan produksi (terutama yang menghadap pengguna di mana prompt sebagian berada di bawah kendali pengguna), tinjau dokumentasi kebijakan konten resmi OpenAI dan rancang pagar pembatas (guardrail) hulu sesuai. Menautkan ke kebijakan OpenAI adalah rujukan yang tepat; dokumentasi itu adalah sumber kebenaran dan berubah lebih sering daripada artikel ini.

Apa yang dibangun terlebih dahulu

Pembacaan jujur tentang beban kerja Sora mana yang siap produksi hari ini, mana yang di ambang, dan mana yang terlalu dini:

Siap produksi hari ini

Beban kerja pemasaran dan konten kreatif di mana iterasi dibatasi dan metrik yang tepat adalah biaya per aset final. Video demo produk, konten kampanye media sosial, video hero untuk landing page, materi pelatihan internal. Ekonominya cocok, mode kegagalan sudah dipahami, dan cerita latensinya (30–90 detik untuk klip pendek) dapat diterima saat manusia dalam loop adalah tim konten alih-alih pengguna akhir.

Di ambang

Fitur pembuatan video yang menghadap pengguna di mana biaya per klip harus melampaui harga yang dibayar pengguna. Ini dapat dikerjakan tetapi memerlukan unit economics yang cermat: batasi durasi yang dapat diminta pengguna, gunakan Sora 2 standar pada 720p sebagai default, tetapkan harga yang memiliki margin di atas biaya per klip. Gelombang awal 2026 dari aplikasi pembuatan video konsumen sebagian besar berada di kategori ini, dan yang ekonominya berkelanjutan telah sengaja membatasi apa yang dapat dibuat pengguna.

Terlalu dini

Video durasi panjang dalam skala besar (apa pun di atas 25 detik, karena itu batas durasi Sora saat ini), skenario real-time volume tinggi di mana latensi waktu aktual lebih penting daripada biaya, dan aplikasi yang mengharapkan kontrol level frame atau reprodusibilitas berbasis seed. Ini adalah beban kerja untuk ditinjau kembali saat permukaan kapabilitas Sora berkembang, bukan dipaksakan hari ini.

Kerangka pemahaman: Sora 2 benar-benar siap produksi untuk beban kerja konten dengan manusia dalam loop. Dapat dikerjakan untuk fitur yang menghadap pengguna dengan unit economics yang disengaja. Terlalu dini untuk video durasi panjang dan untuk use case yang memerlukan parameter yang belum diekspos Sora. Bangun untuk yang siap hari ini; pantau yang belum.

Mencobanya pada beban kerja Anda: Semua varian Sora 2 dan Sora 2 Pro tersedia di CometAPI bersama model teks yang mungkin sudah Anda gunakan. Kredit uji coba gratis memungkinkan Anda membuat beberapa klip dengan harga standar tanpa penyiapan apa pun selain mengarahkan klien kompatibel OpenAI yang Anda miliki ke endpoint CometAPI.

Siap memangkas biaya pengembangan AI hingga 20%?

Mulai gratis dalam beberapa menit. Kredit uji coba gratis disertakan. Tidak perlu kartu kredit.

Baca Selengkapnya