Temel özellikler
- Çok modlu üretim (video + ses) — Sora-2-Pro, video ve ses ayrı ayrı üretmek yerine, video karelerini senkronize sesle (diyalog, ortam sesi, SFX) birlikte üretir.
- Daha yüksek doğruluk / “Pro” seviyesi — daha yüksek görsel doğruluk, daha zorlu planlar (karmaşık hareket, oklüzyon ve fiziksel etkileşimler) ve Sora-2’ye (Pro olmayan) kıyasla sahne başına daha uzun tutarlılık için ayarlanmıştır. Standart Sora-2 modeline göre oluşturma daha uzun sürebilir.
- Girdi esnekliği — salt metin istemlerini destekler ve kompozisyonu yönlendirmek için görüntü giriş kareleri veya referans görseller kabul edebilir (input_reference iş akışları).
- Cameo’lar / benzerlik enjeksiyonu — uygulamadaki rıza iş akışlarıyla bir kullanıcının kaydedilmiş yüz benzerliğini oluşturulan sahnelere ekleyebilir.
- Fiziksel gerçekçilik: nesne sürekliliği ve hareket doğruluğu (ör. momentum, kaldırma kuvveti) iyileştirilmiştir; önceki sistemlerde yaygın olan gerçekçi olmayan “teleporting” artifaktlarını azaltır.
- Kontrol edilebilirlik: yapısal istemleri ve plan düzeyinde yönlendirmeleri destekler; böylece içerik üreticileri kamera, ışıklandırma ve çok planlı sekansları belirtebilir.
Teknik ayrıntılar ve entegrasyon yüzeyi
Model ailesi: Sora 2 (temel) ve Sora 2 Pro (yüksek kaliteli varyant).
Girdi kipleri: metin istemleri, görsel referans ve benzerlik için kısa kaydedilmiş cameo video/ses.
Çıktı kipleri: kodlanmış video (sesli) — parametreler /v1/videos uç noktaları üzerinden sunulur (model: "sora-2-pro" ile model seçimi). API yüzeyi, oluşturma/alma/listeleme/silme işlemleri için OpenAI’nin videos uç noktası ailesini izler.
Eğitim ve mimari (kamusal özet): OpenAI, Sora 2’nin geniş ölçekli video verisiyle eğitildiğini ve dünya simülasyonunu iyileştirmek için sonradan eğitim uygulandığını belirtir; ayrıntılar (model boyutu, tam veri kümeleri ve belirteçleme) satır satır kamuya açık şekilde listelenmemiştir. Yoğun hesaplama, özelleşmiş video tokenizer/mimarileri ve çok modlu hizalama bileşenleri beklenir.
API uç noktaları ve iş akışı: iş tabanlı bir iş akışı gösterin: bir POST oluşturma isteği gönderin (model="sora-2-pro"), bir iş kimliği veya konum alın, ardından tamamlanmayı yoklayın ya da bekleyin ve ortaya çıkan dosya(ları) indirin. Yayınlanmış örneklerde yaygın parametreler prompt, seconds/duration, size/resolution ve görüntü güdümlü başlangıçlar için input_reference içerir.
Tipik parametreler :
model:"sora-2-pro"prompt: doğal dilde sahne açıklaması, isteğe bağlı diyalog ipuçlarıylaseconds/duration: hedef klip uzunluğu (Pro, mevcut sürelerde en yüksek kaliteyi destekler)size/resolution: topluluk raporlarına göre Pro birçok kullanımda 1080p’ye kadar destekler.
İçerik girdileri: görüntü dosyaları (JPEG/PNG/WEBP) bir kare veya referans olarak sağlanabilir; kullanıldığında, görüntü hedef çözünürlükle eşleşmeli ve kompozisyon çıpası olarak işlev görmelidir.
Oluşturma davranışı: Pro, kareden kareye tutarlılığı ve gerçekçi fiziği önceliklendirecek şekilde ayarlanmıştır; bu genellikle Pro olmayan varyantlara kıyasla klip başına daha uzun hesaplama süresi ve daha yüksek maliyet anlamına gelir.
Kıyaslama performansı
Niteliksel güçlü yanlar: OpenAI, önceki video modellere kıyasla gerçekçiliği, fizik tutarlılığını ve senkronize ses** geliştirdi. Diğer VBench sonuçları, Sora-2 ve türevlerinin çağdaş kapalı kaynak ve zamansal tutarlılıkta en üstte veya zirveye yakın konumlandığını gösterir.
Bağımsız zamanlama/iş hacmi (örnek kıyas): Sora-2-Pro, bir karşılaştırmada 20 saniyelik 1080p klipler için ortalama ~2.1 dakika sürerken, bir rakip (Runway Gen-3 Alpha Turbo) aynı görevde daha hızlıydı (~1.7 dakika) — ödünleşimler kalite ile oluşturma gecikmesi ve platform optimizasyonu arasındadır.
Sınırlamalar (pratik ve güvenlik)
- Mükemmel fizik/tutarlılık değil — iyileştirilmiş olsa da kusursuz değildir; artifaktlar, doğal olmayan hareket veya ses senkron hataları görülebilir.
- Süre ve hesaplama kısıtları — uzun klipler hesaplama açısından yoğundur; pratik iş akışlarının çoğu yüksek kalite çıktılar için klipleri tek haneli ila düşük iki haneli saniyelerle sınırlar.
- Gizlilik / rıza riskleri — benzerlik enjeksiyonu (“cameo”lar) rıza ve yanlış/bilgi kirliliği riskleri doğurur; OpenAI’nin uygulamada açık güvenlik kontrolleri ve iptal mekanizmaları vardır, ancak sorumlu entegrasyon gerekir.
- Maliyet ve gecikme — Pro kalitesinde oluşturma, daha hafif modeller veya rakiplere kıyasla daha pahalı ve daha yavaş olabilir; saniye/oluşturma başına faturalama ve kuyruğa almayı dikkate alın.
- Güvenli içerik filtrelemesi — zararlı veya telifli içerik üretimi kısıtlanır; model ve platform güvenlik katmanları ve denetim içerir.
Tipik ve önerilen kullanım alanları
Kullanım örnekleri:
- Pazarlama ve reklam prototipleri — sinematik kavram kanıtlarını hızla oluşturun.
- Ön görselleştirme — storyboard’lar, kamera yerleşimi, plan görselleştirme.
- Kısa sosyal içerik — senkronize diyalog ve SFX ile stillendirilmiş klipler.
- Sora 2 Pro API’ye nasıl erişilir
Adım 1: API Anahtarı için Kaydolun
cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun. CometAPI konsolunuza giriş yapın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token’ında “Add Token”a tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.

Adım 2: Sora 2 Pro API’sine İstek Gönderin
API isteğini göndermek için “sora-2-pro” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Kolaylık için web sitemiz Apifox testi de sağlar. Hesabınızdaki gerçek CometAPI anahtarınızla <YOUR_API_KEY> değerini değiştirin. temel url resmî Video oluştur
Sorunuzu veya talebinizi content alanına ekleyin — modelin yanıtlayacağı şey budur. Oluşturulan yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları Alın ve Doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşleme sonrasında API, görev durumunu ve çıktı verilerini döndürür.
- Dahili eğitim / simülasyon — RL veya robotik araştırmaları için senaryo görselleri üretin (dikkatle).
- Yaratıcı prodüksiyon — insan düzenlemesiyle birleştirildiğinde (kısa klipleri birleştirme, renk düzenleme, sesi değiştirme).