Dostęp do API Sora w 2026 r.: cennik, limity wywołań i co faktycznie jest dostępne za pośrednictwem agregatorów

Sora 2 to pierwszy powszechnie dostępny model tekst-na-wideo od OpenAI, dostępny programistycznie zarówno przez oficjalne OpenAI API, jak i rosnący zestaw tras agregatorów. Model cenowy jest nietypowy w porównaniu z modelami tekstowymi (rozliczanie odbywa się za sekundę wygenerowanego wideo, a nie za token), a praktyczne pytania, które zadają deweloperzy przed integracją, różnią się od tych dotyczących API LLM. Ile faktycznie kosztuje klip? Jak długo trwa generowanie? Jakie są limity? Co się zmienia, gdy korzystasz z Sora przez agregatora zamiast bezpośrednio przez OpenAI?

Ten artykuł jest referencją, której sami chcieliśmy, gdy zaczynaliśmy określać zakres naszych funkcji generowania wideo. Tekst jest skierowany do dewelopera, który ma już za sobą etap „czy Sora jest ciekawa?” i musi teraz odpowiedzieć na pytania: „ile to będzie kosztować, ile zajmie integracja i co muszę wiedzieć, zanim się zobowiążę?”

Szybki skrót: Sora 2 (model standardowy) kosztuje $0.10 za sekundę wygenerowanego wideo w 720p. Sora 2 Pro kosztuje $0.30 za sekundę w 720p lub $0.50 za sekundę w 1024p. Typowy 10‑sekundowy klip to $1.00 na modelu standardowym i $5.00 na Pro w HD. Generowanie jest asynchroniczne; dla klipu 5–10 s oczekuj 30–90 sekund czasu rzeczywistego. Dostęp wymaga płatnego konta OpenAI na poziomie użycia co najmniej 2.

Stan dostępu do API Sora w 2026 r.

Sora 2 pojawiła się w OpenAI API 7 października 2025 r. i dostęp jest nieprzerwanie utrzymywany. Identyfikator modelu to sora-2 (z aktualnym snapshotem sora-2-2025-12-08), a wariant wyższej wierności to sora-2-pro. Oba wspierają generowanie tekst‑na‑wideo i obraz‑na‑wideo, z zsynchronizowanym wyjściem audio. Od 10 stycznia 2026 r. bezpłatny dostęp konsumencki przez produkt ChatGPT został wycofany, co skupiło użycie Sora w segmencie deweloperskim na płatnych subskrypcjach ChatGPT lub bezpośrednim dostępie przez API.

Istnieją trzy ścieżki programistycznego użycia Sora:

Bezpośrednie API OpenAI. Kanoniczna trasa. Rozliczanie za sekundę, tylko płatne, wymaga minimalnego doładowania $10, aby osiągnąć poziom użycia 2, który odblokowuje dostęp do modelu Sora. Obsługiwane SDK i REST API.
Azure OpenAI. Trasa Microsoftu dla przedsiębiorstw, odzwierciedlająca oficjalne stawki OpenAI z dodatkowymi kosztami subskrypcji Azure i funkcjami zgodności klasy enterprise. Te same ceny za sekundę; inna warstwa operacyjna.
Agregatory. Usługi wystawiające Sora za własnym zunifikowanym API. Większość agregatorów przenosi stawki OpenAI za sekundę 1:1; wartość dodana jest operacyjna (jedne poświadczenia, jedna faktura, to samo SDK co dla ruchu do modeli tekstowych). Niektórzy agregatorzy oferują własne taryfy — omawiamy je później w artykule.

Sora 2 – cena za sekundę wideo

Cennik Sora jest ustrukturyzowany według poziomu modelu i rozdzielczości wyjściowej, ze stawką za sekundę mnożoną przez długość klipu, aby uzyskać koszt generowania. Zweryfikowane na oficjalnej stronie cen OpenAI na maj 2026 r.:

Model	Rozdzielczość	Obsługiwane długości	Cena za sekundę	Klip 10 s
Sora 2 (standardowy)	720p	4s, 8s, 12s	$0.10	$1.00
Sora 2 Pro	720p	10s, 15s, 25s	$0.30	$3.00
Sora 2 Pro	1024p (1792×1024)	10s, 15s, 25s	$0.50	$5.00

Uwagi do struktury cenowej. Rozliczanie odbywa się za wyjście, nie za wejście; nie ma rozliczania za wejście opartego na tokenach jak w modelach tekstowych. Kondycjonowanie obrazem (przekazanie obrazu referencyjnego jako kotwicy generacji) nie zmienia stawki za sekundę. Opcje długości dla każdego poziomu modelu są stałe: nie można poprosić o 7‑sekundowy klip na modelu standardowym — tylko 4, 8 lub 12 sekund.

Dwie praktyczne implikacje warte jasnego podkreślenia. Po pierwsze: model cenowy jest bliższy rachunkowi za renderowanie wideo niż rachunkowi za LLM. Koszt zależy od długości wyjścia, a nie od złożoności promptu czy liczby tokenów. Po drugie: różnica kosztu między Sora 2 a Sora 2 Pro w HD to 5× na sekundę: 10‑sekundowy klip kosztuje $1.00 na standardzie i $5.00 na Pro w 1024p. Wybór właściwego poziomu do zadania to największa dźwignia kosztowa — warto świadomie decydować, które obciążenia naprawdę wymagają wyższej wierności Pro.

Limity zapytań i kwoty

Limity Sora są zorganizowane wokół standardowego systemu poziomów użycia OpenAI. Kluczowe szczegóły specyficzne dla Sora:

Minimalny wymagany poziom: Poziom 2, osiągany przez doładowanie co najmniej $10 kredytu API. Poziom 1 (domyślny dla nowych kont) nie obejmuje dostępu do modelu Sora.
Limity równoległych generacji: Zgodnie z dokumentacją limitów OpenAI, równoczesne generowanie wideo jest ograniczone przez poziom, typowo do niewielkiej liczby zadań „in‑flight” na niższych poziomach, zwiększając się wraz z poziomem użycia. Dokładny sufit jest ustalany per konto i widoczny w panelu OpenAI. Dla obciążeń o dużej skali planuj dostęp poziomu 3 lub 4 od pierwszego dnia.
Wnioski o kwoty: Wyższe limity współbieżności ponad domyślne progi poziomów można wnioskować przez formularz zwiększenia limitów OpenAI. Zgoda zależy od charakteru obciążenia i nie jest natychmiastowa; dla produkcyjnych wdrożeń z przewidywalnymi pikami żądaj zwiększenia kilka tygodni przed uruchomieniem.

Warto wiedzieć: limity Sora są pulowane inaczej niż limity modeli tekstowych na tym samym koncie. Zespół generujący duży ruch Sora nie wpływa na dostępny budżet limitów dla wywołań GPT‑5.5. I odwrotnie, duży ruch GPT‑5.5 nie „zjada” budżetu Sora. Planuj te dwie rzeczy jako oddzielne zagadnienia pojemnościowe.

Czas generowania: czego naprawdę się spodziewać

Sora jest z natury asynchroniczna. Wysyłasz żądanie generacji, otrzymujesz ID zadania i sondujesz (lub odbierasz webhook) do momentu ukończenia. Czas rzeczywisty między żądaniem a ukończeniem zależy od długości i rozdzielczości wyjścia, aktualnego obciążenia infrastruktury OpenAI oraz tego, czy zadanie czeka w kolejce za innymi na twoim koncie.

Realistyczne oczekiwania na podstawie obserwacji:

Wyjście	Typowy czas rzeczywisty	Uwagi
Sora 2 standard, 4s @ 720p	20–45 sekund	Najszybsza ścieżka; dobre do iteracji
Sora 2 standard, 8s @ 720p	40–90 sekund	Najczęstsza długość w produkcji
Sora 2 standard, 12s @ 720p	60–120 sekund	Dłuższe treści do social mediów
Sora 2 Pro, 10s @ 720p	60–150 sekund	Jakość premium; ~3× koszt względem standardu
Sora 2 Pro, 15s @ 1024p	120–240 sekund	Pełne HD, dłuższe kolejki w godzinach szczytu
Sora 2 Pro, 25s @ 1024p	200–360 sekund	Maksymalna długość; cena skaluje się liniowo

Dwie konsekwencje operacyjne:

Budżety latencji dla użytkownika wymagają przemyślenia. Jeśli produkt ma sprawiać wrażenie responsywnego na akcję użytkownika, zakres 30–90 sekund dla krótkich klipów oznacza konieczność przygotowania UX na oczekiwanie: wskaźniki postępu, prace równoległe możliwe dla użytkownika podczas generowania, albo pre‑generacja dla przewidywalnych scenariuszy. Traktowanie Sora jak synchronicznego wywołania API to najczęstszy błąd architektoniczny zespołów.
Sondowanie kontra webhooki ma znaczenie. Naiwne sondowanie (ciasna pętla trafiająca w endpoint statusu) marnuje zarówno budżet limitów, jak i moc obliczeniową modelu. Używaj eksponencjalnego backoffu z jitterem lub skonfiguruj webhooki, jeśli środowisko na to pozwala. Wzorzec sondowania, który dobrze działa w produkcji, to sondowanie co 10 sekund przez pierwszą minutę, następnie co 30 sekund, z twardym timeoutem ustawionym na górną granicę oczekiwanego czasu dla żądanej długości.

Obsługiwane parametry i struktura promptu

Powierzchnia API Sora jest celowo prosta w porównaniu z modelami generowania obrazów, jak DALL‑E 3. Pokręteł jest mniej, ale te dostępne mają znaczenie. Kluczowe parametry:

model: sora-2 lub sora-2-pro. Wybór determinuje cenę oraz dostępne opcje długości/rozdzielczości, jak w tabeli cen.
prompt: Swobodny tekst opisujący scenę. Sora rozumie wskazówki filmowe (ujęcia kamery, ruch, oświetlenie), akcje postaci i detale otoczenia. Model jest wrażliwy na strukturę promptu: zaczynaj od ustanowienia sceny, potem akcja, na końcu wskazówki techniczne — to daje bardziej powtarzalne rezultaty niż jeden gęsty akapit.
image: Opcjonalny obraz referencyjny dla generowania obraz‑na‑wideo. Referencja działa jak kotwica pierwszej klatki; model generuje ruch wychodząc od tego punktu. Przydatne w demach produktowych, utrzymaniu spójności postaci i wszędzie tam, gdzie wygląd statyczny jest nienegocjowalny.
duration: Długość w sekundach. Ograniczona do dyskretnych opcji dla wybranego modelu (4/8/12 dla sora-2, 10/15/25 dla sora-2-pro). Koszt skaluje się liniowo z długością.
size: Rozdzielczość. 720x1280 (pion) lub 1280x720 (poziom) dla modelu standardowego; na Pro dochodzi 1024x1792 / 1792x1024. Proporcje wynikają z wyboru rozmiaru.

Wyraźne braki. Sora nie udostępnia obecnie kontroli „seed” przez publiczne API (więc powtarzalność między uruchomieniami nie jest gwarantowana), ani indywidualnych ustawień stylu takich jak w Midjourney czy innych modelach obrazowych. Model jest opiniotwórczy; inżynieria promptów jest główną dźwignią, nie strojenie parametrów.

Prosty przykład żądania generacji Sora 2 z użyciem OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Utwórz zadanie generowania wideojob = client.videos.create(model="sora-2",prompt=("Szerokokątny kadr ośnieżonej góry o wschodzie słońca. ""Kamera powoli przesuwa się w lewo, gdy pierwsze promienie słońca oświetlają szczyt. ""Klimat filmowy, złota godzina, oświetlenie jakości 4K."),size="1280x720",duration=8,)# Sprawdzaj postęp do zakończeniawhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Generowanie nie powiodło się: {job.error}")print(f"Aktualny status: {job.status}")time.sleep(10)print(f"Wideo gotowe: {video_url}")

Przykłady kosztów

Rozliczanie „za sekundę” czyni koszt przewidywalnym — ale dopiero gdy jasno określisz kształt obciążenia. Trzy reprezentatywne scenariusze:

Scenariusz 1: Krótkie demo produktu na stronę główną SaaS

Klip 5‑sekundowy pokazujący UI produktu w akcji, generowany raz i użyty jako wideo hero na stronie marketingowej. Spodziewasz się 5–10 iteracji, by uzyskać satysfakcjonujący klip przed publikacją.

Koszt na Sora 2 standard w 720p: 5s × $0.10 = $0.50 za generację. Przy 8 iteracjach, by uzyskać finalny klip: $4.00. Koszt na Sora 2 Pro w 1024p dla finalnej wersji: 5s × $0.50 = $2.50 (pojedyncze ujęcie). Łączny koszt projektu: około $6.50 za iteracje plus finał w HD.

Scenariusz 2: Partia 50 klipów do kampanii marketingowej

50 unikalnych 8‑sekundowych klipów produktowych, każdy oparty na innym opisie funkcji, wszystkie na Sora 2 standard w 720p. Bez budżetu na iteracje; akceptujesz pierwszą generację.

Koszt: 50 × 8s × $0.10 = $40.00. Dodaj 30% budżetu iteracji dla klipów, które nie wyjdą za pierwszym razem (50 × 0.30 = 15 powtórek × 8s × $0.10 = $12). Razem: około $52.00 dla kampanii.

Scenariusz 3: Funkcja wideo generowanego przez użytkownika w produkcie konsumenckim

Użytkownicy w twojej aplikacji generują klipy 6‑sekundowe na żądanie, na Sora 2 standard w 720p. Średnie użycie: 1000 klipów dziennie. Pobierasz od użytkownika $0.50 za generację i akceptujesz różnicę kosztu jako marżę jednostkową.

Koszt na klip użytkownika: 6s × $0.10 = $0.60. Przy cenie dla użytkownika $0.50, obciążenie jest nierentowne na poziomie standard: każda generacja kosztuje o $0.10 więcej niż płaci użytkownik. Poziom standard 720p wymaga ceny użytkownika co najmniej $0.65, by osiągnąć próg rentowności przed kosztami infrastruktury. Przy 30,000 klipów miesięcznie: miesięczny rachunek za Sora to $18,000. To właśnie ten rodzaj analizy ekonomiki jednostkowej warto zrobić, zanim uruchomisz dowolną funkcję wideo skierowaną do użytkownika.

Wniosek ze wszystkich trzech scenariuszy: generowanie wideo jest rzeczywiście przystępne kosztowo dla działań marketingowych i treści jednorazowych, gdzie liczba iteracji jest ograniczona, a liczy się koszt „na finalny asset”. Jest znacząco trudniejsze dla funkcji skierowanych do użytkownika na skalę, gdzie koszt „na generację” musi pokryć cenę płaconą przez użytkownika plus narzut produktowy. Bądź precyzyjny co do obciążenia, które wyceniasz, zanim się zobowiążesz.

Bezpośredni dostęp OpenAI kontra dostęp przez agregator

Skoro Sora jest dostępna kilkoma drogami, praktyczne pytanie większości zespołów brzmi: z którym interfejsem integrować. Uczciwa odpowiedź zależy od reszty twojego stosu.

Co jest takie samo

Jakość wyjścia, czas generacji na warstwie modelu, obsługiwane parametry i ceny za sekundę są zazwyczaj identyczne niezależnie od trasy, ponieważ większość agregatorów przenosi ceny OpenAI 1:1, a model to ten sam model. Jeśli wybierasz trasę wyłącznie ze względu na jakość wyjścia, wybór jest neutralny.

Co jest inne

Powierzchnia rozliczeń. Bezpośredni dostęp do OpenAI rozlicza przez twoje konto OpenAI; agregatorzy rozliczają przez własny system kredytów lub subskrypcji. Dla zespołów, które już zarządzają rozliczeniami OpenAI za użycie modeli tekstowych, bezpośrednia trasa nic nie dodaje. Dla zespołów z obciążeniami multi‑provider (LLM od Anthropic, modele obrazowe od Black Forest Labs, wideo z Sora), agregator konsoliduje to na jednej fakturze.
Obserwowalność. Panel OpenAI prezentuje wykorzystanie Sora na poziomie żądania w przejrzysty sposób. Panele agregatorów różnią się pod względem obsługi obciążeń generowania wideo; niektóre mają narzędzia dedykowane, inne traktują wideo jak zwykłe wywołanie API. Warto sprawdzić przed wyborem, jeśli obserwowalność jest priorytetem.
Pule limitów. Przy bezpośrednim dostępie do OpenAI limity Sora są powiązane z twoim kontem i poziomem. U agregatora limity bywają współdzielone w poprzek bazy klientów lub przydzielane per klient. Dla produkcji o dużej skali zapytaj agregatora, jak alokuje limity, zanim zintegrujesz.
Geografia i zgodność. Bezpośrednie OpenAI jest przetwarzane przez infrastrukturę OpenAI zgodnie z opcjami rezydencji danych, które zapewnia OpenAI. Niektórzy agregatorzy działają w jurysdykcjach o innej rezydencji danych; inni i tak kierują żądania przez infrastrukturę OpenAI w USA. Dla regulowanych obciążeń to kwestia decydująca — poproś zespół sprzedaży agregatora o pisemne potwierdzenie.

Jak CometAPI się wpisuje

CometAPI wystawia Sora 2 i Sora 2 Pro obok 500+ innych modeli za jednym, kompatybilnym z OpenAI endpointem, z jednym poświadczeniem i zintegrowanym rozliczaniem. Ceny Sora przez CometAPI odpowiadają stawkom za sekundę OpenAI; wartość operacyjna to konsolidacja użycia Sora z resztą twojego ruchu do modeli na jednej fakturze. Dla zespołów z mieszanymi obciążeniami (modele tekstowe od wielu dostawców, generowanie obrazów i wideo Sora) to główny argument. Dla zespołów używających wyłącznie Sora i jednego–dwóch modeli tekstowych oszczędność operacyjna jest mniejsza i bezpośredni dostęp do OpenAI jest obronnym wyborem.

Kwestie produkcyjne

Kilka wzorców, które warto dobrze ustawić, zanim Sora trafi na ruch produkcyjny:

Obsługa asynchronicznego cyklu życia zadań. Traktuj każdą generację Sora jako długotrwające zadanie, nie żądanie. Zachowuj ID zadania natychmiast po utworzeniu; przetrwaj restart serwera dzięki możliwości wznowienia sondowania dla zadań „in‑flight”; obsłuż przypadek, gdy zadanie kończy się, gdy twój worker jest offline. To standardowa higiena systemów rozproszonych, ale często pomijana, bo Sora bywa pierwszym asynchronicznym API integrowanym przez zespół.
Webhook jako preferencja. Jeśli platforma wspiera webhooki dla zdarzeń ukończenia (OpenAI API wspiera), używaj ich. Webhooki eliminują potrzebę sondowania i zmniejszają zarówno presję na limity, jak i marnowanie obliczeń przez częste sprawdzanie statusu. Sondowanie jest wyjściem awaryjnym dla środowisk, które nie mogą wystawić endpointu webhook.
Tryby awarii, które kosztują. OpenAI nie rozlicza za nieudane generacje, ale częściowe ukończenia i ponowienia, które kończą się sukcesem za drugim razem, już generują koszt. W produkcji loguj koszt każdego retry i alarmuj, jeśli wskaźnik retry przekracza oczekiwania — to zwykle sygnał problemu z polityką treści w promptach, co taniej naprawić na warstwie promptu niż absorbować w rachunku.
Polityka treści i wdrożenie produkcyjne. Sora podlega politykom użytkowania OpenAI, które ograniczają niektóre kategorie treści. Dla wdrożeń produkcyjnych (zwłaszcza skierowanych do użytkownika, gdzie prompt jest częściowo pod jego kontrolą) przejrzyj oficjalną dokumentację polityk treści OpenAI i zaprojektuj odpowiednie zabezpieczenia „upstream”. Podlinkowanie do polityki OpenAI jest właściwą referencją; ta dokumentacja jest źródłem prawdy i zmienia się częściej niż ten artykuł.

Co zbudować najpierw

Uczciwy przegląd tego, które obciążenia Sora są gotowe na produkcję dzisiaj, które są na granicy, a które są przedwczesne:

Gotowe do produkcji dziś

Działania marketingowe i kreatywne, gdzie liczba iteracji jest ograniczona, a właściwą metryką jest koszt „na finalny asset”. Wideo demo produktu, treści do kampanii w social media, wideo hero na strony lądowania, wewnętrzne materiały szkoleniowe. Ekonomika działa, tryby awarii są dobrze rozpoznane, a historia latencji (30–90 sekund dla krótkich klipów) jest akceptowalna, gdy „człowiek w pętli” to zespół contentowy, a nie użytkownik końcowy.

Na granicy

Funkcje generowania wideo skierowane do użytkownika, gdzie koszt na klip musi przewyższyć cenę płaconą przez użytkownika. To wykonalne, ale wymaga uważnej ekonomiki jednostkowej: ogranicz długość, jaką użytkownicy mogą zamawiać, używaj domyślnie Sora 2 standard w 720p, naliczaj cenę z marżą ponad koszt na klip. Fala aplikacji konsumenckich generowania wideo z początku 2026 r. mieści się głównie w tej kategorii, a te z trwałą ekonomiką były bardzo świadome ograniczania tego, co użytkownicy mogą generować.

Przedwczesne

Wideo długiej formy na skalę (cokolwiek powyżej 25 sekund, bo to obecny limit długości Sora), scenariusze o bardzo dużej skali, gdzie czas rzeczywisty jest ważniejszy niż koszty, oraz zastosowania oczekujące kontroli na poziomie klatki lub powtarzalności opartej na seed. To obciążenia do ponownego rozważenia, gdy powierzchnia możliwości Sora się rozszerzy, a nie do dopasowywania na siłę dziś.

Ramy: Sora 2 jest naprawdę gotowa produkcyjnie dla obciążeń contentowych z człowiekiem w pętli. Jest wykonalna dla funkcji skierowanych do użytkownika przy świadomej ekonomice jednostkowej. Jest przedwczesna dla długiej formy wideo i przypadków, które wymagają parametrów, jakich Sora jeszcze nie wystawia. Buduj pod to, co jest gotowe dziś; śledź to, co jeszcze nie jest.

Wypróbuj na swoim obciążeniu: Wszystkie warianty Sora 2 i Sora 2 Pro są dostępne w CometAPI obok modeli tekstowych, z których możesz już korzystać. Darmowy kredyt próbny pozwala wygenerować kilka klipów po cenach standardowych bez żadnej konfiguracji poza skierowaniem istniejącego, kompatybilnego z OpenAI klienta na endpoint CometAPI.