Sora API-adgang i 2026: prissætning, ratebegrænsninger og hvad der reelt er tilgængeligt via aggregatorer

CometAPI
AnnaMay 21, 2026
Sora API-adgang i 2026: prissætning, ratebegrænsninger og hvad der reelt er tilgængeligt via aggregatorer

Sora 2 er den første generelt tilgængelige tekst-til-video-model fra OpenAI, som kan tilgås programmæssigt via både den officielle OpenAI API og et voksende sæt aggregator-ruter. Prisstrukturen er usædvanlig sammenlignet med tekstmodeller (afregning per sekund af genereret video i stedet for per token), og de praktiske spørgsmål udviklere stiller før integration er anderledes end for en LLM-API. Hvad koster et klip egentlig? Hvor lang tid tager genereringen? Hvad er rate limits? Hvad ændrer sig, når du tilgår Sora via en aggregator i stedet for direkte hos OpenAI?

Denne artikel er den reference, vi ønskede fandtes, da vi begyndte at afsøge vores egne videogenereringsfunktioner. Stykket er struktureret til udvikleren, der er forbi “er Sora interessant?” og nu skal besvare “hvad vil det koste, hvad kræver integrationen, og hvad skal jeg vide, før jeg forpligter mig?”

Kort overblik: Sora 2 (standardmodellen) koster $0.10 per sekund genereret video ved 720p. Sora 2 Pro koster $0.30 per sekund ved 720p eller $0.50 per sekund ved 1024p. Et typisk 10-sekunders klip koster $1.00 på standardmodellen og $5.00 på Pro i HD. Genereringstiden er asynkron; forvent 30–90 sekunders wall-clock-tid for et 5–10 sekunders klip. Adgang kræver en betalt OpenAI-konto på mindst usage tier 2.

Status for Sora API-adgang i 2026

Sora 2 blev lanceret i OpenAI API den 7. oktober 2025, og adgangen har været kontinuerligt tilgængelig siden. Modelidentifikatoren er sora-2 (med nuværende snapshot-ID sora-2-2025-12-08), og varianten med højere fidelitet er sora-2-pro. Begge understøtter tekst-til-video og billede-til-video-generering med synkroniseret lydoutput. Pr. 10. januar 2026 blev forbrugeradgang på gratisniveau via ChatGPT-produktet indstillet, hvilket har koncentreret Sora-brug i udviklerkvalitet enten på betalte ChatGPT-abonnementer eller direkte API-adgang.

Der er tre veje til at bruge Sora programmæssigt:

  • OpenAI direkte API. Den kanoniske rute. Afregning per sekund, kun betalt, kræver minimum $10 top-up for at nå usage tier 2, som låser op for Sora-modeller. Både SDK og REST API er understøttet.
  • Azure OpenAI. Microsofts enterprise-rute, som spejler OpenAI’s officielle takster med tilføjelse af Azure-abonnementsomkostninger og enterprise-compliance-funktioner. Samme per-sekund-priser; anderledes driftsflade.
  • Aggregatorer. Tjenester der eksponerer Sora bag deres egen unified API. De fleste aggregatorer videresender OpenAI’s per-sekund-priser til paritet; værdien er operationel (én credential, én faktura, samme SDK som din tekstmodeltrafik). Nogle aggregatorer tilbyder egne takststrukturer, som vi diskuterer senere i artiklen.

Sora 2-priser per sekund video

Sora-priserne er struktureret efter modelniveau og outputopløsning, med en per-sekund-takst som multipliceres med klippets varighed for at give genereringsomkostningen. Verificeret fra OpenAI’s officielle prisside pr. maj 2026:

ModelOpløsningUnderstøttede varighederPris pr. sekund10-sekunders klip
Sora 2 (standard)720p4s, 8s, 12s$0.10$1.00
Sora 2 Pro720p10s, 15s, 25s$0.30$3.00
Sora 2 Pro1024p (1792×1024)10s, 15s, 25s$0.50$5.00

Noter om prisstrukturen. Prissætningen er efter output, ikke input; der er ingen tokenbaseret inputafregning for Sora, som der er for tekstmodeller. Billedkonditionering (at sende et referencebillede for at forankre genereringen) ændrer ikke per-sekund-taksten. Varighedsvalgene for hver model er faste: du kan ikke anmode om et 7-sekunders klip på standardmodellen, kun 4, 8 eller 12 sekunder.

To praktiske implikationer er værd at sige tydeligt. For det første: prislogikken er tættere på videorendering end på en LLM-faktura. Omkostning styres af outputvarighed, ikke hvor kompleks din prompt er, eller hvor mange tokens den indeholder. For det andet: prisforskellen mellem Sora 2 og Sora 2 Pro i HD er 5x per sekund: et 10-sekunders klip koster $1.00 på standard og $5.00 på Pro ved 1024p. Valget af det rigtige niveau til opgaven er den største omkostningshåndtag, du har, og det kan betale sig at være bevidst om, hvilke workloads der reelt behøver Pro’s højere fidelitet.

Rate limits og kvoter

Sora-rate limits er organiseret omkring OpenAI’s standard usage-tier-system. De væsentlige detaljer for Sora specifikt:

  • Minimumskrav til tier: Tier 2, opnås ved at toppe mindst $10 API-kredit op. Tier 1 (default for nye konti) inkluderer ikke adgang til Sora-modeller.
  • Begrænsninger for samtidige genereringer: Ifølge OpenAI’s rate-limit-dokumentation er samtidig videogenerering begrænset af tier, typisk et lille antal igangværende genereringer på lavere tiers, som skalerer med usage tier. Det præcise loft sættes pr. konto og er synligt i OpenAI-dashboardet. For high-volume workloads, planlæg for tier-3 eller tier-4 adgang fra dag ét.
  • Kvoteforøgelser: Højere samtidighedsgrænser ud over standardlofterne kan anmodes via OpenAI’s formular til rate-limit-forøgelse. Godkendelse er workload-specifik og ikke øjeblikkelig; til produktioner med forudsigelige efterspørgselspeaks, søg forøgelsen flere uger før lancering.

Værd at vide: rate limits på Sora er pool’et anderledes end tekstmodellernes rate limits på samme konto. Et team, der kører tung Sora-trafik, påvirker ikke deres tilgængelige ratebudget til GPT-5.5-kald. Omvendt æder stor GPT-5.5-trafik ikke af Sora-budgettet. Planlæg de to som separate kapacitetsområder.

Genereringstid: hvad du faktisk kan forvente

Sora er asynkron af design. Du indsender en genereringsanmodning, får et job-ID tilbage og poller (eller får webhook-kald) for færdiggørelse. Wall-clock-tiden mellem anmodning og færdig afhænger af outputvarighed og -opløsning, nuværende load på OpenAI-infrastrukturen, og om jobbet er køet bag andre på din konto.

Realistiske forventninger baseret på observeret adfærd:

OutputTypisk wall-clock-tidNoter
Sora 2 standard, 4s @ 720p20–45 sekunderHurtigste vej; god til iteration
Sora 2 standard, 8s @ 720p40–90 sekunderMest almindelige produktionsvarighed
Sora 2 standard, 12s @ 720p60–120 sekunderLængere socialt indhold
Sora 2 Pro, 10s @ 720p60–150 sekunderPremium-kvalitet; ~3x pris ift. standard
Sora 2 Pro, 15s @ 1024p120–240 sekunderFuld HD, længere køer observeret i peak-perioder
Sora 2 Pro, 25s @ 1024p200–360 sekunderMaksimal varighed; prisen skalerer lineært

To driftsmæssige konsekvenser:

  • Brugerrettede latensbudgetter skal gentænkes. Hvis dit produkt forventer, at videogenerering føles responsiv på en brugerhandling, betyder 30–90 sekunder for korte klip, at du har brug for en UX, der håndterer ventetiden: fremdriftsindikatorer, parallelt arbejde brugeren kan lave, mens videoen genereres, eller for-generering i forudsigelige scenarier. At behandle Sora som et synkront API-kald er den mest almindelige arkitekturfejl teams laver.
  • Polling versus webhooks betyder noget. Naiv polling (et stramt loop der rammer status-endpointet) spilder både din rate-limit-kvote og modellens compute. Brug eksponentiel backoff med jitter, eller sæt webhook-callbacks op, hvis dit miljø understøtter dem. Polling-mønsteret, der fungerer godt i produktion, er at polle med 10-sekunders intervaller det første minut, derefter 30-sekunders intervaller derefter, med en hård timeout ved modellens forventede øvre grænse for den anmodede varighed.

Understøttede parametre og prompt-struktur

Soras API-overflade er bevidst enkel sammenlignet med billedgenereringsmodeller som DALL-E 3. Der er færre knapper at dreje på, men de, der findes, betyder noget. De væsentlige parametre:

  • model: sora-2 eller sora-2-pro. Valget styrer både prissætning og de tilgængelige varigheds-/opløsningsmuligheder som vist i pristabellen ovenfor.
  • prompt: Fri tekst, der beskriver scenen. Sora håndterer filmisk instruktion (kameravinkler, bevægelse, lys), karakterhandlinger og miljødetaljer. Modellen er følsom over for prompt-struktur: at starte med sceneopbygning, derefter handling, derefter teknisk instruktion, giver mere pålidelige resultater end et enkelt tæt afsnit.
  • image: Valgfrit referencebillede til billede-til-video-generering. Referencen fungerer som første-frame-anker; modellen genererer bevægelse ud fra det startpunkt. Nyttigt til produktdemoer, karaktersammenhæng og alle scenarier, hvor emnets statiske udseende er ufravigeligt.
  • duration: Varighed i sekunder. Begrænset til de diskrete muligheder for den valgte model (4/8/12 for sora-2, 10/15/25 for sora-2-pro). Omkostning skalerer lineært med varighed.
  • size: Opløsning. 720x1280 (portræt) eller 1280x720 (landskab) på standardmodellen; tilføjer 1024x1792 / 1792x1024 på Pro. Billedformat er implicit i størrelsesvalget.

Bemærkelsesværdige fravær. Sora eksponerer i øjeblikket ikke seed-kontrol gennem den offentlige API (så reproducerbarhed på tværs af kørsler er ikke garanteret), og eksponerer heller ikke individuelle stilkontroller som Midjourney eller andre billedmodeller gør. Modellen er opinionated; prompt engineering er det primære håndtag, ikke parametertuning.

Et simpelt eksempel på en Sora 2-genereringsanmodning med OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Create the video generation jobjob = client.videos.create(model="sora-2",prompt=("Et vidvinkelshot af et snedækket bjerg ved solopgang. ""Kameraet panorerer langsomt mod venstre, mens det første lys rammer toppen. ""Filmisk, den gyldne time, belysning i 4K-kvalitet."),size="1280x720",duration=8,)# Poll for completionwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Generering mislykkedes: {job.error}")print(f"Aktuel status: {job.status}")time.sleep(10)print(f"Video klar: {video_url}")

Gennemregnede omkostningseksempler

Per-sekund-prisningen gør omkostninger forudsigelige, men først når du er klar på din workloads form. Tre repræsentative scenarier:

Scenarie 1: En kort produktdemo til en SaaS-landingpage

Et 5-sekunders klip, der viser produktets UI i aktion, genereret én gang og brugt som hero-video på marketingsitet. Du forventer at iterere 5–10 gange for at få et klip, du er tilfreds med, før publicering.

Omkostning på Sora 2 standard ved 720p: 5s × $0.10 = $0.50 pr. generering. Med 8 iterationer for at lande den endelige udgave: $4.00. Omkostning på Sora 2 Pro ved 1024p for den endelige publicerede version: 5s × $0.50 = $2.50 (enkelt take). Samlet projektomkostning: cirka $6.50 for iterationskørslerne plus HD-finalen.

Scenarie 2: En batch på 50 klip til en marketingkampagne

50 unikke 8-sekunders produktklip, hver baseret på en anden funktionsbeskrivelse, alle på Sora 2 standard ved 720p. Intet iterationsbudget; du accepterer første generering.

Omkostning: 50 × 8s × $0.10 = $40.00. Læg et 30% iterationsbudget oveni for de klip, der ikke lander første gang (50 × 0.30 = 15 retries × 8s × $0.10 = $12). I alt: cirka $52.00 for kampagnen.

Scenarie 3: En brugergenereret videofunktion i et forbrugerprodukt

Brugere i din app genererer 6-sekunders klip on demand på Sora 2 standard ved 720p. Gennemsnitligt forbrug: 1.000 klip pr. dag. Du opkræver brugerne $0.50 pr. generering og accepterer omkostningsdifferencen som enhedsmargin.

Omkostning pr. brugerklip: 6s × $0.10 = $0.60. Med brugerpris på $0.50 er workloaden tabsbringende på standardniveauet: hver generering koster $0.10 mere, end brugeren betaler. 720p-standardniveauet kræver en brugerpris på mindst $0.65 for at gå i nul før infrastruktur-overhead. Ved 30.000 klip pr. måned: månedlig Sora-regning på $18,000. Dette er den slags unit-economics-tjek, der er værd at lave, før man lancerer enhver brugerrettet videofunktion.

Konklusionen på tværs af de tre scenarier: videogenerering er reelt overkommelig for marketing- og one-off-indholds-workloads, hvor iterationsantallet er afgrænset, og cost-per-final-asset er det, der betyder noget. Det er mærkbart mere udfordrende for brugerrettede funktioner i skala, hvor cost-per-generation skal overstige den pris, brugeren betaler, plus produktets overhead. Vær eksplicit om, hvilken workload du priser, før du forpligter dig.

OpenAI direkte adgang versus aggregator-adgang

Med Sora tilgængelig gennem flere ruter er det praktiske spørgsmål for de fleste teams, hvilken man skal integrere mod. Det ærlige svar afhænger af resten af din stack.

Hvad er det samme

Outputkvalitet, genereringstid på modellaget, understøttede parametre og per-sekund-priser er typisk identiske uanset rute, da de fleste aggregatorer videresender OpenAI’s prissætning til paritet, og modellen er den samme model. Hvis du vælger rute udelukkende på outputkvalitet, er valget et vasket bræt.

Hvad er forskelligt

  • Faktureringsflade. Direkte OpenAI-adgang fakturerer via din OpenAI-konto; aggregatorer fakturerer gennem deres eget kredit- eller abonnementsystem. For teams, der allerede håndterer OpenAI-fakturering for tekstmodelbrug, tilføjer den direkte rute intet nyt. For teams, der kører multi-provider-workloads (LLM’er fra Anthropic, billedmodeller fra Black Forest Labs, video fra Sora), konsoliderer en aggregator alt det på én faktura.
  • Observabilitet. OpenAI’s dashboard viser Sora-brug på request-niveau rent. Aggregator-dashboards varierer i, hvor godt de håndterer videogenererings-workloads specifikt; nogle har specialbyggede video-observabilitetsvisninger; andre behandler video som et generisk API-kald. Værd at tjekke før commitment, hvis observabilitet er en prioritet.
  • Rate-limit-pooling. Ved direkte OpenAI er dine Sora-rate limits knyttet til din OpenAI-konto og -tier. Hos en aggregator er grænserne i nogle tilfælde pool’et på tværs af aggregatorens kundebase, eller tildelt pr. kunde i andre. For high-volume produktionsworkloads, spørg aggregatoren, hvordan de håndterer rate-limit-allokering, før du integrerer.
  • Geografi og compliance. Direkte OpenAI behandles gennem OpenAI’s infrastruktur med de dataresidensmuligheder, OpenAI stiller til rådighed. Nogle aggregatorer er baseret i jurisdiktioner, hvor dataresidensregler er anderledes; andre ruter anmodninger gennem OpenAI’s amerikanske infrastruktur uanset. For regulerede workloads er dette afgørende, og det er den slags, der er værd at få aggregatorens salgsteam til at bekræfte skriftligt.

Hvordan CometAPI passer ind

CometAPI eksponerer Sora 2 og Sora 2 Pro sammen med 500+ andre modeller bag ét OpenAI-kompatibelt endpoint, med én credential og samlet fakturering. Priserne på Sora via CometAPI følger OpenAI’s per-sekund-takster; den operationelle værdi er at konsolidere Sora-forbruget med resten af din modeltrafik på én faktura. For teams med en blandet workload (tekstmodeller fra flere udbydere, billedgenerering og Sora-video) er dette kerneargumentet. For teams, der kun bruger Sora og kun én eller to tekstmodeller, er den operationelle besparelse mindre, og direkte OpenAI-adgang er et forsvarligt valg.

Produktionshensyn

Et par mønstre, der er værd at få rigtigt, før Sora nærmer sig produktionstrafik:

  • Asynkron joblivscyklushåndtering. Behandl hver Sora-generering som et langkørende job, ikke en request. Persister job-ID’et med det samme ved oprettelse; overlev et servergenstart ved at kunne genoptage polling for igangværende jobs; håndter tilfælde, hvor jobbet fuldføres, mens din worker er offline. Dette er standard hygiejne i distribuerede systemer, men springes ofte over i første omgang, fordi Sora er den første asynkrone API, teamet har integreret.
  • Webhook som primær, polling som fallback. Hvis platformen understøtter webhooks for færdigmeldinger (OpenAI API gør), så brug dem. Webhooks fjerner behovet for polling og reducerer både dit rate-limit-pres og det spildte compute ved hyppige statuschecks. Polling er fallback’en for miljøer, der ikke kan eksponere et webhook-endpoint.
  • Fejltilstande, der koster penge. OpenAI fakturerer ikke for mislykkede genereringer, men delvise fuldførelser og retriede anmodninger, der lykkes i andet forsøg, påløber omkostninger. I produktion, log omkostningen for hvert retry og alarmer, hvis din retry-rate overstiger forventninger, da det typisk signalerer et indholdspolitik-problem med de prompts, du sender, hvilket er billigere at løse i promptlaget end at absorbere på regningen.
  • Indholdspolitik og produktionsimplementering. Sora er bundet af OpenAI’s brugspolitikker, som begrænser visse indholdskategorier. For produktionsimplementeringer (især brugerrettede, hvor prompten delvist er under brugerens kontrol), gennemgå OpenAI’s officielle indholdspolitik-dokumentation og design upstream-værn i overensstemmelse hermed. At linke til OpenAI’s politik er den korrekte reference; den dokumentation er sandhedskilden og ændres oftere, end denne artikel vil.

Hvad du skal bygge først

Den ærlige vurdering af, hvilke Sora-workloads der er klar til produktion i dag, hvilke der er på kanten, og hvilke der er for tidlige:

Klar til produktion i dag

Marketing- og kreativt indhold, hvor iteration er afgrænset, og cost-per-final-asset er den rigtige metrisk. Produktdemovideoer, kampagneindhold til sociale medier, hero-videoer til landingssider, internt træningsmateriale. Økonomien fungerer, fejltilstandene er velkendte, og latenshistorien (30–90 sekunder for korte klip) er acceptabel, når mennesket i loop’et er content-teamet frem for slutbrugeren.

På kanten

Brugerrettede videogenereringsfunktioner, hvor per-klip-omkostningen skal overstige den pris, brugeren betaler. Dette er muligt, men kræver omhyggelig unit-economics: begræns varigheden, brugerne kan anmode om, brug Sora 2 standard ved 720p som default, opkræv en pris, der har margin over per-klip-omkostningen. Bølgen af forbrugerapps til videogenerering i tidlig 2026 er overvejende i denne kategori, og dem med holdbar økonomi har alle været bevidste om at begrænse, hvad brugerne kan generere.

For tidligt

Langformsvideo i skala (alt over 25 sekunder, da det er Soras nuværende varighedsloft), high-volume realtids-scenarier hvor wall-clock-latens betyder mere end dollars, og applikationer, der forventer kontrol på frame-niveau eller seed-baseret reproducerbarhed. Dette er workloads at genbesøge, når Soras kapabiliteter udvides, ikke at tvinge ind i dag.

Den overordnede ramme: Sora 2 er reelt klar til produktion for indholds-workloads med et menneske i loop’et. Den er mulig for brugerrettede funktioner med bevidst unit-economics. Den er for tidlig til langformsvideo og til use cases, der kræver parametre, Sora endnu ikke eksponerer. Byg til det, der er klar i dag; følg dem, der endnu ikke er det.

Prøv det på din workload: Alle Sora 2- og Sora 2 Pro-varianter er tilgængelige på CometAPI sammen med de tekstmodeller, du måske allerede bruger. Gratis prøve-kreditten lader dig generere et par klip til standardpris uden andet setup end at pege din eksisterende OpenAI-kompatible klient mod CometAPI-endpointet.

Klar til at skære AI-udviklingsomkostninger med 20%?

Kom gratis i gang på få minutter. Gratis prøvekreditter inkluderet. Intet kreditkort påkrævet.

Læs mere