Sora API-tilgang i 2026: priser, ratebegrensninger og hva som faktisk er tilgjengelig via aggregatorer

CometAPI
AnnaMay 21, 2026
Sora API-tilgang i 2026: priser, ratebegrensninger og hva som faktisk er tilgjengelig via aggregatorer

Sora 2 er den første generelt tilgjengelige tekst-til-video-modellen fra OpenAI, tilgjengelig programmatisk både via den offisielle OpenAI API-en og via et voksende sett med aggregator-ruter. Prismodellen er uvanlig sammenlignet med tekstmodeller (fakturering skjer per sekund generert video i stedet for per token), og de praktiske spørsmålene utviklere stiller før integrasjon er annerledes enn for en LLM-API. Hva koster egentlig et klipp? Hvor lang tid tar generering? Hva er rate limits? Hva endrer seg når du får tilgang til Sora via en aggregator i stedet for direkte via OpenAI?

Denne artikkelen er referansen vi skulle ønske fantes da vi begynte å avgrense våre egne videogenreringsfunksjoner. Teksten er strukturert for utvikleren som er forbi «er Sora interessant?» og nå må svare på «hva vil det koste, hva krever det å integrere, og hva må jeg vite før jeg forplikter meg?»

Hurtiglesing: Sora 2 (standardmodellen) koster $0.10 per sekund generert video i 720p. Sora 2 Pro koster $0.30 per sekund i 720p eller $0.50 per sekund i 1024p. Et typisk 10-sekunders klipp koster $1.00 på standardmodellen og $5.00 på Pro i HD. Genereringstiden er asynkron; forvent 30–90 sekunder reell tid for et klipp på 5–10 sekunder. Tilgang krever en betalt OpenAI-konto på minst brukstrinn 2.

Status for Sora API-tilgang i 2026

Sora 2 ble lansert i OpenAI API den 7. oktober 2025, og tilgang har vært kontinuerlig tilgjengelig siden. Modellidentifikatoren er sora-2 (med en gjeldende snapshot-ID sora-2-2025-12-08), og varianten med høyere kvalitet er sora-2-pro. Begge støtter tekst-til-video og bilde-til-video-generering, med synkronisert lydutgang. Per 10. januar 2026 ble gratis tilgang for forbrukere via ChatGPT-produktet avviklet, noe som har konsentrert utviklerbruk av Sora til enten betalte ChatGPT-abonnementer eller direkte API-tilgang.

Det finnes tre veier for å bruke Sora programmatisk:

  • OpenAI direkte API. Den kanoniske ruten. Fakturering per sekund, kun betalt, krever minimum $10 påfyll for å nå brukstrinn 2 som låser opp tilgang til Sora-modellene. Både SDK og REST API støttes.
  • Azure OpenAI. Microsofts bedriftsrute, som speiler OpenAIs offisielle priser med tillegg av Azure-abonnements-overhead og enterprise compliance-funksjoner. Samme pris per sekund; en annen operasjonell flate.
  • Aggregatorer. Tjenester som eksponerer Sora bak sin egen enhetlige API. De fleste aggregatorer viderefører OpenAIs pris per sekund til paritet; verdien er operasjonell (én legitimasjon, én faktura, samme SDK som for trafikken din for tekstmodeller). Noen aggregatorer tilbyr egne tariffstrukturer, som vi diskuterer senere i artikkelen.

Sora 2-prising per sekund video

Sora-prisingen er strukturert etter modellnivå og utdataoppløsning, med en pris per sekund som multipliseres med klipplengden for å gi genereringskostnaden. Verifisert fra OpenAIs offisielle prisside per mai 2026:

ModellOppløsningStøttede varigheterPris per sekund10-sekunders klipp
Sora 2 (standard)720p4s, 8s, 12s$0.10$1.00
Sora 2 Pro720p10s, 15s, 25s$0.30$3.00
Sora 2 Pro1024p (1792×1024)10s, 15s, 25s$0.50$5.00

Merknader om prisstrukturen. Prisingen er basert på utdata, ikke inndata; det finnes ingen token-basert inndatafakturering for Sora slik det gjør for tekstmodeller. Bildekondisjonering (å sende inn et referansebilde for å forankre genereringen) endrer ikke prisen per sekund. Varighetsalternativene for hvert modellnivå er faste: du kan ikke be om et 7-sekunders klipp på standardmodellen, kun 4, 8 eller 12 sekunder.

To praktiske implikasjoner er verdt å være eksplisitt om. For det første: prismodellen ligner mer på en videorenderingsregning enn på en LLM-regning. Kostnaden drives av utdata-varighet, ikke av hvor kompleks prompten er eller hvor mange tokens den inneholder. For det andre: kostnadsforskjellen mellom Sora 2 og Sora 2 Pro i HD er 5× per sekund: et 10-sekunders klipp koster $1.00 på standard og $5.00 på Pro i 1024p. Å velge riktig nivå for oppgaven er den største kostnadsspaken du har, og det er verdt å være bevisst på hvilke arbeidsmengder som faktisk trenger Pro sin høyere kvalitet.

Rate limits og kvoter

Sora sine rate limits er organisert rundt OpenAIs standard brukstrinnsystem. De viktigste detaljene for Sora spesielt:

  • Minimumskrav til trinn: Trinn 2, oppnådd ved å fylle på minst $10 i API-kreditt. Trinn 1 (standard for nye kontoer) inkluderer ikke tilgang til Sora-modellene.
  • Grenser for samtidige genereringer: I henhold til OpenAIs rate-limit-dokumentasjon er samtidig videogenerering begrenset av trinn, typisk et lite antall aktive genereringer på lavere trinn, som skalerer med brukstrinn. Den eksakte grensen settes per konto og er synlig i OpenAI-dashbordet. For arbeidsmengder med høyt volum bør du planlegge for tilgang på trinn 3 eller trinn 4 fra dag én.
  • Kvoteforspørsler: Høyere samtidighetsgrenser utover standardtakene kan forespørres via OpenAIs skjema for økning av rate limits. Godkjenning er arbeidsmengdespesifikk og ikke umiddelbar; for produksjonslanseringer med forutsigbare etterspørselstopper bør du be om økning flere uker før lansering.

Verdt å vite: rate limits for Sora er pooled annerledes enn rate limits for tekstmodeller på samme konto. Et team som kjører tung Sora-trafikk påvirker ikke det tilgjengelige rate-budsjettet deres for GPT-5.5-kall. Omvendt spiser ikke stor GPT-5.5-trafikk av Sora-budsjettet. Planlegg de to som separate kapasitetsproblemstillinger.

Genereringstid: hva du faktisk kan forvente

Sora er asynkron av design. Du sender inn en genereringsforespørsel, får tilbake en jobb-ID, og poller (eller får webhook) for fullføring. Reell tid mellom forespørsel og fullføring avhenger av varighet og oppløsning på utdata, aktuell last på OpenAI-infrastrukturen, og om jobben står i kø bak andre jobber på kontoen din.

Realistiske forventninger basert på observert atferd:

UtdataTypisk reell tidNotater
Sora 2 standard, 4s @ 720p20–45 sekunderRaskeste løype; bra for iterasjon
Sora 2 standard, 8s @ 720p40–90 sekunderVanligste produksjonsvarighet
Sora 2 standard, 12s @ 720p60–120 sekunderLangform sosialt innhold
Sora 2 Pro, 10s @ 720p60–150 sekunderPremium kvalitet; ~3× kostnaden til standard
Sora 2 Pro, 15s @ 1024p120–240 sekunderFull HD, lengre kø observert ved peak
Sora 2 Pro, 25s @ 1024p200–360 sekunderMaks varighet; pris skalerer lineært

To operasjonelle konsekvenser:

  • Latensbudsjetter i brukerflater må revurderes. Hvis produktet ditt forventer at videogenerering føles responsivt på en brukerhandling, betyr 30–90 sekunder for korte klipp at du trenger en UX som håndterer ventetiden: fremdriftsindikatorer, parallelt arbeid brukeren kan gjøre mens videoen genereres, eller forhåndsgenerering for forutsigbare scenarioer. Å behandle Sora som et synkront API-kall er den vanligste arkitekturfeilen team gjør.
  • Polling versus webhooks betyr noe. Naiv polling (en tett loop som treffer status-endepunktet) sløser både med rate-limit-budsjettet ditt og modellens compute. Bruk eksponentiell backoff med jitter, eller sett opp webhook-callbacks hvis miljøet ditt støtter det. Et pollingmønster som fungerer godt i produksjon er å polle med 10-sekunders intervaller det første minuttet, deretter 30-sekunders intervaller etter det, med en hard timeout ved modellens forventede øvre grense for den forespurte varigheten.

Støttede parametere og prompt-struktur

Sora sin API-flate er med vilje enkel sammenlignet med bildegenereringsmodeller som DALL-E 3. Det er færre knotter å skru på, men de som finnes betyr noe. De viktigste parameterne:

  • model: sora-2 eller sora-2-pro. Valget styrer både prising og tilgjengelige varighets-/oppløsningsalternativer som vist i pristabellen over.
  • prompt: Friformtekst som beskriver scenen. Sora håndterer filmatisk regi (kameravinkler, bevegelse, lyssetting), karakterhandlinger og miljødetaljer. Modellen er sensitiv for prompt-struktur: å starte med sceneetablering, deretter handlingen, og deretter teknisk regi, gir mer pålitelige resultater enn ett tett avsnitt.
  • image: Valgfritt referansebilde for bilde-til-video-generering. Referansen fungerer som forankring for første bilde; modellen genererer bevegelse utover fra startpunktet. Nyttig for produktdemoer, karakterkontinuitet og alle scenarioer der subjektets statiske utseende er ikke-forhandlingsbart.
  • duration: Varighet i sekunder. Begrenset til de diskrete alternativene for valgt modell (4/8/12 for sora-2, 10/15/25 for sora-2-pro). Kostnaden skalerer lineært med varighet.
  • size: Oppløsning. 720x1280 (portrett) eller 1280x720 (landskap) på standardmodellen; legger til 1024x1792 / 1792x1024 på Pro. Sideforhold er implisitt i size-valget.

Merkbare fravær. Sora eksponerer per nå ikke seed-kontroll via den offentlige API-en (så reproducerbarhet på tvers av kjøringer er ikke garantert), og den eksponerer ikke individuelle stilkontroller slik Midjourney eller andre bildegenereringsmodeller gjør. Modellen er «opinionated»; prompt engineering er den primære spaken, ikke parameter-tuning.

Et enkelt eksempel på en Sora 2-genereringsforespørsel ved bruk av OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Create the video generation jobjob = client.videos.create(model="sora-2",prompt=("A wide-angle shot of a snow-capped mountain at sunrise. ""The camera slowly tracks left as the first light hits the peak. ""Cinematic, golden hour, 4K-quality lighting."),size="1280x720",duration=8,)# Poll for completionwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Generation failed: {job.error}")print(f"Current status: {job.status}")time.sleep(10)print(f"Video ready: {video_url}")

Gjennomarbeidede kostnadseksempler

Prising per sekund gjør kostnader forutsigbare, men først når du er tydelig på formen på arbeidsmengden din. Tre representative scenarioer:

Scenario 1: En kort produktdemo for en SaaS-landingsside

Et 5-sekunders klipp som viser produktets UI i bruk, generert én gang og brukt som hero-video på markedsføringssiden. Du forventer å iterere 5–10 ganger for å få et klipp du er fornøyd med før publisering.

Kostnad på Sora 2 standard i 720p: 5s × $0.10 = $0.50 per generering. Med 8 iterasjoner for å lande sluttklippet: $4.00. Kostnad på Sora 2 Pro i 1024p for den endelige publiserte versjonen: 5s × $0.50 = $2.50 (ett take). Total prosjektkostnad: omtrent $6.50 for iterasjonskjøringene pluss HD-sluttversjonen.

Scenario 2: En batch på 50 klipp for en markedsføringskampanje

50 unike 8-sekunders produktklipp, hver basert på en ulik feature-beskrivelse, alle på Sora 2 standard i 720p. Ingen iterasjonsbudsjett; du aksepterer første generering.

Kostnad: 50 × 8s × $0.10 = $40.00. Legg til et iterasjonsbudsjett på 30% for klippene som ikke sitter første gang (50 × 0.30 = 15 retries × 8s × $0.10 = $12). Totalt: omtrent $52.00 for kampanjen.

Scenario 3: En brukergenerert videofunksjon i et forbrukerprodukt

Brukere i appen din genererer 6-sekunders klipp on-demand, på Sora 2 standard i 720p. Gjennomsnittlig bruk: 1 000 klipp per dag. Du tar betalt $0.50 per generering og aksepterer kostnadsdifferansen som enhetsmargin.

Kostnad per brukerklipp: 6s × $0.10 = $0.60. Med brukerprising på $0.50 er arbeidsmengden tapsbringende på standardnivå: hver generering koster $0.10 mer enn brukeren betaler. 720p standardnivå krever en brukerpris på minst $0.65 for å gå i null før infrastruktur-overhead. Ved 30 000 klipp per måned: månedlig Sora-regning på $18 000. Dette er typen enhetsøkonomisjekk det er verdt å gjøre før du lanserer noen brukerrettet videofunksjon.

Takeaway på tvers av de tre scenarioene: videogenerering er genuint rimelig for markedsføring og engangs-innholdsarbeidsmengder, der iterasjonsantallet er begrenset og kost-per-ferdig-asset er det som betyr noe. Det er betydelig mer utfordrende for brukerrettede funksjoner i skala, der kost-per-generering må overstige brukerbetalt pris pluss produkt-overhead. Vær eksplisitt på hvilken arbeidsmengde du priser før du forplikter deg.

Direkte OpenAI-tilgang versus aggregator-tilgang

Med Sora tilgjengelig via flere ruter er det praktiske spørsmålet for de fleste team hvilken man bør integrere mot. Det ærlige svaret avhenger av resten av stacken din.

Hva som er likt

Utdatokvalitet, genereringstid i modell-laget, støttede parametere og pris per sekund er typisk identisk uavhengig av rute, siden de fleste aggregatorer viderefører OpenAIs prising til paritet, og modellen i seg selv er den samme. Hvis du velger rute kun basert på utdatokvalitet, er valget et nullsumspill.

Hva som er annerledes

  • Faktureringsflate. Direkte OpenAI-tilgang faktureres via OpenAI-kontoen din; aggregatorer fakturerer via sitt eget kreditt- eller abonnementssystem. For team som allerede håndterer OpenAI-fakturering for bruk av tekstmodeller, tilfører den direkte ruten ikke noe nytt. For team som kjører multi-leverandør-arbeidsmengder (LLM-er fra Anthropic, bildegenereringsmodeller fra Black Forest Labs, video fra Sora), konsoliderer en aggregator alt dette på én faktura.
  • Observability. OpenAIs dashbord viser request-nivå Sora-bruk ryddig. Aggregator-dashbord varierer i hvor godt de håndterer videogenereringsarbeidsmengder spesifikt; noen har formålsbygget video-observability; andre behandler video som et generisk API-kall. Verdt å sjekke før du forplikter deg hvis observability er en prioritet.
  • Rate-limit pooling. På direkte OpenAI er Sora-rate limits knyttet til OpenAI-kontoen og trinnet ditt. Hos en aggregator er grensene i noen tilfeller pooled på tvers av aggregatorens kundebase, eller i andre tilfeller tildelt per kunde. For produksjonsarbeidsmengder med høyt volum: spør aggregatoren hvordan de håndterer allokering av rate limits før du integrerer.
  • Geografisk og compliance-postur. Direkte OpenAI prosesseres gjennom OpenAIs infrastruktur med de data residency-alternativene OpenAI tilbyr. Noen aggregatorer er basert i jurisdiksjoner der data residency-regler er annerledes; andre ruter forespørsler gjennom OpenAIs USA-infrastruktur uansett. For regulerte arbeidsmengder er dette avgjørende, og det er typen ting det er verdt å be aggregatorens salgsteam om å bekrefte skriftlig.

Hvordan CometAPI passer inn

CometAPI eksponerer Sora 2 og Sora 2 Pro sammen med 500+ andre modeller bak ett OpenAI-kompatibelt endepunkt, med én legitimasjon og enhetlig fakturering. Prisene for Sora via CometAPI følger OpenAIs priser per sekund; den operasjonelle verdien er å konsolidere Sora-bruk med resten av modelltrafikken din på én faktura. For team som kjører en blandet arbeidsmengde (tekstmodeller fra flere leverandører, bildegenerering og Sora-video), er dette hovedargumentet. For team som kun bruker Sora og bare én eller to tekstmodeller, er den operasjonelle besparelsen mindre, og direkte OpenAI-tilgang er et forsvarlig valg.

Produksjonshensyn

Noen mønstre det er verdt å få riktig før Sora nærmer seg produksjonstrafikk:

  • Håndtering av asynkron jobblivssyklus. Behandle hver Sora-generering som en langvarig jobb, ikke en request. Persist job-ID-en umiddelbart ved opprettelse; overlev en server-restart ved å kunne gjenoppta polling for pågående jobber; håndter tilfeller der jobben fullfører mens workeren din er offline. Dette er standard hygiene i distribuerte systemer, men blir ofte hoppet over i starten fordi Sora er den første asynkrone API-en teamet har integrert.
  • Webhook fallback. Hvis plattformen støtter webhooks for fullføringshendelser (OpenAI API gjør det), bruk dem. Webhooks fjerner behovet for polling og reduserer både rate-limit-press og bortkastet compute fra hyppige status-sjekker. Polling er fallbacken for miljøer som ikke kan eksponere et webhook-endepunkt.
  • Feilmodi som koster penger. OpenAI fakturerer ikke for mislykkede genereringer, men delvise fullføringer og retriede forespørsler som lykkes på andre forsøk påløper kostnad. I produksjon: logg kostnaden for hver retry og alarmer hvis retry-raten overstiger forventningene, siden det vanligvis er et signal om et innholdspolicy-problem med promptene du sender, som er billigere å fikse på prompt-laget enn å absorbere på regningen.
  • Innholdspolicy og produksjonsutrulling. Sora er avgrenset av OpenAIs brukspolicyer, som begrenser visse innholdskategorier. For produksjonsutrullinger (særlig brukerrettede der prompten delvis er under brukerkontroll), gjennomgå OpenAIs offisielle policy-dokumentasjon og design upstream guardrails deretter. Å lenke til OpenAIs policy er riktig referanse; den dokumentasjonen er «source of truth» og endrer seg oftere enn denne artikkelen vil.

Hva du bør bygge først

En ærlig vurdering av hvilke Sora-arbeidsmengder som er klare for produksjon i dag, hvilke som er på grensen, og hvilke som er premature:

Produksjonsklart i dag

Markedsførings- og kreativt innhold der iterasjon er begrenset og kost-per-ferdig-asset er riktig mål. Produktdemo-videoer, innhold for sosiale medier-kampanjer, hero-videoer for landingssider, internt opplæringsmateriale. Økonomien fungerer, feilmodiene er velkjente, og latenshistorien (30–90 sekunder for korte klipp) er akseptabel når det er et innholdsteam (menneske i loopen) snarere enn en sluttbruker.

På grensen

Brukerrettede videogenereringsfunksjoner der kost-per-klipp må overstige brukerbetalt pris. Dette er gjennomførbart, men krever nøye enhetsøkonomi: begrens varigheten brukere kan be om, bruk Sora 2 standard i 720p som default, ta betalt en pris som har margin over kost-per-klipp. Bølgen tidlig i 2026 av forbruker-videoapper ligger stort sett i denne kategorien, og de som har bærekraftig økonomi har alle vært bevisste på å begrense hva brukere kan generere.

Prematurt

Langform video i skala (alt over 25 sekunder, siden det er Sora sin nåværende varighetsgrense), høyvolum sanntidsscenarioer der reell tid-latens betyr mer enn dollar, og applikasjoner som forventer frame-nivå kontroll eller seed-basert reproducerbarhet. Dette er arbeidsmengder å revurdere når Soras kapabilitetsflate utvides, ikke å tvinge inn i dag.

Innrammingen: Sora 2 er genuint produksjonsklar for innholdsarbeidsmengder med et menneske i loopen. Den er gjennomførbar for brukerrettede funksjoner med bevisst enhetsøkonomi. Den er prematur for langform video og for use cases som krever parametere Sora ennå ikke eksponerer. Bygg for det som er klart i dag; følg med på det som ikke er det ennå.

Teste det på din arbeidsmengde: Alle Sora 2- og Sora 2 Pro-varianter er tilgjengelige på CometAPI sammen med tekstmodellene du kanskje allerede bruker. Gratis prøve-kreditt lar deg generere en håndfull klipp til standard prising uten oppsett utover å peke din eksisterende OpenAI-kompatible klient mot CometAPI-endepunktet.

Klar til å redusere AI-utviklingskostnadene med 20 %?

Kom i gang gratis på minutter. Gratis prøvekreditter inkludert. Ingen kredittkort nødvendig.

Les mer