Toegang tot de Sora-API in 2026: tarieven, verzoeklimieten en wat er via aggregatoren daadwerkelijk beschikbaar is

CometAPI
AnnaMay 21, 2026
Toegang tot de Sora-API in 2026: tarieven, verzoeklimieten en wat er via aggregatoren daadwerkelijk beschikbaar is

Sora 2 is het eerste algemeen beschikbare tekst-naar-video-model van OpenAI, programmeerbaar toegankelijk via zowel de officiële OpenAI‑API als een groeiend aantal aggregator‑routes. Het prijsmodel wijkt af van tekstmodellen (afrekening per seconde gegenereerde video in plaats van per token), en de praktische vragen die ontwikkelaars vóór integratie stellen, verschillen van die voor een LLM‑API. Wat kost een clip nu echt? Hoe lang duurt de generatie? Wat zijn de rate limits? Wat verandert er als je Sora via een aggregator benadert in plaats van rechtstreeks via OpenAI?

Dit artikel is de referentie waarvan we wilden dat die bestond toen we onze eigen videogeneratiefuncties gingen afbakenen. Het stuk is gestructureerd voor de ontwikkelaar die voorbij “is Sora interessant?” is en nu moet beantwoorden: “wat gaat het kosten, wat kost integratie, en wat moet ik weten voordat ik me vastleg?”

Snel overzicht: Sora 2 (het standaardmodel) kost $0.10 per seconde gegenereerde video op 720p. Sora 2 Pro kost $0.30 per seconde op 720p of $0.50 per seconde op 1024p. Een typische clip van 10 seconden kost $1.00 op het standaardmodel en $5.00 op Pro in HD. Generatie is asynchroon; reken op 30–90 seconden wandkloktijd voor een clip van 5–10 seconden. Toegang vereist een betaald OpenAI‑account met minimaal tier 2.

De stand van zaken rond Sora‑API‑toegang in 2026

Sora 2 lanceerde in de OpenAI‑API op 7 oktober 2025 en de toegang is sindsdien continu beschikbaar. De modelidentifier is sora-2 (met een huidige snapshot‑ID sora-2-2025-12-08), en de variant met hogere fideliteit is sora-2-pro. Beide ondersteunen tekst‑naar‑video en beeld‑naar‑video, met gesynchroniseerde audio‑uitvoer. Per 10 januari 2026 is toegang voor consumenten op de gratis laag via het ChatGPT‑product beëindigd, wat ontwikkelaarsgebruik van Sora heeft geconcentreerd op betaalde ChatGPT‑abonnementen of directe API‑toegang.

Er zijn drie routes om Sora programmeerbaar te gebruiken:

  • OpenAI directe API. De canonieke route. Afrekening per seconde, alleen betaald, vereist een minimale top‑up van $10 om tier 2 te bereiken, wat Sora‑toegang ontgrendelt. Zowel SDK als REST‑API worden ondersteund.
  • Azure OpenAI. Microsofts enterprise‑route, met tarieven die de officiële OpenAI‑tarieven spiegelen, met toevoeging van Azure‑abonnementsoverhead en enterprise‑compliance. Zelfde prijs per seconde; ander operationeel oppervlak.
  • Aggregatoren. Services die Sora achter hun eigen uniforme API aanbieden. De meeste aggregatoren rekenen de OpenAI‑prijs per seconde één op één door; de waarde is operationeel (één credential, één factuur, dezelfde SDK als voor je tekstmodelverkeer). Sommige aggregatoren bieden eigen tariefstructuren; die bespreken we later in het artikel.

Sora 2‑prijzen per seconde video

Sora‑prijzen zijn gestructureerd per modelniveau en outputresolutie, met een prijs per seconde die wordt vermenigvuldigd met de cliplengte voor de generatiekosten. Gecontroleerd op OpenAI’s officiële prijspagina per mei 2026:

ModelResolutieOndersteunde lengtesPrijs per secondeClip van 10 seconden
Sora 2 (standaard)720p4s, 8s, 12s$0.10$1.00
Sora 2 Pro720p10s, 15s, 25s$0.30$3.00
Sora 2 Pro1024p (1792×1024)10s, 15s, 25s$0.50$5.00

Opmerkingen bij de prijsstructuur. De prijs is op basis van de output, niet de input; er is geen tokengebaseerde invoerafrekening voor Sora zoals bij tekstmodellen. Beeldconditionering (een referentieafbeelding meegeven om de generatie te verankeren) wijzigt de prijs per seconde niet. De duurkeuzes per modelniveau zijn vast: je kunt op het standaardmodel geen clip van 7 seconden aanvragen, alleen 4, 8 of 12 seconden.

Twee praktische implicaties om expliciet te maken. Ten eerste: het prijsmodel lijkt meer op een videorendering‑rekening dan op een LLM‑rekening. Kosten worden bepaald door de outputduur, niet door hoe complex je prompt is of hoeveel tokens die bevat. Ten tweede: het kostenverschil tussen Sora 2 en Sora 2 Pro op HD is 5x per seconde: een clip van 10 seconden kost $1.00 op standaard en $5.00 op Pro op 1024p. De juiste tier kiezen voor de taak is de grootste kostenhefboom die je hebt, en het is de moeite waard om bewust te zijn over welke workloads Pro’s hogere fideliteit echt nodig hebben.

Rate limits en quota

Sora‑ratelimieten zijn georganiseerd rond OpenAI’s standaard tiersysteem. De relevante details specifiek voor Sora:

  • Minimale tier‑vereiste: Tier 2, bereikt door ten minste $10 aan API‑tegoed op te waarderen. Tier 1 (standaard voor nieuwe accounts) omvat geen Sora‑toegang.
  • Gelijktijdige generatielimieten: Volgens OpenAI’s rate‑limitdocumentatie is gelijktijdige videoproductie beperkt per tier, doorgaans een klein aantal lopende generaties op lagere tiers, oplopend met het tier. Het exacte plafond wordt per account ingesteld en is zichtbaar in het OpenAI‑dashboard. Voor workloads met hoog volume, plan vanaf dag één op tier‑3 of tier‑4.
  • Quotumverzoeken: Hogere gelijktijdigheidslimieten boven de standaard tier‑plafonds kunnen worden aangevraagd via het OpenAI‑formulier voor verhoging van ratelimieten. Goedkeuring is workloadspecifiek en niet direct; vraag bij productlanceringen met voorspelbare pieken enkele weken vooraf de verhoging aan.

Goed om te weten: ratelimieten op Sora worden anders gepoold dan de ratelimieten voor tekstmodellen op hetzelfde account. Een team met zwaar Sora‑verkeer beïnvloedt niet het beschikbare rate‑budget voor GPT‑5.5‑aanroepen. Omgekeerd vreet veel GPT‑5.5‑verkeer niet in het Sora‑budget. Plan die twee als aparte capaciteitsvragen.

Generatietijd: wat je werkelijk kunt verwachten

Sora is asynchroon van opzet. Je dient een generatieverzoek in, krijgt een job‑ID terug en pollt (of ontvangt een webhook) voor voltooiing. De wandkloktijd tussen verzoek en voltooiing hangt af van de duur en resolutie van de output, de huidige belasting op de OpenAI‑infrastructuur en of de job in de wachtrij staat achter andere jobs op jouw account.

Realistische verwachtingen op basis van geobserveerd gedrag:

OutputTypische doorlooptijdNotities
Sora 2 standaard, 4s @ 720p20–45 secondenSnelste pad; goed voor iteratie
Sora 2 standaard, 8s @ 720p40–90 secondenMeest voorkomende productieduur
Sora 2 standaard, 12s @ 720p60–120 secondenLangere socialcontent
Sora 2 Pro, 10s @ 720p60–150 secondenPremiumkwaliteit; ~3x kosten t.o.v. standaard
Sora 2 Pro, 15s @ 1024p120–240 secondenFull HD, langere wachtrijen op piekmomenten
Sora 2 Pro, 25s @ 1024p200–360 secondenMaximale duur; prijs schaalt lineair

Twee operationele consequenties:

  • Gebruikersgerichte latentiebudgetten moeten herzien worden. Als je product verwacht dat videogeneratie responsief aanvoelt op een gebruikersactie, betekent het bereik van 30–90 seconden voor korte clips dat je een UX nodig hebt die de wachttijd opvangt: voortgangsindicatoren, parallelle taken die de gebruiker kan doen tijdens de generatie, of pregeneratie voor voorspelbare scenario’s. Sora behandelen als een synchrone API‑aanroep is de meest voorkomende architectuurfout die teams maken.
  • Polling versus webhooks is van belang. Naïef pollen (een strakke lus die de status‑endpoint blijft aanroepen) verspilt zowel je ratelimit‑budget als de compute van het model. Gebruik exponentiële backoff met jitter, of zet webhook‑callbacks op als je omgeving die ondersteunt. Het pollingpatroon dat in productie goed werkt: poll om de 10 seconden in de eerste minuut, daarna om de 30 seconden, met een harde timeout op de verwachte bovengrens van het model voor de aangevraagde duur.

Ondersteunde parameters en promptstructuur

Het API‑oppervlak van Sora is bewust eenvoudiger dan dat van beeldgeneratiemodellen zoals DALL‑E 3. Er zijn minder knoppen om aan te draaien, maar de knoppen die er zijn, doen ertoe. De relevante parameters:

  • model: sora-2 of sora-2-pro. De keuze bepaalt zowel de prijs als de beschikbare duur/resolutie, zoals in de prijstabel hierboven.
  • prompt: Vrije‑tekstbeschrijving van de scène. Sora verwerkt filmische regie (camera‑hoeken, beweging, belichting), handelingen van personages en omgevingsdetails. Het model is gevoelig voor promptstructuur: beginnen met de scènezetting, dan de actie, dan de technische regie levert betrouwbaardere resultaten op dan één dense alinea.
  • image: Optionele referentieafbeelding voor beeld‑naar‑video. De referentie fungeert als anker voor het eerste frame; het model genereert beweging vanaf dat startpunt. Nuttig voor productdemo’s, karaktercontinuïteit en elk scenario waar het statische uiterlijk van het onderwerp niet onderhandelbaar is.
  • duration: Duur in seconden. Beperkt tot de discrete opties voor het gekozen model (4/8/12 voor sora-2, 10/15/25 voor sora-2-pro). Kosten schalen lineair met de duur.
  • size: Resolutie. 720x1280 (staand) of 1280x720 (liggend) op het standaardmodel; voegt 1024x1792 / 1792x1024 toe op Pro. De beeldverhouding is impliciet in de groottekeuze.

Opvallende afwezigen. Sora biedt momenteel geen seed‑controle via de publieke API (dus reproduceerbaarheid over runs heen is niet gegarandeerd), en het biedt geen afzonderlijke stijlregelaars zoals Midjourney of andere beeldmodellen. Het model is opinionated; prompt‑engineering is de primaire hefboom, niet het tunen van parameters.

Een eenvoudig voorbeeld van een Sora 2‑generatieverzoek met de OpenAI Python SDK:

from openai import OpenAIimport timeclient = OpenAI(api_key="YOUR_API_KEY")# Maak de videogeneratiejob aanjob = client.videos.create(model="sora-2",prompt=("Een groothoekopname van een met sneeuw bedekte berg bij zonsopgang. ""De camera beweegt langzaam naar links terwijl het eerste licht de top raakt. ""Cinematisch, golden hour, belichting van 4K-kwaliteit."),size="1280x720",duration=8,)# Pollen tot voltooiingwhile True:job = client.videos.retrieve(job.id)if job.status == "completed":video_url = job.output[0].urlbreakelif job.status == "failed":raise RuntimeError(f"Generatie mislukt: {job.error}")print(f"Huidige status: {job.status}")time.sleep(10)print(f"Video klaar: {video_url}")

Uitgewerkte kostenvoorbeelden

De prijs per seconde maakt kosten voorspelbaar, maar pas als je duidelijk hebt hoe je workload eruitziet. Drie representatieve scenario’s:

Scenario 1: Een korte productdemo voor een SaaS‑landingspagina

Een clip van 5 seconden die de product‑UI in actie laat zien, één keer gegenereerd en gebruikt als hero‑video op de marketingwebsite. Je verwacht 5–10 iteraties voordat je een clip hebt waar je blij mee bent.

Kosten op Sora 2 standaard op 720p: 5s × $0.10 = $0.50 per generatie. Met 8 iteraties om de definitieve versie te halen: $4.00. Kosten op Sora 2 Pro op 1024p voor de uiteindelijke gepubliceerde versie: 5s × $0.50 = $2.50 (één take). Totale projectkosten: ongeveer $6.50 voor de iteratieruns plus de HD‑eindversie.

Scenario 2: Een batch van 50 clips voor een marketingcampagne

50 unieke productclips van 8 seconden, elk gebaseerd op een andere featurebeschrijving, allemaal op Sora 2 standaard op 720p. Geen iteratiebudget; je accepteert de eerste generatie.

Kosten: 50 × 8s × $0.10 = $40.00. Voeg een iteratiebudget van 30% toe voor de clips die niet in één keer goed zijn (50 × 0.30 = 15 retries × 8s × $0.10 = $12). Totaal: circa $52.00 voor de campagne.

Scenario 3: Een door gebruikers aangestuurde videofunctie in een consumentenproduct

Gebruikers in je app genereren clips van 6 seconden on demand, op Sora 2 standaard op 720p. Gemiddeld gebruik: 1.000 clips per dag. Je rekent gebruikers $0.50 per generatie en accepteert het kostverschil als unitmarge.

Kost per gebruikersclip: 6s × $0.10 = $0.60. Met een gebruikersprijs van $0.50 is de workload verlieslatend op het standaardniveau: elke generatie kost $0.10 meer dan de gebruiker betaalt. De 720p‑standaardtier vereist een gebruikersprijs van minstens $0.65 om break‑even te draaien vóór infrastructuuroverhead. Bij 30.000 clips per maand: maandelijkse Sora‑rekening van $18,000. Dit is het soort unit‑economics‑check dat de moeite waard is vóór je een gebruikersgerichte videofunctie lanceert.

De kernboodschap over de drie scenario’s: videogeneratie is echt betaalbaar voor marketing‑ en eenmalige contentworkloads, waar het aantal iteraties begrensd is en de kosten per definitief asset leidend zijn. Het is beduidend uitdagender voor gebruikersgerichte features op schaal, waar de kosten per generatie boven de door de gebruiker betaalde prijs plus productoverhead moeten liggen. Wees expliciet over welke workload je prijst voordat je je vastlegt.

Rechtstreekse toegang tot OpenAI versus toegang via een aggregator

Met Sora beschikbaar via meerdere routes is de praktische vraag voor de meeste teams welke route ze moeten integreren. Het eerlijke antwoord hangt af van de rest van je stack.

Wat is gelijk

Outputkwaliteit, generatietijd op modellayer, ondersteunde parameters en prijs per seconde zijn doorgaans identiek ongeacht de route, aangezien de meeste aggregatoren OpenAI’s prijzen één op één doorrekenen, en het model hetzelfde model is. Als je puur op outputkwaliteit kiest, is de keuze om het even.

Wat is anders

  • Factureringswijze. Rechtstreeks via OpenAI factureer je via je OpenAI‑account; aggregatoren factureren via hun eigen krediet‑ of abonnementsysteem. Voor teams die OpenAI‑facturatie al beheren voor tekstmodelgebruik voegt de directe route niets nieuws toe. Voor teams met multi‑provider workloads (LLM’s van Anthropic, beeldmodellen van Black Forest Labs, video van Sora) consolideert een aggregator dat alles op één factuur.
  • Observability. Het OpenAI‑dashboard toont Sora‑gebruik per verzoek duidelijk. Aggregator‑dashboards variëren in hoe goed ze specifiek videogeneratie‑workloads ondersteunen; sommige hebben doelgerichte video‑observability; andere behandelen video als een generieke API‑aanroep. Het is de moeite waard dit te checken vóór je je vastlegt als observability prioriteit heeft.
  • Pooling van rate limits. Bij directe OpenAI‑toegang zijn je Sora‑ratelimieten gekoppeld aan je OpenAI‑account en tier. Bij een aggregator worden limieten in sommige gevallen gepoold over de klantenbasis van de aggregator, of per klant toegewezen in andere gevallen. Vraag voor productie‑workloads met hoog volume aan de aggregator hoe zij ratelimit‑allocatie afhandelen vóór integratie.
  • Geografische en compliance‑aspecten. Direct via OpenAI wordt verwerkt op OpenAI’s infrastructuur met de opties voor data‑residentie die OpenAI biedt. Sommige aggregatoren zijn gevestigd in jurisdicties met andere data‑residentieregels; andere routeren verzoeken toch via OpenAI’s Amerikaanse infrastructuur. Voor gereguleerde workloads is dit doorslaggevend, en dit is iets wat je bij voorkeur zwart‑op‑wit van het salesteam van de aggregator krijgt.

Hoe CometAPI hierin past

CometAPI biedt Sora 2 en Sora 2 Pro naast 500+ andere modellen achter één OpenAI‑compatibel endpoint, met één credential en uniforme facturatie. De prijs van Sora via CometAPI volgt de OpenAI‑prijs per seconde; de operationele waarde is het consolideren van Sora‑gebruik met de rest van je modelverkeer op één factuur. Voor teams met een gemengde workload (tekstmodellen van meerdere providers, beeldgeneratie en Sora‑video) is dit het kernargument. Voor teams die alleen Sora en één of twee tekstmodellen gebruiken, is de operationele besparing kleiner en is directe OpenAI‑toegang een verdedigbare keuze.

Overwegingen voor productie

Een paar patronen die je goed wilt neerzetten vóór Sora productie‑verkeer ziet:

  • Afhandeling van de asynchrone joblevenscyclus. Behandel elke Sora‑generatie als een langlopende job, niet als een verzoek. Persisteer de job‑ID direct bij creatie; overleef een serverrestart door polling te kunnen hervatten voor lopende jobs; handel het geval af waarin de job voltooit terwijl je worker offline is. Dit is standaard distributed‑systems‑hygiëne maar wordt vaak initieel overgeslagen omdat Sora de eerste async‑API is die het team integreert.
  • Webhook‑fallback. Als het platform webhooks ondersteunt voor voltooiingsgebeurtenissen (de OpenAI‑API doet dat), gebruik die. Webhooks verwijderen de noodzaak voor polling en verminderen zowel je ratelimit‑druk als de verspilde compute van frequente statuschecks. Polling is de fallback voor omgevingen die geen webhook‑endpoint kunnen aanbieden.
  • Storingsmodi die geld kosten. OpenAI factureert niet voor mislukte generaties, maar gedeeltelijke voltooien en opnieuw uitgevoerde verzoeken die bij de tweede poging slagen, brengen wel kosten met zich mee. Log in productie de kosten van elke retry en alarmeer als je retry‑ratio de verwachtingen overschrijdt, want dat is meestal een signaal van een contentbeleid‑issue in de prompts die je verstuurt, wat goedkoper is om op het prompt‑niveau te fixen dan het in de rekening te absorberen.
  • Contentbeleid en productie‑uitrol. Sora valt onder OpenAI’s gebruiksbeleid, dat bepaalde inhoudscategorieën beperkt. Review voor productie‑uitrol (zeker gebruikersgericht waar de prompt deels onder gebruikerscontrole staat) OpenAI’s officiële contentbeleid en ontwerp upstream‑guardrails overeenkomstig. Linken naar OpenAI’s beleid is de juiste referentie; die documentatie is de bron van waarheid en verandert vaker dan dit artikel.

Wat je het eerst moet bouwen

De eerlijke inschatting van welke Sora‑workloads vandaag productierijp zijn, welke op het randje zitten en welke prematuur zijn:

Vandaag productierijp

Marketing‑ en creatieve contentworkloads waar het aantal iteraties begrensd is en de kosten per definitief asset de juiste metriek zijn. Productdemovideo’s, socialmediacampagne‑content, hero‑video’s voor landingspagina’s, intern trainingsmateriaal. De economie klopt, de storingsmodi zijn goed begrepen en het latentieverhaal (30–90 seconden voor korte clips) is acceptabel wanneer de mens in de lus het contentteam is in plaats van de eindgebruiker.

Op het randje

Gebruikersgerichte videogeneratiefuncties waar de kosten per clip boven de door de gebruiker betaalde prijs moeten liggen. Dit is werkbaar maar vereist zorgvuldige unit‑economics: beperk de duur die gebruikers kunnen aanvragen, gebruik Sora 2 standaard op 720p als default, reken een prijs die marge heeft boven de kosten per clip. De vroege‑2026‑golf van consumententoepassingen voor videogeneratie valt grotendeels in deze categorie, en de apps met houdbare economie zijn allemaal doelbewust geweest in het beperken van wat gebruikers kunnen genereren.

Prematuur

Langere video op schaal (alles boven 25 seconden, aangezien dat Sora’s huidige duurplafond is), realtime scenario’s met hoog volume waar wandkloktijd zwaarder weegt dan dollars, en toepassingen die frame‑niveauregeling of seed‑gebaseerde reproduceerbaarheid verwachten. Dit zijn workloads om opnieuw te bekijken wanneer Sora’s capaciteitsoppervlak uitbreidt, niet om vandaag in te persen.

De duiding: Sora 2 is echt productierijp voor contentworkloads met een mens in de lus. Het is werkbaar voor gebruikersgerichte features met doordachte unit‑economics. Het is prematuur voor lange video en voor use‑cases die parameters vereisen die Sora nog niet blootlegt. Bouw voor wat vandaag klaar is; volg de zaken die dat nog niet zijn.

Uitproberen op je eigen workload: Alle Sora 2‑ en Sora 2 Pro‑varianten zijn beschikbaar op CometAPI naast de tekstmodellen die je mogelijk al gebruikt. Het gratis proeftegoed laat je een handvol clips genereren tegen standaardprijzen zonder meer setup dan je bestaande OpenAI‑compatibele client naar het CometAPI‑endpoint wijzen.

Klaar om de AI-ontwikkelingskosten met 20% te verlagen?

Start gratis in enkele minuten. Gratis proeftegoeden inbegrepen. Geen creditcard vereist.

Lees Meer