Wat is het contentmoderatiesysteem van Sora 2?

In het snel evoluerende landschap van kunstmatige intelligentie (AI) is Sora 2 van OpenAI uitgegroeid tot een baanbrekende tool voor videogeneratie. Dit geavanceerde model, uitgebracht op 30 september 2025, bouwt voort op zijn voorganger en belooft fysiek nauwkeurigere, realistischere en beter controleerbare video-uitvoer. Nu gaan we de regels voor contentmoderatie van Sora 2 leren kennen, die van groot belang zijn voor ons succespercentage en onze trial-and-error-ratio bij het genereren van video's.

KomeetAPI integreert momenteel Sora-2-pro, die video's tot 25 seconden lang kan genereren. Normaal gesproken is Sora 2 Pro alleen beschikbaar voor gebruikers met een maandelijks ChatGPT Pro-abonnement ($200), maar met CometAPI kun je het gebruiken zonder die dure abonnementskosten te betalen.

Wat is Sora 2 en wat zijn de functies ervan?

Sora 2 blinkt in essentie uit in het genereren van high-fidelity video's die nauwgezet de aanwijzingen van de gebruiker volgen. Belangrijke functies zijn onder andere verbeterde fysieke simulaties, zoals realistische vloeistofdynamica, objectinteracties en omgevingseffecten. Gebruikers kunnen het model bijvoorbeeld aanzetten tot het creëren van scènes met complexe bewegingen, zoals golven die op een kust beuken of objecten die met levensechte kracht stuiteren. Deze beheersbaarheid strekt zich uit tot het bewerken van bestaande video's, het remixen van content en het met toestemming opnemen van gelijkenissen van gebruikers.

Vanaf november 2025 is de app beschikbaar in regio's als de VS, Canada, Japan en Korea, met plannen voor verdere wereldwijde uitrol.

Belangrijkste verboden:

Seksueel expliciete inhoud en minderjarigen:Pornografie en alle seksuele content met minderjarigen is ten strengste verboden. Seksuele content met instemmende volwassenen is streng gereguleerd en wordt in bepaalde weergavecontexten vaak geblokkeerd.
Ongeautoriseerd gebruik van gelijkenissen van echte personen: Het genereren van fotorealistische video's waarin een echte persoon dingen doet of zegt die hij/zij niet heeft gedaan, is verboden, tenzij de persoon toestemming heeft gegeven of wordt vertegenwoordigd door een toegestaan beleid voor publieke figuren en aan alle vereiste verificaties/controles is voldaan. Cameo-workflows bevatten functies voor toestemming en identiteitsverificatie in de Sora-app.
Auteursrechtelijk beschermde personages en werken zonder toestemming:Uitvoeren die beschermde tekens reproduceren of duidelijk auteursrechtelijk beschermde kunststijlen imiteren, zijn niet toegestaan of zijn onderhevig aan opt-outprocessen. Dit is een twistpunt geworden in Japan en Hollywood.
Onrechtmatige inhoud en instructies voor wangedrag: Video's die strafbare feiten (explosieve bouw, gewelddadige overtredingen) aanprijzen of demonstreren, worden geblokkeerd.
Haat, intimidatie en gewelddadig extremisme:Inhoud die geweld of haatdragende ideologieën aanmoedigt, wordt gefilterd.
Medische, juridische en financiële misinformatie met hoge inzetten: Content die schade kan veroorzaken door het geven van onjuiste, levensbelangrijke adviezen, wordt ook beperkt door beleids- en systeemwaarschuwingen.

Omdat Sora 2 multimodaal is, geldt het beleid niet alleen voor tekstprompts, maar ook voor audio- en visuele uitvoer. Een prompt kan er bijvoorbeeld in tekst onschuldig uitzien, maar een reeks frames produceren die in strijd is met het beeldbeleid. Ook op deze latere overtredingen kan actie worden ondernomen.

Welke beheersmaatregelen worden gebruikt bij kwesties met een hoog risico?

Welke programmatische en productmaatregelen worden toegepast?

OpenAI past zowel technische als productcontroles toe om risicocategorieën aan te pakken. De belangrijkste gerapporteerde en gedocumenteerde maatregelen zijn:

Technische controles

Multimodale classificatoren Getraind op basis van tekst, beeldkaders en audio om geweld, seksuele content, haatdragende symbolen/taal, instructies voor zelfbeschadiging en verboden imitaties te identificeren. Deze classificaties werken in de invoer-, tussen- en uitvoerfase.
Toestemmings-/opt-insystemen voor cameo's: het genereren of invoegen van de gelijkenis van een echt persoon in een clip kan een expliciete toestemming vereisen (een geauthenticeerde cameo-stroom) om imitatie zonder wederzijdse toestemming te beperken.
Herkomst en metadata (C2PA): in Sora 2 gegenereerde assets worden voorzien van herkomstmetadata, zodat kijkers en platforms gesynthetiseerde media en de herkomst ervan kunnen identificeren.

Product- en moderatiecontroles

Pre-launch- en in-feedfilters: inhoud die door classificatoren is gemarkeerd, kan worden geblokkeerd voor weergave in de sociale feed, gedegradeerd of ter beoordeling door een mens worden verzonden.
Watermerken en downloadbeperkingen:OpenAI voegt C2PA-metadata en zichtbare markeringen toe om hergebruik zonder context te beperken en detectie door derden te vergemakkelijken.
Juridische en beleidsmatige witte/zwarte lijsten: blokkeringen voor bekende figuren, beperkingen op auteursrechtelijk beschermde personages en bescherming van leeftijd/toestemming. OpenAI accepteerde input van industriële partners en talentenbureaus om deze beperkingen te verfijnen na problematische eerste resultaten.

Menselijke beoordeling en escalatie

Menselijke moderators en oproepkanalen worden gebruikt wanneer classificaties onzeker zijn of wanneer gerapporteerde items een genuanceerd oordeel vereisen (bijvoorbeeld satire versus kwaadaardige imitatie). Menselijke beoordeling is trager, maar wordt gebruikt voor beslissingen met grote impact.

Wat is de drielaagse moderatiearchitectuur?

De moderatiearchitectuur van Sora 2 kan worden gezien als drie complementaire lagen die op verschillende punten in het creatieproces actief zijn: controles die worden uitgevoerd op het moment dat het materiaal wordt aangemaakt, controles die worden uitgevoerd tijdens het genereren van het materiaal en controles die worden uitgevoerd op frames/transcripten tijdens of na de output.

Laag 1: Snelle en metadatafiltering (vóór generatie)

Voordat een model wordt gegenereerd, controleert de app de tekstprompt, geüploade referenties en geselecteerde presets op rode vlaggen: expliciete seksuele content, grafisch geweld, haatdragende content, verzoeken om zonder toestemming de gelijkenis van een levende persoon te genereren, of oproepen om bekende, auteursrechtelijk beschermde personages te reproduceren. Deze controle vóór indiening is bedoeld om niet-toegestane content zo snel mogelijk te blokkeren.

Laag 2: Generatietijdbeperkingen en modelsturing

Tijdens de generatie sturen de interne mechanismen van Sora 2 de uitvoer weg van niet-toegestane content – door tokens te onderdrukken, anders te samplen of stijlbeperkingen toe te passen die de kans op realistische gelijkenissen of expliciet materiaal verkleinen. Deze laag is een beleidshandhaving op modelniveau die is ingebed in de manier waarop het systeem de uitvoer weegt en selecteert. De modelkaart en systeemrichtlijnen van OpenAI geven aan dat veiligheidstechniek op modelniveau essentieel is voor het ontwerp van Sora 2.

Laag 3: Analyse na generatie, watermerken en platformcontroles

Nadat een clip is gerenderd, scannen geautomatiseerde detectoren de geproduceerde video op niet-toegestane elementen (gelijkenissen van beroemdheden, auteursrechtelijk beschermde personages, naaktheid, enz.). Het platform past ook zichtbare watermerken toe op gegenereerde video's en maakt gebruik van controles op accountniveau, zoals identiteitsverificatie, opt-in/opt-out-markeringen voor publieke figuren en moderatiewachtrijen om content te verwijderen of te markeren. Deze maatregelen maken verwijdering mogelijk, ondersteunen bezwaren en helpen bij het traceren van de herkomst.

Hoe deze lagen met elkaar interacteren

De drie lagen vullen elkaar aan: pre-filtering vermindert het aantal problematische taken; sturing op modelniveau vermindert de kans dat een grensvraag een afgekeurd resultaat oplevert; en post-analyse vangt alles op wat erdoorheen glipt en koppelt de content terug aan een account voor handhaving en mogelijke menselijke beoordeling. Deze meerlaagse aanpak is gebruikelijk in moderne generatieve systemen, omdat geen enkel mechanisme op zichzelf betrouwbaar genoeg is.

Wat is de technologie achter ‘ongecensureerde’ AI-content?

Hoe zien kwaadaardige of ongecensureerde resultaten er in de praktijk uit?

Wanneer mensen het over "ongecensureerde" AI-content hebben, bedoelen ze meestal output die geproduceerd is door modellen of toolchains die geen robuuste moderatie hebben op een of meer lagen – of output die geproduceerd is door opzettelijke pogingen om die lagen te omzeilen. Technisch gezien zijn er een paar redenen waarom problematische content verschijnt:

Modelcapaciteiten + zwakke randvoorwaarden. Geavanceerde generatieve architecturen (transformatorgebaseerde multimodale modellen, diffusie voor frames, neurale audiosynthese voor spraak) kunnen zeer realistische content produceren; als moderatieclassificaties ontbreken, verkeerd geconfigureerd zijn of niet multimodaal zijn, produceert het model de content die het moet creëren. De complexiteit van Sora 2 (videoframes + gesynchroniseerde audio + tekst) verhoogt de detectiemoeilijkheid.
Lacunes in training of classificaties. Geen enkele classifier is perfect. Classifiers die afzonderlijk zijn getraind op tekst, afbeeldingen of audio, slagen er mogelijk niet in om signalen over verschillende modaliteiten te correleren (bijv. onschadelijke frames + schadelijke audio). Tussenliggende of opkomende eigenschappen tijdens de generatie kunnen ook nieuwe faalmodi opleveren die niet in de trainingsdata van de classifier voorkomen.
Productoppervlak en viraliteit van de inhoud. Zelfs kleine moderatiefouten kunnen worden versterkt door sociale feeds, waardoor een klein aantal schadelijke clips viraal kan gaan voordat menselijke moderators actie kunnen ondernemen. De berichtgeving na de lancering toonde virale voorbeelden die direct tot kritische beschouwing leidden.

Welke technologie wordt gebruikt voor opwekking (hoog niveau)?

Multimodale transformatorruggengraat of hybride architecturen die videoframes conditioneren op basis van tekstprompts (en optioneel beeldreferenties), vaak gecombineerd met diffusie-processen of autoregressieve framesynthese voor coherente beweging.
Neurale audiosynthese en spraakmodellen om gesynchroniseerde dialogen en soundscapes te produceren. Sora 2 benadrukt native audiosynchronisatie als onderscheidend kenmerk.

Deze technologieën zijn neutrale hulpmiddelen: hun maatschappelijk effect hangt af van de bestuurslaag die eromheen is opgebouwd.

Slotsamenvatting

Sora 2 vertegenwoordigt een wezenlijke vooruitgang in multimodale generatieve AI – het produceren van gesynchroniseerde audio en hifi-video op basis van tekstprompts – en OpenAI heeft hierop gereageerd met een meerlaagse veiligheidsstack: controles vóór de generatie, monitoring tijdens de generatie en controles na de generatie (inclusief herkomstmetadata en productbeperkingen). Desalniettemin lieten vroege ervaringen na de lancering daadwerkelijke schadelijke effecten zien (gewelddadige en racistische clips die in feeds verschenen) die de aandacht van de pers en de eisen van belanghebbenden trokken, wat de aanhoudende uitdagingen van het op grote schaal implementeren van uiterst capabele multimediamodellen onderstreepte.

Nieuwsgierigheid kan mensen ertoe aanzetten het potentieel van Sora 2 te verkennen en te proberen de barrières te omzeilen (Ik kan succesvolle prompts geven), maar een zekere basislijn en ethiek moeten ook in het creatieve proces behouden blijven.

Beginnen

CometAPI is een uniform API-platform dat meer dan 500 AI-modellen van toonaangevende aanbieders – zoals de GPT-serie van OpenAI, Gemini van Google, Claude, Midjourney en Suno van Anthropic – samenvoegt in één, gebruiksvriendelijke interface voor ontwikkelaars. Door consistente authenticatie, aanvraagopmaak en responsverwerking te bieden, vereenvoudigt CometAPI de integratie van AI-mogelijkheden in uw applicaties aanzienlijk. Of u nu chatbots, beeldgenerators, muziekcomponisten of datagestuurde analysepipelines bouwt, met CometAPI kunt u sneller itereren, kosten beheersen en leveranciersonafhankelijk blijven – en tegelijkertijd profiteren van de nieuwste doorbraken in het AI-ecosysteem.

Ontwikkelaars hebben toegang tot Sora-2-pro API en Sora 2 API via CometAPI, de nieuwste modelversie wordt altijd bijgewerkt met de officiële website. Om te beginnen, verken de mogelijkheden van het model in de Speeltuin en raadpleeg de API-gids voor gedetailleerde instructies. Zorg ervoor dat u bent ingelogd op CometAPI en de API-sleutel hebt verkregen voordat u toegang krijgt. KomeetAPI bieden een prijs die veel lager is dan de officiële prijs om u te helpen integreren.

Klaar om te gaan?→ Meld u vandaag nog aan voor CometAPI !

Als u meer tips, handleidingen en nieuws over AI wilt weten, volg ons dan op VK, X en Discord!