Les dernières mises à jour de Sora par OpenAI ont fait évoluer le produit d’un simple générateur vidéo original vers une plateforme plus sérieuse pour les créateurs et les développeurs. Les documents officiels les plus récents montrent trois grands changements : Sora 1 a été retiré aux États-Unis, Sora 2 est désormais l’expérience Sora par défaut dans ce pays, et l’API s’est enrichie avec des générations plus longues, des références de personnages réutilisables, des extensions vidéo et la prise en charge du traitement par lots.
Sora 2 peut actuellement générer des vidéos allant jusqu’à 20 secondes par clip dans l’API officielle d’OpenAI et dans Sora Video Editor. OpenAI prend également en charge des extensions vidéo allant jusqu’à 20 secondes chacune, avec un maximum de six extensions pour une durée totale assemblée pouvant atteindre 120 secondes. Pour l’API Sora 2, CometAPI prend en charge 20 s et la 2K.
Qu’est-ce que Sora 2 et pourquoi la durée est importante
Sora 2 est le modèle de deuxième génération d’OpenAI pour la génération vidéo + audio, et le moteur principal de l’application Sora et du compositeur web. Il a été annoncé publiquement comme le modèle phare de génération vidéo à la fin de 2025, avec des fonctionnalités spécifiques axées sur le réalisme physique, les dialogues et effets sonores synchronisés, ainsi qu’un contrôle accru des scènes. Le déploiement du modèle s’est accompagné de mises à jour de l’application (iOS → Android) et d’ajouts de fonctionnalités comme les storyboards pour aider à planifier des séquences à plusieurs plans.
Contrairement aux systèmes précédents, Sora 2 intègre :
- Un raisonnement spatial avancé (compréhension des environnements 3D)
- Une cohérence temporelle entre les images
- La continuité des personnages et des objets
- Un audio synchronisé (dialogues + effets sonores)
Cela permet de générer des séquences de qualité cinématographique plutôt que de simples clips animés.
Principales améliorations technologiques par rapport à Sora 1
| Fonctionnalité | Sora 1 | Sora 2 |
|---|---|---|
| Durée vidéo | ~6–10 secondes | Jusqu’à 25 secondes |
| Complexité scène | Limitée | Capable de gérer plusieurs scènes |
| Audio | Minimal | Audio synchronisé |
| Contrôle | Prompt basique | Storyboards, contrôle structuré |
Sora 2 représente un passage de la “génération de clips” à la “construction de scènes”, permettant une narration plus aboutie et des cas d’usage commerciaux plus pertinents comme la publicité, les démonstrations de produits et les courts métrages.
Limites exactes de durée des vidéos Sora 2 (Web vs API)
Quelle est la durée actuelle d’un clip Sora 2 unique ?
La réponse officielle actuelle est simple : 20 secondes par clip généré unique. Le guide de l’API d’OpenAI indique « Generate videos up to 20 seconds », et le centre d’aide Sora précise que Sora Video Editor peut générer des vidéos « up to 20 seconds long » tout en maintenant la qualité visuelle et le respect du prompt.
Quelle peut être la durée des vidéos Sora 2 sur le web ?
Les notes de version les plus récentes de Sora par OpenAI indiquent que tous les utilisateurs peuvent désormais générer des vidéos de 15 secondes sur l’application et le web, en plus du format par défaut de 10 secondes, tandis que les utilisateurs Pro peuvent générer des vidéos de 25 secondes sur le web avec storyboard. Les mêmes notes précisent aussi que les vidéos de 15 secondes comptent comme deux vidéos dans les limites quotidiennes, et que les vidéos de 25 secondes comptent comme quatre.
Il existe également une différence qualitative entre le compositeur standard et le mode storyboard. Les storyboards permettent aux utilisateurs d’esquisser une vidéo seconde par seconde, et les utilisateurs Pro peuvent créer des vidéos de 25 secondes sur le web avec storyboard. Les vidéos assemblées peuvent atteindre jusqu’à 60 secondes au total, ce qui signifie que des contenus plus longs sont possibles lorsqu’ils sont construits à partir de plusieurs clips plutôt qu’en une seule génération continue.
L’expérience web doit donc être comprise comme un système à plusieurs niveaux : des générations courtes par défaut pour une itération rapide, des clips plus longs pour des scènes plus ambitieuses, et le storyboard ou l’assemblage lorsqu’un projet a besoin d’une continuité narrative. En résumé de type newsroom, la mise à jour clé est qu’OpenAI a déjà dépassé l’ancien plafond de 10 secondes et permet désormais aux utilisateurs de travailler avec des clips sensiblement plus longs directement dans l’interface Sora.
La création vidéo dans l’application Sora utilise une limite glissante de 24 heures par compte, et non une réinitialisation à minuit ; chaque soumission est donc comptabilisée immédiatement et n’est retirée du calcul qu’une fois sortie de la fenêtre de 24 heures.
Quelle peut être la durée des vidéos Sora 2 via l’API ?
L’API est plus granulaire que l’application web. Depuis mars 2026, les valeurs seconds prises en charge sont 4, 8, 12, 16 et 20, avec 4 secondes par défaut. Le même guide précise que la dernière mise à jour a porté la durée maximale de 12 secondes à 20 secondes, ce qui représente une extension significative pour les développeurs qui construisent autour de la génération de formats courts.
Sora-2 et sora-2-pro prennent tous deux en charge les générations de 16 et 20 secondes, et l’API est asynchrone : une requête POST /v1/videos renvoie un objet job, et les développeurs peuvent interroger GET /videos/{video_id} ou utiliser des webhooks pour suivre l’exécution. Cela signifie que l’API est conçue pour des workflows de production structurés plutôt que pour une simple génération en un clic.
Il existe un second niveau de contrôle de durée via les extensions. Chaque extension peut ajouter jusqu’à 20 secondes, une seule vidéo peut être étendue jusqu’à six fois, et la durée totale peut atteindre 120 secondes. Les extensions préservent le mouvement, la direction de la caméra et la continuité de la scène, ce qui les rend utiles lorsqu’un clip doit devenir une séquence plus longue sans perdre sa logique visuelle d’origine.
L’API prend en charge les références de personnages réutilisables via POST /v1/videos/characters, le montage vidéo via POST /v1/videos/{video_id}/edits, et la génération via POST /v1/videos. En d’autres termes, l’API Sora actuelle n’est plus seulement « texte en entrée, vidéo en sortie » ; elle devient une chaîne de création compacte avec personnages, extensions, montages et jobs par lots.
Limites de durée de Sora 2 selon le mode
| Mode / fonctionnalité | Limite officielle de durée | Remarques |
|---|---|---|
| Génération Sora 2 de base | Jusqu’à 20 secondes | Limite actuelle officielle de l’API et de l’éditeur |
| Extensions vidéo | Jusqu’à 20 secondes par extension | Ajoute un nouveau segment en utilisant tout le clip source comme contexte |
| Durée totale vidéo assemblée | Jusqu’à 120 secondes | Maximum de six extensions |
| Niveau de résolution sora-2-pro | Sortie 1080p prise en charge | Disponible pour les exports 1920×1080 et 1080×1920 |
| Latence de rendu | Plus longue pour les clips plus longs et la 1080p | OpenAI indique que ces jobs peuvent prendre sensiblement plus de temps |
Pourquoi les durées diffèrent autant :
- Variante du modèle (
sora-2vssora-2-pro) — Pro offre une meilleure fidélité, mais est souvent plus lent et plus coûteux. - Résolution et nombre d’images — la 1080p prend plus de temps que la 720p/480p.
- Complexité de la scène — la physique, les personnages, la complexité du mouvement et la génération audio augmentent le calcul. Les benchmarks montrent que certaines classes de scènes (fortement basées sur la physique, animation de personnages) augmentent les temps de rendu.
- Charge serveur / concurrence — les temps de file d’attente augmentent pendant les pics d’utilisation ou si de nombreux jobs lourds sont soumis depuis votre compte/région.
Pourquoi Sora 2 limite les vidéos à ~20 secondes
1. Contraintes de calcul et évolution des coûts
La génération vidéo est exponentiellement plus coûteuse que la génération d’images.
- Un clip HD de 10 secondes peut coûter ~5 $ (niveau pro)
- Le coût évolue par seconde, et non par clip
- Des vidéos plus longues = plus de latence et une plus forte demande GPU
👉 C’est pourquoi :
- OpenAI limite les clips par défaut à 20 secondes
- Encourage des workflows de génération modulaires
2. Défis de cohérence temporelle
Maintenir le réalisme dans le temps est difficile :
- Dérive du mouvement
- Incohérence des personnages
- Dégradation de la physique
Les clips courts permettent :
- Une meilleure cohérence entre les images
- Un respect du prompt plus solide
- Une fidélité visuelle plus élevée
3. Latence et expérience utilisateur
Selon les indications de l’API :
- Les clips plus longs « take materially longer to complete »
Pour les applications réelles :
- Clips de 5–10 s → itération rapide
- Clips de 20 s → plans de qualité production
Comment créer des vidéos plus longues qu’une génération Sora 2 unique
- Utilisez le clip unique le plus long disponible, puis assemblez plusieurs clips. OpenAI indique que les générations vidéo Sora peuvent aller jusqu’à 20 secondes dans les documents de l’API/centre d’aide, et l’application Sora prend en charge des vidéos assemblées jusqu’à 60 secondes au total, en utilisant n’importe quelle combinaison de durées de clips.
- Construisez-la sous forme de storyboard plutôt que comme un seul long plan. Le mode Storyboard d’OpenAI permet d’esquisser une vidéo seconde par seconde, ce qui est la méthode la plus propre pour concevoir une séquence plus longue comme une chaîne de segments plus courts.
- Utilisez les outils de continuation intégrés sur un clip existant. Dans Sora, Re-cut ouvre une vidéo générée dans un nouveau storyboard pour pouvoir la couper ou l’étendre ; Remix crée une nouvelle version à partir d’une génération existante ; Blend effectue une transition entre deux vidéos ; et Loop crée une répétition fluide à partir d’une partie d’un clip. Ce sont les workflows natifs qu’OpenAI documente pour étendre un contenu au-delà d’une seule génération.
En pratique, l’approche la plus propre est : créer des scènes de 10 à 20 secondes, utiliser Storyboard/Re-cut pour les relier, puis assembler les clips finalisés dans une séquence plus longue.
Combien coûte la création de vidéos avec Sora 2 ?
Sora 2 Web :
La génération vidéo Sora 2 coûte 10 crédits pour une vidéo de 10 secondes, 20 crédits pour 15 secondes, et 30 crédits pour 25 secondes dans la génération web réservée aux utilisateurs Pro. Pour Sora 2 Pro, les vidéos en résolution standard coûtent 40 crédits pour 10 secondes, 80 crédits pour 15 secondes, et 120 crédits pour 25 secondes, tandis que les vidéos haute résolution coûtent 250 crédits pour 10 secondes et 500 crédits pour 15 secondes. OpenAI indique également que le nombre de crédits par vidéo varie selon la durée, la résolution et d’autres facteurs, et que les vidéos plus longues peuvent coûter plus de crédits par seconde car elles nécessitent davantage de calcul.
Côté API
OpenAI publie désormais une tarification à la seconde. Le tarif standard de sora-2 est de 0,10 $ par seconde en 720p, tandis que sora-2-pro coûte 0,30 $ par seconde en 720p, 0,50 $ par seconde en 1024p, et 0,70 $ par seconde en 1080p. La tarification Batch bénéficie d’une remise de moitié sur les mêmes niveaux.
CometAPI propose une remise de 20 % sur les API Sora 2 :
| Nom du modèle | Orientation | Résolution | Prix |
|---|---|---|---|
| sora-2-pro | Portrait | 720x1280 | $0.24 / sec |
| sora-2-pro | Paysage | 1280x720 | $0.24 / sec |
| sora-2-pro | Portrait (haute rés.) | 1024x1792 | $0.40 / sec |
| sora-2-pro | Paysage (haute rés.) | 1792x1024 | $0.40 / sec |
| sora-2 | Portrait | 720x1280 | $0.08 / sec |
| sora-2 | Paysage | 1280x720 | $0.08 / sec |
Estimation du coût de tâches réelles
Quand choisir sora-2 plutôt que sora-2-pro
- Utilisez
sora-2pour l’itération rapide, les prototypes, les clips sociaux où la vitesse et le coût sont importants. - Utilisez
sora-2-propour les exports de production, la sortie 1080p et une meilleure fidélité visuelle (mais attendez-vous à un coût plus élevé et à des temps de rendu plus longs).
Pro est le meilleur choix pour une sortie de qualité production, une stabilité soignée, des images cinématographiques haute résolution et des supports marketing, tandis que le modèle standard est l’option la moins chère pour une expérimentation plus rapide.
| Scénario | Modèle | Résolution | Secondes en sortie | Prix / sec | Temps de rendu estimé (calcul actif) | Attente moyenne en file (pic/hors pic) | Temps total estimé (file+rendu) | Coût |
|---|---|---|---|---|---|---|---|---|
| Extrait social | sora-2 | 720×1280 (720p) | 8 s | $0.10 | ~0.45–1.0 min (est.) | 0.5–2 min | ~1–3 min | $0.80 |
| Publicité courte | sora-2 | 1280×720 (720p) | 20 s | $0.10 | ~1.2 min (est.) | 1–3 min | ~2.2–4.2 min | $2.00 |
| Clip haute qualité | sora-2-pro | 1920×1080 (1080p) | 20 s | $0.30 | ~2.1 min (mesuré) | ~3.2 min (moy. mesurée) | ~5.3 min | $6.00. |
| Vidéo plus longue assemblée | sora-2-pro | 1080p | 60 s (3×20 s assemblés) | $0.30 | 3× rendu (approx.) ~6.3 min | attente totale (variable) ~~9+ min | ~15+ min | $18.00 |
| Narration étendue (max) | sora-2-pro | 1080p | 120 s (extensions) | $0.30 | ~12–15 min (calcul) est. | file × segments | ~20–40+ min | $36.00 |
Comment nous avons calculé ces estimations : le temps de rendu sora-2-pro de 20 s en 1080p provient de benchmarks indépendants : 2.1 minutes de rendu pour 20 s (Sima Labs).
Web vs API : différences d’usage pour la durée vidéo
Application Web Sora 2
Idéale pour :
- Les créateurs
- Le contenu pour les réseaux sociaux
- Le prototypage rapide
Workflow typique :
- Générer un clip de 10–20 s
- Assembler via l’outil storyboard
- Exporter la vidéo finale
📌 Limites :
- Workflow manuel
- Moins d’automatisation
API Sora 2
Idéale pour :
- Les développeurs
- Les studios
- Les startups
Workflow typique :
Prompt → Generate clip → Continue → Stitch → Export
📌 Avantages :
- Pipelines automatisés
- Traitement par lots
- Production évolutive
Comment utiliser l’API Sora 2 via CometAPI ?
Voici une manière pratique d’utiliser Sora 2 via CometAPI : inscrivez-vous sur CometAPI, créez un jeton API, envoyez une requête de génération vidéo au point de terminaison Sora 2 de CometAPI, puis interrogez le job jusqu’à sa fin. CometAPI fournit un accès REST de style OpenAI ; sa page Sora 2 nomme le modèle sora-2 / sora-2-hd/ sora-2-pro, utilise Bearer YOUR_CometAPI_API_KEY, et dirige les requêtes vidéo vers https://api.cometapi.com/v1/videos.
L’API Sora propre à OpenAI est asynchrone : créez un job vidéo avec POST /v1/videos, puis vérifiez l’avancement avec GET /v1/videos/{video_id}. OpenAI indique aussi que l’API Sora prend en charge la création de vidéos à partir de prompts, de références d’images, d’assets de personnages réutilisables, d’extensions, de montages, de téléchargements et de workflows Batch API.
pourquoi utiliser CometAPI ? L’utilisation de CometAPI dépend d’un accès plus simple, d’une agrégation ou d’une flexibilité supplémentaire. La raison principale d’utiliser CometAPI est qu’il peut unifier plusieurs modèles d’IA (comme Sora 2, des modèles de texte, etc.) dans une interface standardisée, permettant aux développeurs de basculer facilement entre différents modèles avec une seule intégration, en évitant l’enfermement propriétaire. En même temps, ses remises sur les appels API et son playground peuvent réduire considérablement les coûts de développement.
Conclusion
La réponse officielle actuelle est claire : un clip vidéo Sora 2 unique peut durer jusqu’à 20 secondes. Pour les projets plus longs, le workflow d’extension d’OpenAI permet jusqu’à 20 secondes par extension, jusqu’à six extensions, et jusqu’à 120 secondes au total.
Les développeurs peuvent accéder à Sora 2 et à Sora 2 Pro via CometAPI(CometAPI est une plateforme d’agrégation tout-en-un pour les API de grands modèles comme les API GPT, les API Nano Banana, etc.) dès maintenant. Avant d’y accéder, veuillez vous assurer que vous êtes connecté à CometAPI et que vous avez obtenu la clé API. CometAPI propose un prix bien inférieur au prix officiel pour vous aider dans l’intégration.
