Q

Wan2.7

Par Seconde:$0.08
Générez des vidéos à partir de textes et d’images. Créez et modifiez des images tout en garantissant la cohérence avec les références.
Nouveau
Usage commercial

Spécifications techniques de Wan 2.7

ÉlémentWan 2.7 (Video Suite)
FournisseurAlibaba Tongyi Lab
Famille de modèlesWan 2.7 Video Suite
ArchitectureMixture-of-Experts (MoE) à 27B paramètres
Types d'entréeTexte, images, vidéos, références audio
Types de sortieClips vidéo générés / édités avec audio optionnel
Modes pris en chargeTexte-vers-vidéo (T2V), Image-vers-vidéo (I2V), Référence-vers-vidéo (R2V), Montage vidéo
RésolutionSorties 720P et 1080P
Durée vidéo2–15 secondes
Prise en charge audioGénération audio native, références vocales, workflows de synchronisation labiale
Capacité de référenceRéférences multiples images/vidéos, cohérence d'identité
Cohérence des personnagesPrend en charge plusieurs sujets de référence selon le workflow
VersionSuccesseur majeur de Wan 2.6

Qu'est-ce que Wan 2.7 ?

Wan 2.7 est la suite phare de génération vidéo multimodale d'Alibaba, conçue pour des workflows de réalisation cinématographique IA contrôlables plutôt que pour une simple création de vidéo à partir de prompts. La famille de modèles combine génération, édition, continuation et cohérence pilotée par références en un seul système, permettant aux créateurs de produire de courts clips cinématographiques avec une meilleure préservation du sujet et un contrôle accru des scènes.

Contrairement aux générateurs vidéo antérieurs qui se concentraient surtout sur la qualité du prompt, Wan 2.7 met l'accent sur la contrôlabilité via l'ancrage d'images, les entrées de référence, la synchronisation audio et des workflows structurés multi-plans.

Principales fonctionnalités de Wan 2.7

  • Pipeline de planification Thinking Mode : Le modèle planifie la composition de scène et les mouvements avant le rendu, améliorant le respect du prompt et réduisant les défaillances de cohérence.
  • Contrôle de la première et de la dernière image : Les utilisateurs peuvent définir les images d'ouverture et de fin afin que le système interpole le mouvement entre elles.
  • Cohérence d'identité pilotée par références : Maintenez l'apparence des personnages, les vêtements, les objets et le style sur plusieurs plans.
  • Workflows multimodaux natifs : Prend en charge le texte, l'image, l'audio et les références vidéo dans un même workflow.
  • Génération audio intégrée : La musique de fond, les sons d'ambiance et la synchronisation vocale peuvent être générés parallèlement aux visuels.
  • Prise en charge du montage et de l'extension : Les vidéos existantes peuvent être prolongées, transformées ou re-stylisées sans repartir de zéro.

Performances de référence de Wan 2.7

La divulgation publique de benchmarks pour Wan 2.7 reste limitée par rapport aux LLM textuels, mais des évaluations tierces et des tests communautaires indiquent des améliorations notables de la stabilité des mouvements, du respect du prompt et de la contrôlabilité par rapport à Wan 2.6.

Les observations rapportées dans l'écosystème incluent :

  • Continuité des mouvements renforcée par rapport aux versions Wan précédentes.
  • Meilleurs classements dans des évaluations texte-vers-vidéo tierces.
  • Amélioration de la cohérence multi-sujets et de la préservation des références.
  • Meilleure intégration audio que de nombreux modèles vidéo ouverts antérieurs.

La transparence des benchmarks formels reste limitée ; les affirmations de performances doivent donc être interprétées avec prudence.

Wan 2.7 vs autres modèles vidéo

FonctionnalitéWan 2.7Veo 3.1Seedance 2.0
Workflows audio natifsForteForteModérée
Cohérence pilotée par référencesForteModéréeModérée
Contrôle première + dernière imageOuiPartielLimité
Workflows de montage vidéoOuiOuiLimité
Résolution maximale commune1080PSortie cinématographique plus haut de gamme1080P
Prise en charge multi-référencesAccent marquéModéréeModérée

Limitations de Wan 2.7

  • Durée des clips courte comparée aux outils de production long format.
  • La sortie maximale 1080P limite les workflows en très haute résolution.
  • Les scènes à mouvements rapides peuvent encore produire des artefacts d'instabilité.
  • Les workflows multi-références augmentent la complexité et les exigences d'ingénierie de prompts.
  • La publication de benchmarks publics demeure relativement clairsemée.

Cas d'usage représentatifs

  1. Courts-métrages et storyboards avec cohérence des personnages.
  2. Clips marketing avec synchronisation audio.
  3. Génération de vidéos pour les réseaux sociaux.
  4. Visualisation de produits et bandes-annonces conceptuelles.
  5. Workflows de continuation vidéo et d'interpolation de scènes.
  6. Animation d'avatars et de personnages basée sur des références.

Comment utiliser l'API vidéo WAN 2.7 dans CometAPI

Étape 1 : Essayez l'API vidéo WAN 2.7 dans le Kie Al Playground

Commencez par tester les fonctionnalités de WAN 2.7 à l'aide de l'API vidéo WAN 2.7 dans le CometAPI Playground. Téléchargez des images, ajoutez des prompts ou utilisez des références pour prévisualiser la vidéo WAN générée avant d'intégrer la vidéo IA WAN 2.7 à votre flux de production.

Étape 2 : Obtenez la clé API WAN 2.7 et consultez la documentation de l'API

Obtenez la clé API WAN 2.7 depuis la console CometAPI et consultez la documentation. Comprenez les endpoints de l'API vidéo WAN 2.7, l'authentification et les paramètres permettant de prendre en charge les workflows texte-vers-vidéo, image-vers-vidéo et workflows vidéo WAN.

Étape 3 : Générez des vidéos IA WAN 2.7 et intégrez-les à votre workflow

Utilisez l'API vidéo WAN 2.7 pour générer des vidéos IA WAN 2.7 à partir de prompts, d'images ou de références. Intégrez les sorties WAN 2.7 dans des workflows produit, des pipelines de contenu ou des outils vidéo IA afin de permettre une création vidéo à l'échelle.

FAQ