Claude Fable 5 is now on CometAPI — state-of-the-art performance in coding, agents, and scientific research. Try it now
Q

Wan2.7

Por Segundo:$0.08
Wan2.7 es un modelo de generación de video diseñado para la síntesis visual de alta calidad y una consistencia del movimiento mejorada. Es adecuado para la creación de contenido cinematográfico y flujos de trabajo profesionales de producción de video.
Nuevo
Uso comercial

Especificaciones técnicas de Wan 2.7

ElementoWan 2.7 (Video Suite)
ProveedorAlibaba Tongyi Lab
Familia de modelosWan 2.7 Video Suite
ArquitecturaMezcla de expertos (MoE) de 27B parámetros
Tipos de entradaTexto, imágenes, videos, referencias de audio
Tipos de salidaClips de video generados / editados con audio opcional
Modos compatiblesTexto a video (T2V), Imagen a video (I2V), Referencia a video (R2V), Edición de video
ResoluciónSalidas 720P y 1080P
Duración del video2–15 segundos
Compatibilidad de audioGeneración de audio nativa, referencias de voz, flujos de sincronización labial
Capacidad de referenciasImágenes/videos de múltiples referencias, consistencia de identidad
Consistencia de personajesAdmite múltiples sujetos de referencia según el flujo de trabajo
Generación de versiónSucesor principal de Wan 2.6

¿Qué es Wan 2.7?

Wan 2.7 es la suite insignia de generación de video multimodal de Alibaba, diseñada para flujos de trabajo de creación cinematográfica de IA controlables en lugar de una simple creación de video a partir de prompts. La familia de modelos combina generación, edición, continuación y consistencia impulsada por referencias en un solo sistema, lo que permite a los creadores construir clips cinematográficos cortos con una mayor preservación del sujeto y control de escena.

A diferencia de generadores de video anteriores que se centraban principalmente en la calidad del prompt, Wan 2.7 enfatiza la capacidad de control mediante anclaje de fotogramas, entradas de referencia, sincronización de audio y flujos de trabajo estructurados de múltiples tomas.

Principales características de Wan 2.7

  • Pipeline de planificación Thinking Mode: El modelo planifica la composición de la escena y el movimiento antes del renderizado, mejorando la adherencia al prompt y reduciendo fallas de coherencia.
  • Control del primer y último fotograma: Los usuarios pueden definir los fotogramas de apertura y cierre para que el sistema interpole el movimiento entre ellos.
  • Consistencia de identidad impulsada por referencias: Mantiene la apariencia del personaje, vestimenta, objetos y estilo a lo largo de múltiples tomas.
  • Flujos de trabajo multimodales nativos: Admite texto, imagen, audio y referencias de video dentro del mismo flujo.
  • Generación de audio integrada: Puede generar música de fondo, sonidos ambientales y sincronización de voz junto con lo visual.
  • Compatibilidad con edición y continuación: Los videos existentes pueden extenderse, transformarse o reestilizarse sin reconstruir desde cero.

Rendimiento en benchmarks de Wan 2.7

La divulgación pública de benchmarks para Wan 2.7 sigue siendo limitada en comparación con los LLM de texto, pero evaluaciones de terceros y pruebas de la comunidad indican mejoras notables en estabilidad del movimiento, adherencia al prompt y controlabilidad frente a Wan 2.6.

Las observaciones reportadas por el ecosistema incluyen:

  • Mayor continuidad del movimiento en comparación con versiones anteriores de Wan.
  • Mejor posición en rankings de evaluaciones de texto a video de terceros.
  • Mejora en la consistencia con múltiples sujetos y preservación de referencias.
  • Mejor integración de audio que muchos modelos de video abiertos anteriores.

La transparencia formal de benchmarks sigue siendo limitada, por lo que las afirmaciones de rendimiento deben interpretarse con cautela.

Wan 2.7 vs otros modelos de video

CaracterísticaWan 2.7Veo 3.1Seedance 2.0
Flujos de audio nativosFuerteFuerteModerada
Consistencia impulsada por referenciasFuerteModeradaModerada
Control de primer + último fotogramaParcialLimitado
Flujos de edición de videoLimitado
Resolución máxima común1080PSalida cinematográfica de gama alta1080P
Compatibilidad con múltiples referenciasFuerte énfasisModeradaModerada

Limitaciones de Wan 2.7

  • Duración de clip corta en comparación con herramientas de producción de formato largo.
  • La salida máxima de 1080P limita los flujos de trabajo de ultra alta resolución.
  • Las escenas con movimiento rápido aún pueden producir artefactos de inestabilidad.
  • Los flujos con múltiples referencias incrementan la complejidad y los requisitos de ingeniería de prompts.
  • La información pública de benchmarks sigue siendo relativamente escasa.

Casos de uso representativos

  1. Cortometrajes y storyboards con consistencia de personajes.
  2. Clips de marketing con sincronización de audio.
  3. Generación de videos para redes sociales.
  4. Visualización de productos y tráilers conceptuales.
  5. Flujos de continuación de video e interpolación de escenas.
  6. Animación de avatares y personajes basada en referencias.

Cómo usar la WAN 2.7 Video API en CometAPI

Paso 1: Prueba la WAN 2.7 Video API en el Kie Al Playground

Primero, prueba la funcionalidad de WAN 2.7 usando la WAN 2.7 Video API en el CometAPI Playground. Sube imágenes, agrega prompts o usa referencias para previsualizar el video de WAN generado antes de integrar el video de IA de WAN 2.7 en tu flujo de producción.

Paso 2: Obtén la clave de la WAN 2.7 API y revisa la documentación de la API

Obtén la clave de la WAN 2.7 API desde la consola de CometAPI y revisa la documentación. Comprende los endpoints, la autenticación y los parámetros de la WAN 2.7 Video API para admitir flujos de texto a video, imagen a video y video de WAN.

Paso 3: Genera videos de IA de WAN 2.7 e intégralos en tu flujo de trabajo

Usa la WAN 2.7 Video API para generar videos de IA de WAN 2.7 con prompts, imágenes o referencias. Integra las salidas de WAN 2.7 en flujos de productos, pipelines de contenido o herramientas de video con IA para habilitar la creación de video a escala.

Preguntas frecuentes