Wan 2.6의 기술 사양
| 항목 | Wan 2.6 비디오 스위트 |
|---|---|
| 제공사 | Alibaba / Tongyi Lab |
| 모델 계열 | Wan 2.6 |
| 출시 시기 | 2025년 12월 세대 |
| 입력 유형 | 텍스트, 이미지, 레퍼런스 비디오, 오디오 입력 |
| 출력 유형 | 동기화 오디오 선택 포함 비디오 |
| 핵심 모드 | 텍스트-투-비디오(T2V), 이미지-투-비디오(I2V), 레퍼런스-투-비디오(R2V) |
| Flash 변형 | I2V Flash, R2V Flash |
| 해상도 지원 | 720P 및 1080P |
| 재생 길이 지원 | 2–15초(워크플로에 따라 다름) |
| 오디오 기능 | 네이티브 오디오 생성, 음성 레퍼런스, 립싱크 |
| 멀티 샷 지원 | 단일 워크플로에서 2–8개 장면 세그먼트 |
| 레퍼런스 지원 | 최대 5개 레퍼런스(워크플로에 따라 이미지/비디오 혼합) |
| API 워크플로 | 비동기 태스크 생성 + 폴링 |
Wan 2.6란 무엇인가?
Wan 2.6는 제어 가능한 숏폼 제작에 초점을 맞춘 Alibaba의 멀티모달 비디오 생성 시스템이다. 순수 프롬프트 기반 방식이 아니라, 모델은 텍스트 프롬프트, 이미지 레퍼런스, 레퍼런스 비디오, 오디오 컨디셔닝, 장면 체이닝을 결합해 크리에이터 워크플로를 구성한다. 이전 Wan 릴리스 대비 주요 업그레이드는 더 강력한 레퍼런스 기반 일관성과 더 긴 내러티브 생성의 도입이었다.
Wan 2.6의 주요 기능
- 레퍼런스 기반 비디오 워크플로: 사용자는 이미지 또는 비디오 레퍼런스를 입력해 세대 전반에서 캐릭터 정체성, 스타일, 음성의 연속성을 유지할 수 있다.
- 멀티 샷 내러티브 생성: 단일 생성 워크플로 내에서 여러 프롬프트를 체이닝해 장면 전환과 스토리 전개를 지원한다.
- 네이티브 오디오 동기화: 생성 오디오, 사용자 지정 오디오 업로드, 립싱크 워크플로를 기본 지원한다.
- 유연한 입력 모드: 프롬프트 전용 생성, 첫 프레임 애니메이션, 레퍼런스 기반 워크플로를 지원한다.
- 반복을 위한 Flash 변형: 더 빠른 버전으로 최종 고품질 렌더 전에 신속한 테스트가 가능하다.
- 더 긴 클립: 이전 세대 대비 클립 길이가 확장되어 내러티브 콘텐츠 제작을 지원한다.
Wan 2.6의 벤치마크 성능
Wan 2.6에 대한 공식 벤치마크 투명성은 여전히 제한적이며, Alibaba는 텍스트 LLM 제공업체들보다 표준화된 벤치마크 수치를 적게 공개했다. 대부분의 평가는 공개 리더보드보다는 워크플로 테스트와 생태계 비교에서 도출된다. 커뮤니티 테스트에서 일관되게 강조되는 점은 다음과 같다:
- 이전 Wan 릴리스 대비 향상된 캐릭터 일관성
- 더 나아진 오디오-비디오 동기화
- 보다 강한 멀티 샷 연속성
- 레퍼런스 컨디셔닝의 신뢰성 향상
벤치마크 공개가 드물기 때문에 배포 전에 프로덕션 환경에서의 테스트가 여전히 중요하다.
Wan 2.6 vs 기타 비디오 모델
| 기능 | Wan 2.6 | Wan 2.7 | Veo 계열 모델 |
|---|---|---|---|
| 네이티브 오디오 생성 | 강력 | 더 강력 | 강력 |
| 멀티 샷 워크플로 | 예 | 개선됨 | 보통 |
| 레퍼런스-투-비디오 | 강하게 강조 | 더 강력한 제어 | 보통 |
| 클립 길이 | 최대 15초 | 유사 / 워크플로에 따라 다름 | 가변 |
| 다중 레퍼런스 지원 | 최대 5개 | 확장된 워크플로 | 보통 |
| 편집 워크플로 | 보통 | 향상된 편집 지원 | 강력 |
Wan 2.6의 한계
- 짧은 클립 길이로 인해 여전히 장편 제작에 제약이 있다.
- 고속 움직임 장면에서 시간적 안정성이 떨어질 수 있다.
- 레퍼런스 중심 워크플로는 설정 복잡도를 높인다.
- 공개 벤치마크 보고는 여전히 제한적이다.
- 비동기 생성 파이프라인은 통합 복잡도를 높인다.
대표적 사용 사례
- 캐릭터 일관성을 유지하는 마케팅 비디오.
- 다중 장면 소셜 미디어 클립.
- 크리에이터 아바타 애니메이션.
- 레퍼런스 기반 제품 비디오.
- 오디오 동기화가 적용된 AI 스토리텔링.
- 정체성 보존이 필요한 브랜드 콘텐츠.