Thông số kỹ thuật của Seedance1.5 Pro
| Thông số | Chi tiết |
|---|---|
| Mã mô hình | doubao-seedance-1-5-pro |
| Nhóm nhà cung cấp | Doubao / ByteDance Seed |
| Loại mô hình | Mô hình tạo sinh âm thanh–hình ảnh nguyên bản |
| Phương thức cốt lõi | Tạo đồng thời video và âm thanh từ một mô hình duy nhất |
| Trường hợp sử dụng chính | Chuyển văn bản thành video và tạo video điện ảnh theo prompt |
| Định dạng đầu vào | Prompt văn bản; cũng hỗ trợ tạo sinh có điều kiện theo hình ảnh |
| Định dạng đầu ra | Video với âm thanh đồng bộ, bao gồm giọng nói và hiệu ứng âm thanh |
| Thế mạnh | Khả năng tuân thủ prompt phức tạp, đồng bộ âm thanh–hình ảnh, hỗ trợ đa ngôn ngữ/khớp khẩu hình, chuyển động điện ảnh và kể chuyện |
| Bối cảnh triển khai | Có sẵn qua các nền tảng mô hình của ByteDance/Volcengine và được cung cấp trên CometAPI dưới mã mô hình này |
| Tính sẵn có thương mại | Khả dụng thương mại/API được nhà cung cấp và danh sách trên nền tảng chỉ định |
Seedance1.5 Pro là gì?
Seedance1.5 Pro là định danh trên nền tảng CometAPI cho mô hình Seedance 1.5 Pro của ByteDance, một mô hình tạo sinh âm thanh–hình ảnh nguyên bản được thiết kế để tạo video và âm thanh cùng nhau thay vì coi âm thanh là một bước hậu kỳ riêng. ByteDance mô tả Seedance 1.5 Pro là một mô hình audio–video kết hợp có khả năng tuân thủ chính xác các chỉ dẫn phức tạp và hỗ trợ cả tạo sinh dựa trên prompt văn bản lẫn dựa trên hình ảnh.
Trong thực tiễn, điều này có nghĩa mô hình hướng tới nhà sáng tạo và nhà phát triển muốn có video dạng ngắn được tạo sinh với lời thoại đồng bộ, âm thanh môi trường, hiệu ứng và độ mạch lạc chuyển động trong một quy trình làm việc duy nhất. Tài liệu kỹ thuật của ByteDance mô tả đây là một mô hình nền tảng cho tạo sinh âm thanh–hình ảnh kết hợp nguyên bản, được xây dựng với kiến trúc Diffusion Transformer hai nhánh và mô hình hóa xuyên phương thức để tăng cường đồng bộ giữa những gì xuất hiện trên màn hình và những gì được nghe thấy.
Mô hình này cũng được định vị trong hệ sinh thái Doubao/Seed rộng hơn như sản phẩm tạo video của ByteDance, với Volcengine liệt kê Doubao-Seedance-1.5-pro trong các mô hình sản xuất và nhấn mạnh “tạo đồng thời âm thanh và hình ảnh” là năng lực cốt lõi.
Tính năng chính của Seedance 1.5 Pro
- Tạo sinh âm thanh–hình ảnh nguyên bản: Mô hình tạo đồng thời video và âm thanh, giúp mang lại sự ăn khớp tự nhiên hơn giữa lời nói, hiệu ứng âm thanh và hành động hình ảnh so với các quy trình ghép âm thanh ở bước sau.
- Khả năng tuân thủ prompt mạnh: ByteDance nêu rõ Seedance 1.5 Pro có thể làm theo chính xác các chỉ dẫn phức tạp, phù hợp với prompt sáng tạo có cấu trúc và đầu ra được kiểm soát theo kịch bản.
- Quy trình từ văn bản thành video và dẫn dắt bởi hình ảnh: Mô hình hỗ trợ tổng hợp nội dung âm thanh–hình ảnh từ prompt văn bản, mang đến sự linh hoạt cho nhà phát triển trong việc phát ý tưởng, dựng storyboard và sáng tạo dựa trên khung hình đầu tiên.
- Giọng nói, âm thanh không gian và hiệu ứng: Tài liệu nhà cung cấp nhấn mạnh dải giọng nói đa dạng và hiệu ứng âm thanh không gian phối hợp với hình ảnh, hữu ích cho kể chuyện phong phú hơn và các clip đắm chìm hơn.
- Hỗ trợ đa ngôn ngữ và phương ngữ: Seedance 1.5 Pro được mô tả hỗ trợ nhiều ngôn ngữ và phương ngữ với khả năng khớp khẩu hình và căn chỉnh chuyển động mạnh, hữu ích cho các ứng dụng truyền thông hướng tới toàn cầu.
- Thiết kế đồng bộ hóa dựa trên nghiên cứu: Báo cáo kỹ thuật đã công bố nhấn mạnh mô hình hóa kết hợp xuyên phương thức và quy trình huấn luyện chuyên biệt nhằm cải thiện đồng bộ âm thanh–hình ảnh và chất lượng tạo sinh.
- Khả dụng trong hệ sinh thái sản xuất: Mô hình xuất hiện trong danh sách mô hình chính thức của ByteDance/Volcengine và được cung cấp qua CometAPI dưới mã
doubao-seedance-1-5-pro, giúp việc tích hợp dựa trên API vào ứng dụng và quy trình media trở nên thực tiễn.
Cách truy cập và tích hợp Seedance1.5 Pro
Bước 1: Đăng ký và lấy khóa API
Đăng ký trên CometAPI và tạo khóa API từ trang bảng điều khiển của bạn. Sau khi có khóa đang hoạt động, hãy lưu trữ an toàn dưới dạng biến môi trường để ứng dụng của bạn có thể xác thực các yêu cầu tới API.
Bước 2: Gửi yêu cầu tới API doubao-seedance-1-5-pro
Sử dụng endpoint tương thích ByteDance/Volcengine của CometAPI tại POST /volc/v3/contents/generations/tasks.
Bước 3: Lấy và xác minh kết quả
API trả về một ID tác vụ. Gọi thăm dò GET /volc/v3/contents/generations/tasks/{task_id} để kiểm tra trạng thái tạo sinh và lấy URL video đầu ra khi tác vụ hoàn tất.