MiniMax, một công ty khởi nghiệp AI hàng đầu của Trung Quốc, đã chính thức ra mắt Hailuo 02, phiên bản mới nhất của công cụ chuyển văn bản thành video tiên tiến. Mô hình này thiết lập chuẩn mực mới về tính chân thực trực quan, mô phỏng vật lý và độ chính xác nhanh chóng.
Hailuo 02 là gì?
Có tên mã là “Kangaroo”, Hailuo 02 kế thừa Hailuo 01 và được cho là xếp hạng #2 trên toàn cầu—sau Seedance 1.0 của ByteDance nhưng vượt trội hơn Veo 3 của Google.
Sử dụng một cuốn tiểu thuyết Phân phối lại tính toán có nhận biết tiếng ồn (NCR) kiến trúc, cung cấp lên đến Nhanh hơn 2.5 lần đào tạo và suy luận, trong khi tăng gấp ba số lượng tham số mô hình. Được đào tạo trên Dữ liệu nhiều hơn và chất lượng cao hơn gấp 4 lần, cho phép xử lý tốt hơn các lời nhắc phức tạp và động lực vật lý.
Điểm nổi bật chính
Kiến trúc kỹ thuật tiên tiến
- Được xây dựng trên hệ thống “Phân phối lại tính toán nhận biết tiếng ồn (NCR)”, Hailuo 02 đạt được Đào tạo và suy luận nhanh hơn 2.5 lần hơn so với người tiền nhiệm của nó, với kích thước mô hình khoảng lớn gấp ba lần .
- Huân luyện vê dữ liệu nhiều hơn gấp bốn lần—và chất lượng cao hơn—, mô hình này rất giỏi trong việc thực hiện các hướng dẫn phức tạp và thực hiện các chuyển động vật lý phức tạp.
Đầu ra video điện ảnh
Hỗ trợ các định dạng video bao gồm 1080p trong 6 giâyvà 768p trong tối đa 10 giây, kết hợp độ phân giải cao với chuyển động mượt mà.
Có “công cụ đạo diễn” cho phép thực hiện các lệnh quay phim như lia máy, thu phóng và thay đổi góc nhìn—mang lại kỹ thuật quay phim giống con người vào các clip do AI tạo ra.
Hiệu suất chuẩn
Xếp hạng #2 trên toàn cầu trên chuẩn Artificial Analysis Video Arena, chỉ xếp sau Seedance 1.0 và vượt trội hơn các đối thủ cạnh tranh như Veo 3 của Google.
Bài đánh giá trực tiếp của Apidog khen ngợi Hailuo 02 đã vượt qua Veo 3 về khả năng dựng hình vật lý, chuyển động máy quay và tính nhất quán về mặt hình ảnh.

Tính khả dụng và giá cả linh hoạt
Có sẵn thông qua MiniMax Video về ốc biển nền tảng, API và ứng dụng di động/web.
Cung cấp ba cấp cấu hình: 768p–6s, 768p–10s và 1080p–6s, với mức giá được thiết kế để duy trì tính cạnh tranh cao .
Chế độ tạo linh hoạt
- Chuyển văn bản thành video (T2V): Tạo clip hoàn toàn từ mô tả bằng ngôn ngữ tự nhiên.
- Chuyển đổi hình ảnh sang video (I2V): Làm hoạt hình cho hình ảnh tĩnh, giữ nguyên phong cách nghệ thuật của hình ảnh trong khi thêm chuyển động mượt mà của máy ảnh hoặc chuyển động của vật thể.
- Chủ đề-đến-Video (S2V): Duy trì sự nhất quán trong hình ảnh nhân vật trong các cảnh quay bằng cách sử dụng hình ảnh tham chiếu—lý tưởng cho tính liên tục của nhiều cảnh.
- Theo tổng quan về API của MiniMax, các chế độ này được tích hợp hoàn toàn vào nền tảng của họ, với một API duy nhất hỗ trợ quy trình làm việc tham chiếu văn bản, hình ảnh và chủ đề.
Hiệu suất & Hiệu quả chi phí
- Hướng dẫn sau: Tuân thủ theo công nghệ tiên tiến với các lời nhắc phức tạp, đa ngôn ngữ (tiếng Trung, tiếng Anh, v.v.).
- Chủ nghĩa hiện thực vật lý: Xử lý nâng cao về động lực học chất lưu, va chạm, mô phỏng vải và các tình huống chuyển động phức tạp khác.
- Kiểm soát máy ảnh: Người dùng có thể chỉ định các chuyển động chuyên nghiệp—quay ngang, nghiêng, di chuyển—thông qua các hướng dẫn bằng văn bản dễ viết.
- Tính nhất quán của nhân vật: Tính năng theo dõi khuôn mặt và cơ thể bằng AI đảm bảo trang phục, đặc điểm và phong cách luôn đồng nhất trên mọi khung hình.
- MiniMax giá Hailuo 02 tại ¥2 cho mỗi video (khoảng $0.28 USD), một mức giá thấp hơn nhiều đối thủ cạnh tranh và nhấn mạnh tinh thần "dành cho tất cả" của nó.
Làm thế nào để Bắt đầu
Qua MiniMax Web hoặc Ứng dụng: Chọn chế độ tạo (T2V/I2V/S2V), chọn độ phân giải và độ dài, sau đó nhập lời nhắc hoặc tải lên hình ảnh tham chiếu.
Tích hợp API:Gọi điểm cuối Hailuo 02 trên nền tảng API của MiniMax chỉ bằng một vài dòng mã—không cần thiết lập phức tạp.
Nhìn về phía trước
Với Hailuo 02, MiniMax đẩy mạnh ranh giới của video AI, trao quyền cho những người sáng tạo—từ họa sĩ hoạt hình và nhà quảng cáo đến nhà làm phim—để tạo nguyên mẫu và lặp lại nhanh hơn bao giờ hết. Khi thế hệ video gốc AI trưởng thành, trọng tâm sẽ chuyển sang thời lượng dài hơn, chỉnh sửa dòng thời gian và thế giới 3D hoàn toàn năng động—nhưng hiện tại, Hailuo 02 nổi bật với đầu ra HD, các điều khiển tiên tiến và độ trung thực nhanh chóng hàng đầu trong ngành.
Bắt đầu
CometAPI cung cấp giao diện REST thống nhất tổng hợp hàng trăm mô hình AI—bao gồm cả họ ChatGPT—dưới một điểm cuối nhất quán, với quản lý khóa API tích hợp, hạn ngạch sử dụng và bảng điều khiển thanh toán. Thay vì phải xử lý nhiều URL và thông tin xác thực của nhà cung cấp.
Để bắt đầu, hãy khám phá khả năng của các mô hình trong Sân chơi và tham khảo ý kiến Hướng dẫn API để biết hướng dẫn chi tiết. Trước khi truy cập, vui lòng đảm bảo bạn đã đăng nhập vào CometAPI và lấy được khóa API.
Tích hợp mới nhất MiniMax‑Hailuo 02 API sẽ sớm xuất hiện trên CometAPI, vì vậy hãy theo dõi! Trong khi chúng tôi hoàn thiện việc tải lên Mô hình MiniMax‑Hailuo 02, hãy khám phá các mô hình khác của chúng tôi trên Trang mô hình hoặc thử chúng trong sân chơi trí tuệ nhân tạo. Mô hình mới nhất của MiniMax trong CometAPI là Minimax ABAB7-API xem trước và API MiniMax Video-01 ,tham khảo:

