MiniMax,这家中国领先的 AI 初创公司,已正式发布 Hailuo 02,其尖端文生视频引擎的最新迭代。该模型在视觉逼真度、物理模拟与提示精确度方面树立了新标杆。
什么是 Hailuo 02?
代号“Kangaroo”,Hailuo 02 继任 Hailuo 01,据称全球排名第 #2——仅次于 ByteDance 的 Seedance 1.0,但优于 Google 的 Veo 3。
采用全新的 噪声感知计算重分配(NCR) 架构,训练与推理速度最高可提升至 2.5×,同时将模型参数规模提升至原来的三倍。基于 4× 更多且更高质量的数据 进行训练,使其在复杂提示与物理动态处理方面表现更佳。
关键亮点
先进技术架构
- 基于“噪声感知计算重分配(NCR)”系统,Hailuo 02 相较前代实现 2.5× 更快的训练与推理,模型规模约为 三倍。
- 以 四倍且更高质量的数据 进行训练,模型在遵循复杂指令与呈现复杂物理运动方面表现卓越。
电影级视频输出
支持包括 1080p 持续 6 秒 与 768p 最长 10 秒 等视频格式,实现高分辨率与流畅运动的平衡。
提供“导演工具”,可实现镜头指令,如平移、变焦与视角切换——为 AI 生成片段带来类人电影化拍摄。
基准测试表现
在 Artificial Analysis Video Arena 基准上位列 全球 #2,仅次于 Seedance 1.0,并优于包括 Google 的 Veo 3 在内的竞争对手。
Apidog 的第一手评测称赞 Hailuo 02 在物理渲染、镜头运动与视觉一致性方面超越了 Veo 3。

灵活的可用性与定价
可通过 MiniMax 的 Sea Snail Video 平台、API 以及移动/网页应用获取。
提供三种配置档位:768p–6s、768p–10s 与 1080p–6s,定价旨在保持 高度竞争力。
灵活的生成模式
- Text‑to‑Video (T2V): 完全依据自然语言描述生成短片。
- Image‑to‑Video (I2V): 为静态图像赋予动画效果,在保留其艺术风格的同时加入平滑的镜头或物体运动。
- Subject‑to‑Video (S2V): 使用参考图像保持角色在不同镜头中的外观一致——适用于多场景的连续性。
- 根据 MiniMax 的 API 概览,这些模式已完全集成到其平台中,单一 API 即可支持文本、图像与主体参考等工作流程。
性能与成本效率
- Instruction Following: 先进的复杂多语言提示(中文、英文等)遵循能力。
- Physical Realism: 高级处理流体动力学、碰撞、布料模拟等复杂运动场景。
- Camera Control: 用户可通过易写的文本指令指定专业镜头运动——平移、俯仰、滑轨等。
- Character Consistency: 通过 AI 驱动的人脸与身体跟踪,确保服饰、特征与风格在各帧间保持一致。
- MiniMax 将 Hailuo 02 定价为 每段视频 ¥2(约 $0.28 USD),相较众多竞品更具优势,体现其“为所有人”理念。
如何开始
通过 MiniMax Web 或 App:选择生成模式(T2V/I2V/S2V),选择分辨率与时长,然后输入提示词或上传参考图像。
API 集成:在 MiniMax 的 API 平台调用 Hailuo 02 的端点,几行代码即可,无需繁琐配置。
展望未来
借助 Hailuo 02,MiniMax 正在推动 AI 视频的边界,赋能创作者——从动画师、广告从业者到电影制作人——以前所未有的速度完成原型与迭代。随着 AI 原生视频生成的成熟,关注点将转向更长时长、时间线编辑与完全动态的 3D 世界——但就目前而言,Hailuo 02 以其高清输出、先进控制与行业领先的提示忠实度脱颖而出。
上手指南
CometAPI 提供统一的 REST 接口,将数百个 AI 模型(包括 ChatGPT 系列)聚合到一致的端点之下,并内置 API 密钥管理、使用配额与计费仪表板。无需在多个厂商的 URL 与凭证之间来回切换。
最新集成的 MiniMax‑Hailuo 02 API 即将上线 CometAPI,敬请关注!在我们完成 MiniMax‑Hailuo 02 模型上传期间,您可在 模型页面 浏览其他模型或在 AI Playground 试用。CometAPI 上 MiniMax 的最新模型包括 Minimax ABAB7-Preview API 和 MiniMax Video-01 API,参考:

