Midjourney 正式发布其首个 AI 视频生成工具 V1 Video Model,标志着其创作能力从静态图像迈向更广阔领域的重要扩展。该功能现已向所有订阅用户开放,支持从单张静态图像生成 5 秒的动画视频片段,并可选用文本提示引导运动与风格。
V1 Video Model 的关键特性
- 图像转视频动画:用户可上传自己的图像或使用现有的 Midjourney 生成图像,产出四个 5 秒的视频变体。动画通过平滑的镜头与物体运动为静态视觉赋予生命。
- 可延展的播放时长:初始片段为 5 秒,用户可将每个视频额外延长四次,每次 4 秒,最长可达 20–21 秒。
- 运动模式:
- 低运动:适用于大多静态场景的细微效果。
- 高运动:适用于包含大幅镜头摇移或角色运动的场景。
- 自定义提示:可通过文本提示引导运动,包括镜头移动、物体动作或转场。
- 两种动画风格:
- 自动模式:从图像自动生成动画。
- 手动模式:在渲染动画前允许编辑提示词。
超越短片的愿景
Midjourney CEO David Holz 表示,该模型并非只用于制作时尚的 B-roll 或广告,而是公司长期目标的重要一步:构建一个实时、AI 驱动的开放世界模拟系统。这一宏伟愿景包括:
- 一个可自由移动的全交互 3D 空间。
- 实时图像渲染与场景响应。
- 会对用户行为做出反应的动态角色与环境。
为实现这一目标,Midjourney 正分阶段推出其基础组件:
- 图像生成(已完成)
- 视频动画(已上线)
- 3D 交互(开发中)
- 实时渲染优化(规划中)
可用性与定价
- 订阅访问:定价 $10/月,将 V1 定位为艺术家与内容创作者易于获取的创作工具。
- 渲染成本:一组 20 个延长片段(总时长约 80 秒)大约消耗一个“fast hour”,成本约 $4——相较于 Google 的 Veo 3 等竞争对手更低。
- 视频质量:虽然未显著超越 Luma Labs 的 Dream Machine 等对手,Midjourney 仍保持较高的视觉保真度。每一帧都如同数码绘画,具备电影化美学。
限制
- 无音频支持:不同于 Veo 3 或 Dream Machine,Midjourney 目前不生成配乐或环境音。
- 编辑受限:不提供时间线编辑、场景转场或片段连接。
- 渲染时间:处理复杂场景时,生成速度可能略慢于竞争对手。
竞争格局
Midjourney 进入了一个拥挤的领域,其中包括 Runway、Luma Labs、Google 的 Veo 3,以及 MiniMax 的 Hailuo 02。
优势:
- 与 Midjourney 的图像生成工作流无缝集成。
- 直观的 UI 与高性价比的使用门槛。
- 适合用于实验性的短篇内容。
劣势:
- 无音频。
- 编辑能力与场景时长受限。
- 分辨率固定为 480p(标清)。
如何生成视频
- 加入 Midjourney 的 Discord:确保你在 Midjourney Bot 活跃的频道中。若不在,可将该 Bot 添加至你的服务器,或加入官方 Midjourney 服务器。
- 调用视频命令:使用
/imagine搭配描述性提示词,并追加--video参数。例如:
/imagine “a floating lantern drifting over a serene lake at sunset” --video
- 自定义时长(可选):默认情况下,V1 生成一个 10 秒的片段,但你可以通过
--duration将长度调整至最多 20 秒。例如:
/imagine “city skyline at dawn” --video --duration 20s
- 等待生成:Bot 会处理你的请求并返回视频文件或链接。处理时间可能因服务器负载与订阅等级而异。
- 下载或分享:生成完成后,点击提供的链接进行查看、下载,或在各平台分享。
合规与安全
Midjourney 执行严格的使用规范:
- 仅可上传具备合法使用权的图像。
- 禁止生成攻击性、色情或煽动性内容,尤其涉及真实人物的内容。
- 系统会自动过滤违规内容且不计入 GPU 时间消耗。
此次发布意味着 Midjourney 正式进军视频生成领域,并为其更宏大的交互式 AI 世界奠定基础。尽管它尚非完整的电影制作套件,但已为短内容创作提供了易用且具视觉吸引力的工具。
在 CometAPI 中使用 MidJourney
CometAPI 提供对 500 多个 AI 模型的访问,包括用于聊天、图像、代码等的开源与专业多模态模型。其主要优势在于简化传统复杂的 AI 集成流程。
CometAPI 提供远低于官方价格的方案,帮助你集成 Midjourney API 和 Midjourney Video API,注册并登录后可在账号内免费试用!欢迎注册体验 CometAPI。CometAPI 按使用量计费。
使用 v7 创建图像: 在使用 MidJourney V7 创建图像之前,你需要在此处免费获取访问权限:Start building on CometAPI today – sign up。请访问 docs。开始使用 MidJourney V7 非常简单——只需在提示词末尾添加 --v 7 参数。该简单命令会告知 CometAPI 使用最新 V7 模型为你生成图像。
视频生成: 开发者可通过 RESTful API 集成视频生成功能。一个典型请求结构(示例)
curl --
location
--request POST 'https://api.cometapi.com/mj/submit/video' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
