Midjourney 发布 V1 Video:首个 AI 视频生成模型

CometAPI
AnnaJun 18, 2025
Midjourney 发布 V1 Video:首个 AI 视频生成模型

Midjourney 正式发布其首个 AI 视频生成工具 V1 Video Model,标志着其创作能力从静态图像迈向更广阔领域的重要扩展。该功能现已向所有订阅用户开放,支持从单张静态图像生成 5 秒的动画视频片段,并可选用文本提示引导运动与风格。

V1 Video Model 的关键特性

  • 图像转视频动画:用户可上传自己的图像或使用现有的 Midjourney 生成图像,产出四个 5 秒的视频变体。动画通过平滑的镜头与物体运动为静态视觉赋予生命。
  • 可延展的播放时长:初始片段为 5 秒,用户可将每个视频额外延长四次,每次 4 秒,最长可达 20–21 秒。
  • 运动模式
  • 低运动:适用于大多静态场景的细微效果。
  • 高运动:适用于包含大幅镜头摇移或角色运动的场景。
  • 自定义提示:可通过文本提示引导运动,包括镜头移动、物体动作或转场。
  • 两种动画风格
  • 自动模式:从图像自动生成动画。
  • 手动模式:在渲染动画前允许编辑提示词。

超越短片的愿景

Midjourney CEO David Holz 表示,该模型并非只用于制作时尚的 B-roll 或广告,而是公司长期目标的重要一步:构建一个实时、AI 驱动的开放世界模拟系统。这一宏伟愿景包括:

  • 一个可自由移动的全交互 3D 空间。
  • 实时图像渲染与场景响应。
  • 会对用户行为做出反应的动态角色与环境。

为实现这一目标,Midjourney 正分阶段推出其基础组件:

  1. 图像生成(已完成)
  2. 视频动画(已上线)
  3. 3D 交互(开发中)
  4. 实时渲染优化(规划中)

可用性与定价

  • 订阅访问:定价 $10/月,将 V1 定位为艺术家与内容创作者易于获取的创作工具。
  • 渲染成本:一组 20 个延长片段(总时长约 80 秒)大约消耗一个“fast hour”,成本约 $4——相较于 Google 的 Veo 3 等竞争对手更低。
  • 视频质量:虽然未显著超越 Luma Labs 的 Dream Machine 等对手,Midjourney 仍保持较高的视觉保真度。每一帧都如同数码绘画,具备电影化美学。

限制

  • 无音频支持:不同于 Veo 3 或 Dream Machine,Midjourney 目前不生成配乐或环境音。
  • 编辑受限:不提供时间线编辑、场景转场或片段连接。
  • 渲染时间:处理复杂场景时,生成速度可能略慢于竞争对手。

竞争格局

Midjourney 进入了一个拥挤的领域,其中包括 Runway、Luma Labs、Google 的 Veo 3,以及 MiniMax 的 Hailuo 02。

优势

  • 与 Midjourney 的图像生成工作流无缝集成。
  • 直观的 UI 与高性价比的使用门槛。
  • 适合用于实验性的短篇内容。

劣势

  • 无音频。
  • 编辑能力与场景时长受限。
  • 分辨率固定为 480p(标清)。

如何生成视频

  1. 加入 Midjourney 的 Discord:确保你在 Midjourney Bot 活跃的频道中。若不在,可将该 Bot 添加至你的服务器,或加入官方 Midjourney 服务器。
  2. 调用视频命令:使用 /imagine 搭配描述性提示词,并追加 --video 参数。例如:
   /imagine “a floating lantern drifting over a serene lake at sunset” --video
  1. 自定义时长(可选):默认情况下,V1 生成一个 10 秒的片段,但你可以通过 --duration 将长度调整至最多 20 秒。例如:
   /imagine “city skyline at dawn” --video --duration 20s
  1. 等待生成:Bot 会处理你的请求并返回视频文件或链接。处理时间可能因服务器负载与订阅等级而异。
  2. 下载或分享:生成完成后,点击提供的链接进行查看、下载,或在各平台分享。

合规与安全

Midjourney 执行严格的使用规范:

  • 仅可上传具备合法使用权的图像。
  • 禁止生成攻击性、色情或煽动性内容,尤其涉及真实人物的内容。
  • 系统会自动过滤违规内容且不计入 GPU 时间消耗。

此次发布意味着 Midjourney 正式进军视频生成领域,并为其更宏大的交互式 AI 世界奠定基础。尽管它尚非完整的电影制作套件,但已为短内容创作提供了易用且具视觉吸引力的工具。

在 CometAPI 中使用 MidJourney

CometAPI 提供对 500 多个 AI 模型的访问,包括用于聊天、图像、代码等的开源与专业多模态模型。其主要优势在于简化传统复杂的 AI 集成流程。

CometAPI 提供远低于官方价格的方案,帮助你集成 Midjourney APIMidjourney Video API,注册并登录后可在账号内免费试用!欢迎注册体验 CometAPI。CometAPI 按使用量计费。

使用 v7 创建图像: 在使用 MidJourney V7 创建图像之前,你需要在此处免费获取访问权限:Start building on CometAPI today – sign up。请访问 docs。开始使用 MidJourney V7 非常简单——只需在提示词末尾添加 --v 7 参数。该简单命令会告知 CometAPI 使用最新 V7 模型为你生成图像。

视频生成: 开发者可通过 RESTful API 集成视频生成功能。一个典型请求结构(示例)

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'
阅读更多

一个 API 中超 500 个模型

最高 20% 折扣