如何使用 Midjourney 的 V1 视频模型?

CometAPI
AnnaJul 1, 2025
如何使用 Midjourney 的 V1 视频模型?

Midjourney 于 2025 年 6 月中旬以发布其首个视频模型 V1 震撼了 AI 艺术社区,标志着其从静态图像生成显著扩展到动画内容。这一备受期待的功能于 2025 年 6 月 18 日在 Midjourney 的博客上正式宣布,并在 2025 年 6 月 19 日向广大用户开放。在实际应用中,V1 允许创作者将单张图像——无论是 AI 生成还是用户上传——转换为动态短片,这一能力有望重塑数字艺术家、营销人员和电影制作人的视觉叙事工作流。

本文综合了围绕 V1 的最新进展,阐述如何高效使用该功能,并探讨其技术基础、定价、使用场景与法律考量。


什么是 Midjourney 的 V1 视频模型,为什么重要?

Midjourney 的 V1 视频模型是该平台首次涉足 AI 驱动的视频创作,提供一种将静态画面默认动画化为 5 秒视频片段的工作流(图像转视频),并可按每次 4 秒的步进扩展至最多 21 秒。这使用户能够为静态图像注入生命力,轻松制作电影感循环、动图或适配社交媒体的视频,无需传统视频编辑软件。

AI 视频的重要性

  • 民主化动画创作:过去为图像添加动画需要专业工具与技能;V1 将准入门槛大幅降低,适用于各层级创作者。
  • 快速原型验证:图形设计师与内容团队能更快迭代视觉概念,通过嵌入运动测试受众参与度,而无需昂贵的制作流程。
  • 创意实验:该工具鼓励非专业人士探索运动动态,将 AI 艺术从静态构图拓展至更广阔的领域。

如何访问并启用 V1 视频模型?

要使用 V1 视频模型,必须拥有 Midjourney 订阅,并且只能通过 Midjourney 网页端访问该功能——Discord 命令尚不支持视频生成。

订阅要求

  • 所有套餐:可在快速模式中生成视频,GPU 时间积分消耗为标准图像的 8 倍(即图像为 1 GPU 分钟,视频为 8 GPU 分钟)。
  • 专业版与大型版套餐:可使用空闲模式,空闲模式不消耗积分,但优先级较低、渲染速度更慢。

启用步骤

  1. 登录 midjourney.com 的账户并进入 “Create” 页面。
  2. 生成或上传一张图像,作为视频的初始帧。
  3. 在完成的图像渲染下方点击新的 “Animate” 按钮,进入图像转视频工作流。
  4. 在自动或手动动画模式之间选择(详见下文)。

这些简单步骤即可让你把任意静态图片变为动态序列,沿用与图像生成相同的直观界面。


V1 视频有哪些模式与参数?

Midjourney V1 提供两种主要动画模式(自动与手动),两种运动强度设置(低运动与高运动),并配合专用参数进行细致调优。

动画模式

  • 自动模式:系统根据你的图像内容自动生成“运动提示词”,除选择模式外无需额外输入。
  • 手动模式:你编写文本指令描述元素应如何运动,类似标准 Midjourney 提示词,可获得精确的创作控制。

运动强度

  • 低运动:适合氛围或轻微运动场景,摄像机基本静止、主体缓慢移动;但偶尔可能出现运动几乎不可见的情况。
  • 高运动:适合动态场景,摄像机与主体均剧烈运动;若使用过度,可能引入视觉伪影或“怪异”帧。

视频专用参数

  • --motion low--motion high 指定运动强度。
  • --raw 跳过默认风格化管线,提供未经滤镜的输出,便于后期处理。

这些选项帮助用户针对项目需求定制动画风格与复杂度,从细腻的视差效果到更具电影感的运动。

如何开始使用 Midjourney 视频

1. Discord 机器人命令

   /imagine https://your.image.url --motion high --raw --v 1
  • 将输入图像作为起始帧,设置高运动、原始提示影响,并选择 Video V1。

2.Web UI

点击图库中任意图像下方的 “Animate”,选择 Auto 或 Manual,设置运动级别,然后提交。

1. /imagine <your prompt or image URL>
2. Click the “Animate” button in the web UI
3. Choose Automatic or Manual mode, set High/Low Motion
4. Extend by +4 seconds up to 4 times

目前尚未发布公开的 REST 风格端点;所有交互均通过 Discord 的斜杠命令与网页界面进行。

3. CometAPI

CometAPI 是一个统一的 API 平台,将来自领先提供商的 500+ AI 模型(如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)聚合到一个面向开发者的接口中。通过提供一致的身份验证、请求格式与响应处理,CometAPI 显著简化了将 AI 能力集成到应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析管线,CometAPI 都能帮助你更快迭代、控制成本,并保持供应商中立,同时利用 AI 生态的最新突破。

开发者可通过 CometAPI 访问 Midjourney Video API,最新模型列表以本文发布时为准。开始之前,可在 Playground 探索模型能力,并参考 API guide 获取详细说明。访问前请确保已登录 CometAPI 并获取 API 密钥。CometAPI 提供远低于官方价格的方案,帮助你完成集成。

开发者可通过 RESTful API 集成视频生成。典型请求结构(示例):

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'

如何在 Midjourney V1(Discord)中逐步生成视频?

使用 V1 生成视频遵循结构化工作流,类似传统的 Midjourney 图像提示,但加入了动画指令。

步骤 1:准备图像

  1. 通过 /imagine 提示生成图像,或在网页端上传自定义图像。
  2. 可选:使用放大器或应用变体在动画前优化视觉效果。

步骤 2:调用 Animate 功能

  1. 渲染完成后,点击 “Animate”。
  2. 选择自动以快速生成运动,或选择手动输入以运动为重点的提示词。
  3. 根据所需效果选择 --motion low--motion high

步骤 3:配置时长与扩展

  • 默认视频时长为 5 秒。
  • 要扩展时长,可使用网页滑杆或添加参数 --video-extend,以每次 4 秒的增量扩展,最多至 21 秒。

步骤 4:渲染与下载

  • 点击 “Generate Video”;渲染时间将因模式与订阅等级而异。
  • 完成后点击下载图标,保存分辨率为 480p、与原始图像纵横比匹配的 .mp4 文件。

这一精简流程让新手也能在数分钟内制作动画短片,促进快速创意迭代。


如何优化输出视频的质量与时长?

要获得专业级视频,需要在运动设置、提示词具体性与后期技巧之间找到平衡。

平衡运动与稳定性

  • 对细节丰富的主体(如人脸或产品镜头),先使用低运动以保持清晰度,如需更强动态再逐步提升至高运动。
  • 对关键段落(如角色动作或镜头推进),使用手动模式可避免自动提示生成器带来的不可预测伪影。

管理时长

  • 规划片段结构:较短片段(5–9 秒)适合社交媒体循环;较长片段(10–21 秒)更适合叙事或演示内容。
  • 谨慎使用扩展功能,以避免过高的渲染成本并维持输出一致性。

后期处理技巧

  • 稳定化:将下载的片段导入视频编辑软件(如 Adobe Premiere Pro 的 Warp Stabilizer)以平滑小幅抖动。
  • 调色:通过应用 LUT 或手动色彩调整提升视觉观感,V1 输出刻意偏中性,以最大化与编辑套件的兼容性。
  • 帧插值:如需超顺滑播放,可使用 Flowframes 或 Twixtor 等工具提升帧率。

通过结合平台内设置与外部编辑流程,创作者可将 V1 片段从新奇动画提升为精致、专业的内容。


使用 V1 视频的费用与订阅详情是什么?

理解 V1 的财务影响对休闲用户与企业团队评估 ROI 至关重要。

订阅档位与定价

  • 基础版($10/月):仅支持在快速模式下生成视频,GPU 分钟消耗为图像的 8 倍。
  • 专业版与大型版(高阶档):包含空闲模式视频生成,空闲模式不消耗积分,但会排在快速模式任务之后,适合批量或非紧急渲染。

成本拆解

PlanVideo ModeGPU-minute cost per 5s clipExtension cost per 4s
BasicFast only8 minutes+8 minutes
Pro / MegaFast & Relax8 minutes (Fast) / 0 (Relax)+8 / 0 minutes
  • 平均而言,在快速模式下生成一条 21 秒视频消耗 32 GPU 分钟,相当于生成 32 张静态图像。

企业考量

  • 若需大规模批量生成,尤其是实时或高频输出,可考虑定制企业协议。
  • 在积分使用与期限之间做权衡:空闲模式具有成本优势,但周转时间更长。

通过将订阅等级与项目需求对齐,用户可同时优化预算与制作时间线。


结语

Midjourney 的 V1 视频模型处于创新与争议的交汇处,为创作者提供了前所未有的图像动画能力,同时需应对复杂的版权环境。从直观的图像转视频工作流到高级手动控制,V1 让用户以极低技术门槛创作引人入胜的短视频。随着法律与伦理问题的演进,审慎使用与遵循最佳实践至关重要。展望未来,Midjourney 的路线图承诺更丰富的 3D 体验、更长格式与更高保真输出,彰显其致力于推动 AI 创意边界的雄心。

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣