如何使用 Midjourney 的 V1 视频模型？

Midjourney 于 2025 年 6 月中旬以发布其首个视频模型 V1 震撼了 AI 艺术社区，标志着其从静态图像生成显著扩展到动画内容。这一备受期待的功能于 2025 年 6 月 18 日在 Midjourney 的博客上正式宣布，并在 2025 年 6 月 19 日向广大用户开放。在实际应用中，V1 允许创作者将单张图像——无论是 AI 生成还是用户上传——转换为动态短片，这一能力有望重塑数字艺术家、营销人员和电影制作人的视觉叙事工作流。

本文综合了围绕 V1 的最新进展，阐述如何高效使用该功能，并探讨其技术基础、定价、使用场景与法律考量。

什么是 Midjourney 的 V1 视频模型，为什么重要？

Midjourney 的 V1 视频模型是该平台首次涉足 AI 驱动的视频创作，提供一种将静态画面默认动画化为 5 秒视频片段的工作流（图像转视频），并可按每次 4 秒的步进扩展至最多 21 秒。这使用户能够为静态图像注入生命力，轻松制作电影感循环、动图或适配社交媒体的视频，无需传统视频编辑软件。

AI 视频的重要性

民主化动画创作：过去为图像添加动画需要专业工具与技能；V1 将准入门槛大幅降低，适用于各层级创作者。
快速原型验证：图形设计师与内容团队能更快迭代视觉概念，通过嵌入运动测试受众参与度，而无需昂贵的制作流程。
创意实验：该工具鼓励非专业人士探索运动动态，将 AI 艺术从静态构图拓展至更广阔的领域。

如何访问并启用 V1 视频模型？

要使用 V1 视频模型，必须拥有 Midjourney 订阅，并且只能通过 Midjourney 网页端访问该功能——Discord 命令尚不支持视频生成。

订阅要求

所有套餐：可在快速模式中生成视频，GPU 时间积分消耗为标准图像的 8 倍（即图像为 1 GPU 分钟，视频为 8 GPU 分钟）。
专业版与大型版套餐：可使用空闲模式，空闲模式不消耗积分，但优先级较低、渲染速度更慢。

启用步骤

登录 midjourney.com 的账户并进入 “Create” 页面。
生成或上传一张图像，作为视频的初始帧。
在完成的图像渲染下方点击新的 “Animate” 按钮，进入图像转视频工作流。
在自动或手动动画模式之间选择（详见下文）。

这些简单步骤即可让你把任意静态图片变为动态序列，沿用与图像生成相同的直观界面。

V1 视频有哪些模式与参数？

Midjourney V1 提供两种主要动画模式（自动与手动），两种运动强度设置（低运动与高运动），并配合专用参数进行细致调优。

动画模式

自动模式：系统根据你的图像内容自动生成“运动提示词”，除选择模式外无需额外输入。
手动模式：你编写文本指令描述元素应如何运动，类似标准 Midjourney 提示词，可获得精确的创作控制。

运动强度

低运动：适合氛围或轻微运动场景，摄像机基本静止、主体缓慢移动；但偶尔可能出现运动几乎不可见的情况。
高运动：适合动态场景，摄像机与主体均剧烈运动；若使用过度，可能引入视觉伪影或“怪异”帧。

视频专用参数

--motion low 或 --motion high 指定运动强度。
--raw 跳过默认风格化管线，提供未经滤镜的输出，便于后期处理。

这些选项帮助用户针对项目需求定制动画风格与复杂度，从细腻的视差效果到更具电影感的运动。

如何开始使用 Midjourney 视频

1. Discord 机器人命令

   /imagine https://your.image.url --motion high --raw --v 1

将输入图像作为起始帧，设置高运动、原始提示影响，并选择 Video V1。

2.Web UI

点击图库中任意图像下方的 “Animate”，选择 Auto 或 Manual，设置运动级别，然后提交。

1. /imagine <your prompt or image URL>
2. Click the “Animate” button in the web UI
3. Choose Automatic or Manual mode, set High/Low Motion
4. Extend by +4 seconds up to 4 times

目前尚未发布公开的 REST 风格端点；所有交互均通过 Discord 的斜杠命令与网页界面进行。

3. CometAPI

CometAPI 是一个统一的 API 平台，将来自领先提供商的 500+ AI 模型（如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等）聚合到一个面向开发者的接口中。通过提供一致的身份验证、请求格式与响应处理，CometAPI 显著简化了将 AI 能力集成到应用中的过程。无论你在构建聊天机器人、图像生成器、音乐创作工具，还是数据驱动的分析管线，CometAPI 都能帮助你更快迭代、控制成本，并保持供应商中立，同时利用 AI 生态的最新突破。

开发者可通过 CometAPI 访问 Midjourney Video API，最新模型列表以本文发布时为准。开始之前，可在 Playground 探索模型能力，并参考 API guide 获取详细说明。访问前请确保已登录 CometAPI 并获取 API 密钥。CometAPI 提供远低于官方价格的方案，帮助你完成集成。

开发者可通过 RESTful API 集成视频生成。典型请求结构（示例）：

curl --
location 
--request POST 'https://api.cometapi.com/mj/submit/video' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "prompt": "https://cdn.midjourney.com/f9e3db60-f76c-48ca-a4e1-ce6545d9355d/0_0.png add a dog", "videoType": "vid_1.1_i2v_480", "mode": "fast", "animateMode": "manual" }'

如何在 Midjourney V1（Discord）中逐步生成视频？

使用 V1 生成视频遵循结构化工作流，类似传统的 Midjourney 图像提示，但加入了动画指令。

步骤 1：准备图像

通过 /imagine 提示生成图像，或在网页端上传自定义图像。
可选：使用放大器或应用变体在动画前优化视觉效果。

步骤 2：调用 Animate 功能

渲染完成后，点击 “Animate”。
选择自动以快速生成运动，或选择手动输入以运动为重点的提示词。
根据所需效果选择 --motion low 或 --motion high。

步骤 3：配置时长与扩展

默认视频时长为 5 秒。
要扩展时长，可使用网页滑杆或添加参数 --video-extend，以每次 4 秒的增量扩展，最多至 21 秒。

步骤 4：渲染与下载

点击 “Generate Video”；渲染时间将因模式与订阅等级而异。
完成后点击下载图标，保存分辨率为 480p、与原始图像纵横比匹配的 .mp4 文件。

这一精简流程让新手也能在数分钟内制作动画短片，促进快速创意迭代。

如何优化输出视频的质量与时长？

要获得专业级视频，需要在运动设置、提示词具体性与后期技巧之间找到平衡。

平衡运动与稳定性

对细节丰富的主体（如人脸或产品镜头），先使用低运动以保持清晰度，如需更强动态再逐步提升至高运动。
对关键段落（如角色动作或镜头推进），使用手动模式可避免自动提示生成器带来的不可预测伪影。

管理时长

规划片段结构：较短片段（5–9 秒）适合社交媒体循环；较长片段（10–21 秒）更适合叙事或演示内容。
谨慎使用扩展功能，以避免过高的渲染成本并维持输出一致性。

后期处理技巧

稳定化：将下载的片段导入视频编辑软件（如 Adobe Premiere Pro 的 Warp Stabilizer）以平滑小幅抖动。
调色：通过应用 LUT 或手动色彩调整提升视觉观感，V1 输出刻意偏中性，以最大化与编辑套件的兼容性。
帧插值：如需超顺滑播放，可使用 Flowframes 或 Twixtor 等工具提升帧率。

通过结合平台内设置与外部编辑流程，创作者可将 V1 片段从新奇动画提升为精致、专业的内容。

使用 V1 视频的费用与订阅详情是什么？

理解 V1 的财务影响对休闲用户与企业团队评估 ROI 至关重要。

订阅档位与定价

基础版（$10/月）：仅支持在快速模式下生成视频，GPU 分钟消耗为图像的 8 倍。
专业版与大型版（高阶档）：包含空闲模式视频生成，空闲模式不消耗积分，但会排在快速模式任务之后，适合批量或非紧急渲染。

成本拆解

Plan	Video Mode	GPU-minute cost per 5s clip	Extension cost per 4s
Basic	Fast only	8 minutes	+8 minutes
Pro / Mega	Fast & Relax	8 minutes (Fast) / 0 (Relax)	+8 / 0 minutes

平均而言，在快速模式下生成一条 21 秒视频消耗 32 GPU 分钟，相当于生成 32 张静态图像。

企业考量

若需大规模批量生成，尤其是实时或高频输出，可考虑定制企业协议。
在积分使用与期限之间做权衡：空闲模式具有成本优势，但周转时间更长。

通过将订阅等级与项目需求对齐，用户可同时优化预算与制作时间线。

结语

Midjourney 的 V1 视频模型处于创新与争议的交汇处，为创作者提供了前所未有的图像动画能力，同时需应对复杂的版权环境。从直观的图像转视频工作流到高级手动控制，V1 让用户以极低技术门槛创作引人入胜的短视频。随着法律与伦理问题的演进，审慎使用与遵循最佳实践至关重要。展望未来，Midjourney 的路线图承诺更丰富的 3D 体验、更长格式与更高保真输出，彰显其致力于推动 AI 创意边界的雄心。

什么是 Midjourney 的 V1 视频模型，为什么重要？

AI 视频的重要性

如何访问并启用 V1 视频模型？

订阅要求

启用步骤

V1 视频有哪些模式与参数？

动画模式

运动强度

视频专用参数

如何开始使用 Midjourney 视频

1. Discord 机器人命令

2.Web UI

3. CometAPI

如何在 Midjourney V1（Discord）中逐步生成视频？

步骤 1：准备图像

步骤 2：调用 Animate 功能

步骤 3：配置时长与扩展

步骤 4：渲染与下载

如何优化输出视频的质量与时长？

平衡运动与稳定性

管理时长

后期处理技巧

使用 V1 视频的费用与订阅详情是什么？

订阅档位与定价

成本拆解

企业考量

结语

以低成本获取顶级模型

阅读更多

如何使用 Midjourney 的 V1 视频模型？

什么是 Midjourney 的 V1 视频模型，为什么重要？

AI 视频的重要性

如何访问并启用 V1 视频模型？

订阅要求

启用步骤

V1 视频有哪些模式与参数？

动画模式

运动强度

视频专用参数

如何开始使用 Midjourney 视频

1. Discord 机器人命令

2.Web UI

3. CometAPI

如何在 Midjourney V1（Discord）中逐步生成视频？

步骤 1：准备图像

步骤 2：调用 Animate 功能

步骤 3：配置时长与扩展

步骤 4：渲染与下载

如何优化输出视频的质量与时长？

平衡运动与稳定性

管理时长

后期处理技巧

使用 V1 视频的费用与订阅详情是什么？

订阅档位与定价

成本拆解

企业考量

结语

以低成本 获取顶级模型

阅读更多

以低成本获取顶级模型