Как создать видео в API Midjourney?

Переход Midjourney к видео стал одной из крупнейших историй в области креативных технологий 2025 года. То, что начиналось как любимый инструмент с фокусом на изображениях, добавило рабочий процесс «Image-to-Video», который превращает статические кадры в короткие анимированные клипы — и система быстро развивается.

Видеовозможности Midjourney — это рабочий процесс image-to-video, который анимирует одно изображение в короткий клип через поток «Animate», по умолчанию создавая ролики длиной пять секунд и позволяя расширения до ~21 секунды. Функция запущена в середине 2025 года как видеомодель Midjourney V1 и доступна через Midjourney Video V1 API от CometAPI.

What is Midjourney V1

What Midjourney V1 does and how it’s surfaced to users

Видеомодель Midjourney V1 превращает одно статичное изображение (сгенерированное в Midjourney или внешне размещённое) в короткие анимированные клипы — по умолчанию около 5 секунд — с использованием автоматических или ручных режимов анимации и флагов интенсивности движения (--motion low / --motion high). Пользователи могут продлевать клипы по 4 секунды (до ~21 секунды), управлять размером батча, зацикливанием и конечными кадрами; выводимое видео — MP4. Видеомодель Midjourney V1 — это модель image-to-video, оптимизированная для коротких, стилизованных, зацикливаемых клипов. Типичные характеристики модели V1 включают:

Базовая длина клипа ~5 секунд, с контролируемым механизмом расширения (шаг 4 секунды, до документированного предела).
Акцент на сохранении художественного стиля исходного изображения (манера письма, цвет, настроение).
Компромиссы разрешения и качества ради быстрой итерации; V1 ориентирована на социальные сети и веб-контент, а не на полноценный кинематографический вывод.

Эти ограничения определяют подход к созданию ассетов и промптов: V1 лучше всего подходит для лаконичного движения, «оживлённых» статичных кадров, продуктовых hero-лупов или коротких характерных зарисовок, а не для длинных сцен.

How CometAPI surfaces the Midjourney Video model

CometAPI — это многомодельный шлюз, объединяющий доступ к сотням ИИ-моделей (текст, изображение, аудио и теперь image-to-video) за единым REST-интерфейсом. Его предложение Midjourney Video оборачивает видеовозможности Midjourney V1 так, чтобы инженеры могли вызывать генерацию image-to-video программно, а не полагаться только на Discord/веб. Это полезно для автоматизации креативных пайплайнов, создания прототипов и интеграции коротких анимированных ассетов в приложения или производственные контуры контента.

Midjourney Video от CometAPI позволяет разработчикам аутентифицироваться, вызвать конечную точку /mj/submit/video и передать параметры, такие как prompt (может включать URL исходного изображения), videoType (например, vid_1.1_i2v_480), mode (fast/relax) и animateMode (automatic/manual). По сравнению с прямой интеграцией через ориентированный на Discord рабочий процесс Midjourney, CometAPI предлагает более низкую стоимость за вызов и удобство (единый API-ключ + REST-интерфейс).

How do I prepare before I call the API?

What credentials and accounts do I need?

Зарегистрируйтесь в CometAPI и сгенерируйте API-ключ в панели учётной записи (CometAPI использует bearer-токен вида sk-xxxxx).
Убедитесь, что у вас есть изображенные ассеты в онлайне (публично доступный URL), если вы планируете использовать внешние изображения как стартовый кадр. Для сценариев внешнее изображение → видео Midjourney нужны доступные URL.

What decisions to make up front

Стартовое изображение — выберите кадр с чётким объектом и композицией; соотношение сторон влияет на итоговое разрешение/соотношение (Midjourney сопоставляет стартовые соотношения сторон с SD/HD-пиксельными размерами).
Стиль движения — решите, нужен Low или High motion (--motion low vs --motion high) и хотите ли вы автоматическое определение или ручной контроль движения камеры/объекта.
Длина и размер батча — по умолчанию 5 секунд; можно продлить до ~21 с. Размер батча по умолчанию 4 (Midjourney возвращает 4 варианта), но можно запросить 1 или 2 для экономии вычислений.
Разрешение — V1 в основном SD (480p) по умолчанию; HD (720p) требует указания параметра, например vid_1.1_i2v_480.

How do I call CometAPI’s Midjourney video endpoint (step-by-step with examples)?

What’s the minimal request payload?

Минимально вы отправляете:

prompt: URL стартового изображения и необязательный текстовый промпт движения (например, "https://.../frame.png add a dog running from left to right").
videoType: например, vid_1.1_i2v_480.
mode: "fast" (или "relax", если план позволяет).
animateMode: "automatic" или "manual".

Это пример curl, демонстрирующий POST на[https://api.cometapi.com/mj/submit/video. Ниже — очищенный, готовый к копированию пример curl, адаптированный из примера CometAPI:

curl --location --request POST 'https://api.cometapi.com/mj/submit/video' \
  --header 'Authorization: Bearer sk-YOUR_COMETAPI_KEY' \
  --header 'Content-Type: application/json' \
  --data-raw '{
    "prompt": "https://cdn.midjourney.com/example/0_0.png Спокойная прибрежная сцена — камера медленно отъезжает, мимо пролетает чайка",
    "videoType": "vid_1.1_i2v_480",
    "mode": "fast",
    "animateMode": "manual",
    "motion": "low",
    "bs": 1
  }'

Python example (requests)

Если вам удобнее Python, ниже приведён надёжный пример с использованием requests, который отправляет задание на видео и опрашивает его до завершения (замените плейсхолдеры). Это практичный шаблон: отправка → опрос → загрузка. Пример намеренно простой и должен быть адаптирован к вашей продакшн-системе async/job.

import time
import requests

API_KEY = "sk-YOUR_COMETAPI_KEY"
BASE = "https://api.cometapi.com"
HEADERS = {"Authorization": f"Bearer {API_KEY}", "Content-Type": "application/json"}

payload = {
    "prompt": "https://cdn.midjourney.com/example/0_0.png Спокойная городская улица — камера панорамирует влево, идёт дождь",
    "videoType": "vid_1.1_i2v_480",
    "mode": "fast",
    "animateMode": "manual",
    "motion": "low",
    "bs": 1
}

# Отправка задания
r = requests.post(f"{BASE}/mj/submit/video", json=payload, headers=HEADERS)
r.raise_for_status()
job = r.json()
job_id = job.get("id") or job.get("job_id")

# Опрос до завершения (пример опроса)
status_url = f"{BASE}/mj/status/{job_id}"
for _ in range(60):  # опрос до ~60 раз
    s = requests.get(status_url, headers=HEADERS)
    s.raise_for_status()
    st = s.json()
    if st.get("status") == "completed":
        download_url = st.get("result", {}).get("video_url")
        print("Видео готово:", download_url)
        break
    elif st.get("status") in ("failed", "error"):
        raise RuntimeError("Сбой генерации видео: " + str(st))
    time.sleep(2)

How do I add audio (voice, music, sound effects) to a Midjourney/CometAPI video?

Does Midjourney produce audio natively?

Нет — в версии V1 видео Midjourney без звука (MP4 без встроенного аудио). Пользователи добавляют звук отдельно. (Существуют другие ИИ-системы, которые генерируют аудио и видео вместе, но Midjourney V1 сосредоточена на визуальном движении.)

Recommended pipelines to add voice and sound

Text-to-Speech (TTS) для дикторского текста/голоса — используйте ElevenLabs, Replica или аналогичные сервисы клонов голоса/ТТС для генерации речевых дорожек по скриптам. Эти сервисы позволяют получать естественную речь и порой по низкой цене за минуту. (Посты в LinkedIn/сообществе рекомендуют ElevenLabs как лёгкое решение для озвучки.)
Инструменты ИИ-аудиодизайна для музыки/SFX — такие как MM Audio, Magicshot или специализированные генераторы SFX могут создать фоновые атмосферы и эффекты, подходящие под клип. Руководства сообщества и туториалы показывают хорошее качество у MM Audio и других аудио-ИИ.
Ручной подход в DAW/редакторе (тонкий контроль) — импортируйте сгенерированный MP4 в DaVinci Resolve / Premiere / Audacity, добавьте ТТС-аудио, звуковые эффекты и выполните микс. Это лучший путь для точной липсинхронизации и тайминга. Обучающие материалы сообщества и YouTube-прохождения показывают пошаговые приёмы совмещения звука с видео Midjourney.

Quick example: combine audio + video with `ffmpeg`

Предполагая, что у вас есть video.mp4 (без звука) и speech.mp3 (ТТС):

# Нормализуйте длину аудио (опционально), затем объедините:
ffmpeg -i video.mp4 -i speech.mp3 -c:v copy -c:a aac -shortest output_with_audio.mp4

Для более продвинутых миксов (фон + диалоги + звуковые эффекты) выведите единую сведённую аудиодорожку из вашей DAW и затем замультиплексируйте её в видео, как показано выше.

How should I write motion prompts to control animation?

Motion prompt patterns

Промптинг движения в Midjourney V1 управляется естественным языком. Полезные шаблоны:

Направление/действие: «камера едет влево, пока субъект идёт вперёд»
Движение объекта: «лист падает с дерева и плывёт к камере»
Инструкция камере: «медленный зум внутрь, лёгкий параллакс, скорость 2x»
Временная характеристика: «деликатное движение, зацикливаемое, кинематографичный ритм»

Начните с краткого предложения о движении, затем добавьте прилагательные для стиля и тайминга: например, "start_frame_url animate: 'медленная спиральная камера, субъект мягко покачивается, зацикливаемо', style: 'зерно плёнки, кинематографично, темп 2 fps'". Эксперименты и небольшие итерации — ключ к результату.

Manual vs automatic animation

Автоматическая: Позвольте модели вывести правдоподобное движение. Лучше для быстрых экспериментов.
Ручная: Задавайте явные траектории камеры и векторы движения субъекта для стабильных, воспроизводимых результатов — полезно, когда нужна предсказуемая хореография или соответствие лайв-экшн-кадрам.

How do I extend videos, change batch size, or create loops?

Extending video length

После генерации Midjourney (и обёртки вроде CometAPI) предоставляют элементы управления «Extend». В интерфейсе Midjourney можно продлить 5-секундный клип по 4 секунды за раз (до ~21 секунды). Программно вы либо вызываете ту же конечную точку с флагом extend, либо отправляете новое задание расширения со ссылкой на исходный клип (в документации CometAPI показаны параметризованные конечные точки и кнопки в обзоре). Ожидайте, что стоимость продления сопоставима с первоначальной генерацией.

Creating looped videos or specifying end frames

Для зацикливания используйте стартовый кадр в качестве конечного или добавьте параметр --loop.
Для иного конечного кадра предоставьте другой URL изображения (как end) и убедитесь в совместимости соотношений сторон. Midjourney поддерживает параметр --end. Рассмотрите «ручное» продление, чтобы корректировать промпты по ходу расширения для сохранения непрерывности.

Batch size and cost control

Midjourney по умолчанию генерирует несколько вариантов (размер батча 4). Для продакшна или экономии установите bs:1, чтобы снизить вычислительные затраты. В документации Midjourney есть оценки времени GPU для SD vs HD и разных размеров батча (полезно для прогнозирования стоимости). CometAPI предлагает конкурентные цены.

Conclusion

Видеомодель Midjourney V1 — первый публичный шаг к программируемому видео: она консервативна по замыслу, но многообещающа. Ожидаются итеративные обновления модели с улучшением длины последовательностей, качества и управляемости движением камеры. Роль CometAPI как агрегатора снижает барьер интеграции для разработчиков, желающих добавить видео Midjourney в приложения без необходимости разбираться с аутентификацией и конкуррентностью у разных провайдеров.

Разработчики могут получить доступ к MIdjourney Video API через CometAPI. Чтобы начать, изучите возможности моделей CometAPI в Playground и обратитесь к руководству по API за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили API-ключ. CometAPI предлагает цену, значительно ниже официальной, чтобы упростить интеграцию.

Готовы начать?→ Бесплатная пробная версия Midjourney!

What is Midjourney V1

What Midjourney V1 does and how it’s surfaced to users

How CometAPI surfaces the Midjourney Video model

How do I prepare before I call the API?

What credentials and accounts do I need?

What decisions to make up front

How do I call CometAPI’s Midjourney video endpoint (step-by-step with examples)?

What’s the minimal request payload?

Python example (requests)

How do I add audio (voice, music, sound effects) to a Midjourney/CometAPI video?

Does Midjourney produce audio natively?

Recommended pipelines to add voice and sound

Quick example: combine audio + video with `ffmpeg`

How should I write motion prompts to control animation?

Motion prompt patterns

Manual vs automatic animation

How do I extend videos, change batch size, or create loops?

Extending video length

Creating looped videos or specifying end frames

Batch size and cost control

Conclusion

Готовы сократить затраты на AI-разработку на 20%?

Читать далее

Как создать видео в API Midjourney?

What is Midjourney V1

What Midjourney V1 does and how it’s surfaced to users

How CometAPI surfaces the Midjourney Video model

How do I prepare before I call the API?

What credentials and accounts do I need?

What decisions to make up front

How do I call CometAPI’s Midjourney video endpoint (step-by-step with examples)?

What’s the minimal request payload?

Python example (requests)

How do I add audio (voice, music, sound effects) to a Midjourney/CometAPI video?

Does Midjourney produce audio natively?

Recommended pipelines to add voice and sound

Quick example: combine audio + video with ffmpeg

How should I write motion prompts to control animation?

Motion prompt patterns

Manual vs automatic animation

How do I extend videos, change batch size, or create loops?

Extending video length

Creating looped videos or specifying end frames

Batch size and cost control

Conclusion

Готовы сократить затраты на AI-разработку на 20%?

Читать далее

Quick example: combine audio + video with `ffmpeg`