Почему мои изображения Midjourney jpg являются артефактами

CometAPI
AnnaJun 13, 2025
Почему мои изображения Midjourney jpg являются артефактами

За последние недели два крупных события вернули Midjourney в центр внимания: долгожданный альфа-релиз модели V7 и громкий иск об авторских правах, поданный Disney и Universal. Хотя V7 обещает кардинальные улучшения качества изображения, многие пользователи продолжают сталкиваться с неожиданными артефактами «блочности» или «звона» JPEG при сохранении и распространении своих творений. В этой статье рассматриваются основные причины этих артефактов, объясняется, как работает сжатие JPEG, и предлагаются практические стратегии для минимизации нежелательных искажений в изображениях, созданных Midjourney.

Что такое Midjourney V7?

Midjourney V7 представляет собой первую за последний год полную переработку модели, обеспечивающую более высокую производительность, более интеллектуальную интерпретацию подсказок и улучшенную визуальную точность.

Ключевые улучшения в V7

  • Улучшенная детализация и согласованность: Согласно примечаниям к выпуску Midjourney, V7 обеспечивает значительно более высокое разрешение текстур и более последовательную визуализацию сложных элементов — руки, складки ткани и природные ландшафты — все они демонстрируют более плавные градиенты и более мелкие детали по сравнению с V6.1.
  • Персонализация по умолчанию: V7 — первая модель Midjourney с «персонализацией» модели по умолчанию, требующая от пользователей оценить около 200 образцов изображений, чтобы разблокировать полностью персонализированный опыт. Этот цикл обратной связи помогает системе лучше согласовывать выходные данные с индивидуальными эстетическими предпочтениями.

Альфа-релиз и доступ сообщества

Midjourney открыла V7 для альфа-тестирования в начале апреля 2025 года. Участники сообщества могут получить доступ к новой модели, добавив --v 7 флаг на их подсказки или через выделенный канал V7. Этот альфа-релиз позволяет более широко протестировать основные улучшения модели — понимание подсказок, качество изображения и согласованность — перед полным публичным развертыванием.

Почему на изображениях Midjourney видны артефакты JPEG?

Несмотря на внутренний рендеринг V7 на основе PNG, многие пользователи все еще сообщают об артефактах сжатия в стиле JPEG. Эти видимые искажения обычно возникают во время обработки в нисходящем направлении — особенно на таких платформах, как Discord.

Внутренняя генерация PNG и внешнее преобразование JPEG

Midjourney сам генерирует и сохраняет изображения в формате PNG без потерь, гарантируя сохранение полной детализации модели и тонких градиентов. Однако, когда эти файлы публикуются на Discord или загружаются по определенным ссылкам, они могут быть преобразованы в форматы с потерями (JPEG или WebP) для эффективности пропускной способности.

Автоматическое сжатие Discord

По умолчанию Discord перекодирует большие изображения для уменьшения размера файла, часто используя сжатие JPEG или WebP. Этот автоматизированный шаг вносит артефакты границ блоков («макроблокинг») и небольшие цветовые сдвиги, которые могут быть особенно заметны в плавных градиентах или однородных фоновых областях.

Рекомпрессия, вызванная рабочим процессом

Хотя Midjourney генерирует и хранит изображения внутри как PNG без потерь или даже в более точных представлениях, в тот момент, когда вы выбираете «Сохранить как JPEG» или делитесь через платформы, которые автоматически конвертируют в JPEG (например, некоторые веб-галереи, социальные сети), появляются артефакты. Прокси-сервер изображений Discord, браузеры, сохраняющие предварительные просмотры как WebP, и преобразование через щелчок правой кнопкой мыши «Сохранить изображение как…» — все это запускает повторное сжатие. Каждый шаг повторного сжатия накапливает потери генерации: обрезка, изменение размера или повторное кодирование при настройках качества по умолчанию (часто около 75–85%) усиливают блокировку и полосатость.

Почему сжатие JPEG приводит к появлению артефактов?

Понимание технических основ кодирования JPEG проливает свет на причины появления артефактов и способы борьбы с ними.

Блочное DCT и квантование

Сжатие JPEG работает путем деления изображения на блоки размером 8×8 пикселей и применения дискретного косинусного преобразования (DCT) к каждому блоку. Чтобы уменьшить размер файла, он квантует высокочастотные компоненты, эффективно отбрасывая мелкие детали. Когда уровень квантования слишком высок (т. е. более сильное сжатие), этот процесс приводит к видимым границам блоков, потере текстуры и цветовой полосатости. Изображения, созданные ИИ, особенно со сложными градиентами и мелкими текстурами, очень восприимчивы к этим артефактам, если сохраняются или передаются как JPEG без достаточных настроек качества.

Распространенные типы артефактов

  • Блокировка (макроблокировка): Когда целые блоки 8×8 становятся визуально различимыми, создавая узор «шахматной доски».
  • Эффекты звона/контура: Искажения в виде ореола вдоль острых краев, возникающие из-за потери высокочастотных компонентов.
  • Цветовая маркировка: Плавные градиенты переходят в дискретные «полосы» цвета, когда устраняются тонкие различия.

Какие форматы файлов поддерживает Midjourney и как они изменились в последнее время?

Какие форматы поддерживаются Midjourney?

По умолчанию Midjourney предоставляет файлы PNG с высоким разрешением — изображения без потерь, 8 бит на канал (24 бит RGB), которые сохраняют каждое значение пикселя. При масштабировании или использовании режимов «Light Upscale» вы все равно получаете PNG через кнопку загрузки веб-галереи. Однако миниатюры предварительного просмотра, отображаемые непосредственно в Discord, обслуживаются как WebP (современный формат с потерями/необязательный формат без потерь) для ускорения загрузки. В зависимости от вашего браузера или клиента Discord, загрузки правой кнопкой мыши могут захватывать миниатюру WebP, а не полный PNG.

Почему некоторые пользователи внезапно столкнулись с файлами в формате JPEG?

Несколько факторов приводят к непреднамеренному преобразованию JPEG:

  1. Сторонние конвейеры: Если вы перенаправляете изображения Midjourney через ботов или инструменты автоматизации, которые по умолчанию сохраняют в формате JPG для небольших полезных данных, вы наследуете артефакты.
  2. Скрипты пакетной обработки: Некоторые сторонние программы повышения разрешения (например, Automatic1111 для Stable Diffusion) сохраняют выходные данные в том же формате, что и входные данные, преобразуя конечные PNG-файлы обратно в JPG, если они присоединены после JPG.
  3. Настройки платформы по умолчанию: Социальные сети, такие как Instagram или Twitter, автоматически сжимают загружаемые пользователями файлы в форматы на основе JPEG, что еще больше ухудшает качество изображения.

Как можно минимизировать артефакты JPEG на изображениях?

Хотя вы не можете изменить политику сжатия Discord по умолчанию, вы можете оптимизировать свой рабочий процесс, чтобы сохранить точность изображений.

Используйте форматы без потерь и экспорт с более высоким битрейтом

  • Прямые загрузки PNG: Всегда загружайте PNG-версию изображения из веб-приложения Midjourney, а не полагайтесь на предварительные просмотры Discord. PNG избегает ловушек квантования JPEG.
  • Укажите более высокое качество: Если вам необходимо использовать JPEG (для веб-публикации и т. д.), экспортируйте с настройкой качества 90–100%, чтобы сохранить больше коэффициентов DCT и уменьшить видимые границы блоков.

Измените свой рабочий процесс, чтобы избежать повторной компрессии

  • Обход слоя предварительного просмотра Discord: В Discord замените ссылки с media.discordapp.net cdn.discordapp.com для доступа к исходным загрузкам без предварительного сжатия.
  • Поддерживать одношаговое сжатие: Откройте исходный PNG-файл в редакторе всего один раз; если требуется JPEG-файл, экспортируйте его напрямую без дополнительных правок или повторных сохранений.

Используйте удаление артефактов с помощью искусственного интеллекта

Недавние исследования создали модели на основе диффузии, которые могут выборочно удалять артефакты JPEG, сохраняя детализацию. Например, модель CODiff использует визуальный встраиваемый модуль с поддержкой сжатия (CaVE) для управления одношаговым шумоподавителем диффузии, достигая передового снижения артефактов с минимальными накладными расходами.

Используйте MidJourney в CometAPI

CometAPI предоставляет доступ к более чем 500 моделям ИИ, включая модели с открытым исходным кодом и специализированные мультимодальные модели для чата, изображений, кода и т. д. Его главная сила заключается в упрощении традиционно сложного процесса интеграции ИИ.

CometAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться API в середине пути, и вы можете попробовать его бесплатно в своей учетной записи после регистрации и входа в систему! Добро пожаловать на регистрацию и знакомство с CometAPI.CometAPI платит по мере использования.

Важное предварительное условие: Перед использованием MidJourney V7 вам необходимо начать разработку CometAPI сегодня – зарегистрируйтесь здесь для свободного доступа. Пожалуйста, посетите Документы.

Начать работу с MidJourney V7 очень просто — просто добавьте --v 7 параметр в конце вашего приглашения. Эта простая команда сообщает CometAPI использовать последнюю модель V7 для генерации вашего изображения.

Пожалуйста, обратитесь к API в середине пути для получения подробной информации об интеграции.


Заключение

Понимая, где и почему артефакты JPEG попадают в ваш рабочий процесс Midjourney, вы можете предпринять конкретные шаги для сохранения полного творческого потенциала модели. Будь то стратегическое использование PNG, оптимизированные методы экспорта или передовые инструменты удаления артефактов, можно продемонстрировать замечательную точность V7 без нежелательных побочных эффектов сжатия с потерями.

Читать далее

500+ моделей в одном API

Скидка до 20%