为什么我的 Midjourney 图片出现 jpg 伪影？

近几周，两个重大进展让 Midjourney 再次成为焦点：久候已久的 V7 模型 alpha 版本发布，以及由 Disney 和 Universal 提起的一起高调版权诉讼。尽管 V7 承诺在图像质量上大幅提升，许多用户在保存与分享作品时仍会遇到意料之外的 JPEG“块状感”或“振铃”伪影。本文将探讨这些伪影的根源，解释 JPEG 压缩的工作原理，并提供可行策略，以尽量减少 Midjourney 生成图像中的不必要失真。

什么是 Midjourney V7？

Midjourney V7 是一年多来首次从零开始的模型重设计，引入更快的吞吐、更智能的提示解析以及更高的视觉保真度。

V7 的关键改进

细节与一致性增强：根据 Midjourney 的发布说明，V7 提供显著更高的纹理分辨率，并在复杂元素的呈现上更为一致——与 V6.1 相比，手部、布料褶皱与自然景观的渐变更平滑、细节更精细。
默认个性化：V7 是首个默认开启模型“个性化”的 Midjourney 版本，用户需要对约 200 张示例图像进行评分，方可解锁完整的个性化体验。该反馈循环有助于系统更好地将输出与个人审美偏好对齐。

Alpha 版本发布与社区访问

Midjourney 于 2025 年 4 月上旬开放 V7 的 alpha 测试。社区成员可在提示末尾追加 --v 7 标志或通过专用 V7 频道访问该新模型。本次 alpha 发布允许在全面公开之前，对模型的核心改进——提示理解、图像质量与一致性——进行更广泛的测试。

为什么我的 Midjourney 图像会出现 JPEG 伪影？

尽管 V7 内部采用 PNG 渲染，许多用户仍报告出现 JPEG 风格的压缩伪影。这些可见失真通常源于下游处理——尤其是在 Discord 等平台上。

内部 PNG 生成与外部 JPEG 转换

Midjourney 自身以无损 PNG 格式生成并存储图像，确保模型的全部细节与微妙渐变得以保留。然而，当这些文件在 Discord 上被分享或通过某些链接下载时，可能会被转换为有损格式（JPEG 或 WebP），以提升带宽效率。

Discord 的自动压缩

默认情况下，Discord 会重新编码大图以减少文件大小，通常使用 JPEG 或 WebP 压缩。此自动步骤会引入块边界伪影（“宏块化”）与轻微的色偏，尤其在平滑渐变或统一背景区域中更为明显。

工作流导致的二次压缩

尽管 Midjourney 在内部以无损 PNG 或更高精度表示生成并存储图像，但当你选择“另存为 JPEG”或通过会自动转换为 JPEG 的平台分享（如某些网页图库、社交媒体）时，伪影便会出现。Discord 的图像代理、浏览器将预览保存为 WebP，以及右键“另存为图片”触发的转换，都会导致重新压缩。每一次重新压缩都会累积代际损失：裁剪、缩放，或在默认质量（通常约 75–85%）下重新编码，都会加剧块状与色带化问题。

JPEG 压缩如何产生伪影？

理解 JPEG 编码的技术基础有助于解释伪影的来源以及应对之道。

基于块的 DCT 与量化

JPEG 压缩通过将图像划分为 8×8 像素块，并对每个块应用离散余弦变换（DCT）。为减少文件体积，它会对高频分量进行量化——本质上舍弃细微细节。当量化水平过高（即压缩更强）时，会导致可见的块边界、纹理损失与颜色带状化。AI 生成图像，尤其是具有复杂渐变与精细纹理的内容，如果在未充分质量设置的情况下保存或传输为 JPEG，极易出现这些伪影。

常见伪影类型

阻塞（宏块化）：当整个 8×8 块变得可见而相互区分，形成“棋盘格”样的图案。
振铃/轮廓效应：沿锐利边缘出现的光环状失真，源于高频分量的损失。
色带化：平滑渐变在细微差异被消除后退化为离散的颜色“带”。

Midjourney 支持哪些文件格式，最近有何变化？

Midjourney 的原生格式有哪些？

默认情况下，Midjourney 提供高分辨率 PNG 文件——无损、每通道 8 位（24 位 RGB）的图像，保留每个像素值。当你进行放大或使用 “Light Upscale” 模式时，仍可通过网页图库的下载按钮获得 PNG。然而，在 Discord 中直接显示的预览缩略图会以 WebP（现代的有损/可选无损格式）提供，以加快加载速度。根据你的浏览器或 Discord 客户端，右键下载可能会抓取 WebP 缩略图，而非完整 PNG。

为什么一些用户突然遇到 JPEG 输出？

第三方管线：若通过默认保存为 JPG 以减小负载的机器人或自动化工具路由 Midjourney 图像，你将继承伪影。
批处理脚本：某些社区放大器（如 Stable Diffusion 的 Automatic1111）会以与输入相同的格式保存输出——一旦在 JPG 后串联，最终 PNG 会被重新变成 JPG。
平台默认：Instagram 或 Twitter 等社交平台会自动将用户上传压缩为基于 JPEG 的格式，进一步降低图像质量。

如何尽量减少图像中的 JPEG 伪影？

虽然你无法更改 Discord 的默认压缩策略，但可以优化工作流以保留图像保真度。

使用无损格式与更高质量导出

直接下载 PNG：始终从 Midjourney 网页应用下载图像的 PNG 版本，而非依赖 Discord 预览。PNG 可避免 JPEG 的量化陷阱。
指定更高质量：若必须使用 JPEG（用于网页投放等），请以 90–100% 的质量导出，以保留更多 DCT 系数并减少可见块边界。

调整工作流以避免二次压缩

绕过 Discord 的预览层：在 Discord 中，将链接由 media.discordapp.net 替换为 cdn.discordapp.com，即可在无预览压缩的情况下访问原始上传。
保持单次压缩：只在编辑器中打开你的原始 PNG 一次；如需 JPEG，请直接导出，不要进行额外编辑或重复保存。

利用 AI 驱动的伪影去除

最新研究已提出可选择性去除 JPEG 伪影且保留细节的扩散模型。例如，CODiff 使用压缩感知视觉嵌入器（CaVE）引导一步扩散去噪器，以极低开销实现业界领先的伪影减弱效果。

在 CometAPI 中使用 MidJourney

CometAPI 提供对 500+ AI 模型的访问，包括开源与专用的多模态模型（聊天、图像、代码等）。其主要优势在于简化传统复杂的 AI 集成流程。

CometAPI 提供远低于官方价格的方案，帮助你集成 Midjourney API，注册并登录后即可在账户中免费试用！欢迎注册体验 CometAPI。CometAPI 按需计费。

重要前提： 在使用 MidJourney V7 之前，你需要在此处 CometAPI today – sign up 免费注册开启构建。请访问文档。

开始使用 MidJourney V7 非常简单——只需在提示末尾添加 --v 7 参数。这个简单的命令会告诉 CometAPI 使用最新的 V7 模型来生成你的图像。

集成细节请参阅 Midjourney API。

结论

通过理解 JPEG 伪影在你的 Midjourney 工作流中出现的环节与原因，你可以采取切实可行的步骤来保留模型的全部创造潜力。无论是战略性地使用 PNG、精简导出流程，还是采用前沿的伪影去除工具，都能在避免有损压缩副作用的同时，展现 V7 的非凡保真度。