近几周,两个重大进展让 Midjourney 再次成为焦点:久候已久的 V7 模型 alpha 版本发布,以及由 Disney 和 Universal 提起的一起高调版权诉讼。尽管 V7 承诺在图像质量上大幅提升,许多用户在保存与分享作品时仍会遇到意料之外的 JPEG“块状感”或“振铃”伪影。本文将探讨这些伪影的根源,解释 JPEG 压缩的工作原理,并提供可行策略,以尽量减少 Midjourney 生成图像中的不必要失真。
什么是 Midjourney V7?
Midjourney V7 是一年多来首次从零开始的模型重设计,引入更快的吞吐、更智能的提示解析以及更高的视觉保真度。
V7 的关键改进
- 细节与一致性增强:根据 Midjourney 的发布说明,V7 提供显著更高的纹理分辨率,并在复杂元素的呈现上更为一致——与 V6.1 相比,手部、布料褶皱与自然景观的渐变更平滑、细节更精细。
- 默认个性化:V7 是首个默认开启模型“个性化”的 Midjourney 版本,用户需要对约 200 张示例图像进行评分,方可解锁完整的个性化体验。该反馈循环有助于系统更好地将输出与个人审美偏好对齐。
Alpha 版本发布与社区访问
Midjourney 于 2025 年 4 月上旬开放 V7 的 alpha 测试。社区成员可在提示末尾追加 --v 7 标志或通过专用 V7 频道访问该新模型。本次 alpha 发布允许在全面公开之前,对模型的核心改进——提示理解、图像质量与一致性——进行更广泛的测试。
为什么我的 Midjourney 图像会出现 JPEG 伪影?
尽管 V7 内部采用 PNG 渲染,许多用户仍报告出现 JPEG 风格的压缩伪影。这些可见失真通常源于下游处理——尤其是在 Discord 等平台上。
内部 PNG 生成与外部 JPEG 转换
Midjourney 自身以无损 PNG 格式生成并存储图像,确保模型的全部细节与微妙渐变得以保留。然而,当这些文件在 Discord 上被分享或通过某些链接下载时,可能会被转换为有损格式(JPEG 或 WebP),以提升带宽效率。
Discord 的自动压缩
默认情况下,Discord 会重新编码大图以减少文件大小,通常使用 JPEG 或 WebP 压缩。此自动步骤会引入块边界伪影(“宏块化”)与轻微的色偏,尤其在平滑渐变或统一背景区域中更为明显。
工作流导致的二次压缩
尽管 Midjourney 在内部以无损 PNG 或更高精度表示生成并存储图像,但当你选择“另存为 JPEG”或通过会自动转换为 JPEG 的平台分享(如某些网页图库、社交媒体)时,伪影便会出现。Discord 的图像代理、浏览器将预览保存为 WebP,以及右键“另存为图片”触发的转换,都会导致重新压缩。每一次重新压缩都会累积代际损失:裁剪、缩放,或在默认质量(通常约 75–85%)下重新编码,都会加剧块状与色带化问题。
JPEG 压缩如何产生伪影?
理解 JPEG 编码的技术基础有助于解释伪影的来源以及应对之道。
基于块的 DCT 与量化
JPEG 压缩通过将图像划分为 8×8 像素块,并对每个块应用离散余弦变换(DCT)。为减少文件体积,它会对高频分量进行量化——本质上舍弃细微细节。当量化水平过高(即压缩更强)时,会导致可见的块边界、纹理损失与颜色带状化。AI 生成图像,尤其是具有复杂渐变与精细纹理的内容,如果在未充分质量设置的情况下保存或传输为 JPEG,极易出现这些伪影。
常见伪影类型
- 阻塞(宏块化):当整个 8×8 块变得可见而相互区分,形成“棋盘格”样的图案。
- 振铃/轮廓效应:沿锐利边缘出现的光环状失真,源于高频分量的损失。
- 色带化:平滑渐变在细微差异被消除后退化为离散的颜色“带”。
Midjourney 支持哪些文件格式,最近有何变化?
Midjourney 的原生格式有哪些?
默认情况下,Midjourney 提供高分辨率 PNG 文件——无损、每通道 8 位(24 位 RGB)的图像,保留每个像素值。当你进行放大或使用 “Light Upscale” 模式时,仍可通过网页图库的下载按钮获得 PNG。然而,在 Discord 中直接显示的预览缩略图会以 WebP(现代的有损/可选无损格式)提供,以加快加载速度。根据你的浏览器或 Discord 客户端,右键下载可能会抓取 WebP 缩略图,而非完整 PNG。
为什么一些用户突然遇到 JPEG 输出?
- 第三方管线:若通过默认保存为 JPG 以减小负载的机器人或自动化工具路由 Midjourney 图像,你将继承伪影。
- 批处理脚本:某些社区放大器(如 Stable Diffusion 的 Automatic1111)会以与输入相同的格式保存输出——一旦在 JPG 后串联,最终 PNG 会被重新变成 JPG。
- 平台默认:Instagram 或 Twitter 等社交平台会自动将用户上传压缩为基于 JPEG 的格式,进一步降低图像质量。
如何尽量减少图像中的 JPEG 伪影?
虽然你无法更改 Discord 的默认压缩策略,但可以优化工作流以保留图像保真度。
使用无损格式与更高质量导出
- 直接下载 PNG:始终从 Midjourney 网页应用下载图像的 PNG 版本,而非依赖 Discord 预览。PNG 可避免 JPEG 的量化陷阱。
- 指定更高质量:若必须使用 JPEG(用于网页投放等),请以 90–100% 的质量导出,以保留更多 DCT 系数并减少可见块边界。
调整工作流以避免二次压缩
- 绕过 Discord 的预览层:在 Discord 中,将链接由
media.discordapp.net替换为cdn.discordapp.com,即可在无预览压缩的情况下访问原始上传。 - 保持单次压缩:只在编辑器中打开你的原始 PNG 一次;如需 JPEG,请直接导出,不要进行额外编辑或重复保存。
利用 AI 驱动的伪影去除
最新研究已提出可选择性去除 JPEG 伪影且保留细节的扩散模型。例如,CODiff 使用压缩感知视觉嵌入器(CaVE)引导一步扩散去噪器,以极低开销实现业界领先的伪影减弱效果。
在 CometAPI 中使用 MidJourney
CometAPI 提供对 500+ AI 模型的访问,包括开源与专用的多模态模型(聊天、图像、代码等)。其主要优势在于简化传统复杂的 AI 集成流程。
CometAPI 提供远低于官方价格的方案,帮助你集成 Midjourney API,注册并登录后即可在账户中免费试用!欢迎注册体验 CometAPI。CometAPI 按需计费。
重要前提: 在使用 MidJourney V7 之前,你需要在此处 CometAPI today – sign up 免费注册开启构建。请访问 文档。
开始使用 MidJourney V7 非常简单——只需在提示末尾添加 --v 7 参数。这个简单的命令会告诉 CometAPI 使用最新的 V7 模型来生成你的图像。
集成细节请参阅 Midjourney API。
结论
通过理解 JPEG 伪影在你的 Midjourney 工作流中出现的环节与原因,你可以采取切实可行的步骤来保留模型的全部创造潜力。无论是战略性地使用 PNG、精简导出流程,还是采用前沿的伪影去除工具,都能在避免有损压缩副作用的同时,展现 V7 的非凡保真度。
