為什麼我的旅程中圖片是 jpg 圖片

CometAPI
AnnaJun 13, 2025
為什麼我的旅程中圖片是 jpg 圖片

最近幾週,兩大事件讓 Midjourney 再次成為人們關注的焦點:備受期待的 V7 模型 Alpha 版本發布,以及迪士尼和環球影業提起的備受矚目的版權訴訟。儘管 V7 承諾大幅提升影像質量,但許多用戶在保存和分享作品時仍然會遇到意想不到的 JPEG「塊狀」或「振鈴」偽影。本文將探討這些偽影的根本原因,解釋 JPEG 壓縮的工作原理,並提供一些實用策略,幫助您最大限度地減少 Midjourney 產生的影像中不必要的失真。

Midjourney V7 是什麼?

Midjourney V7 代表了一年多來首次徹底的模型重新設計,帶來了更快的吞吐量、更聰明的快速解釋和增強的視覺保真度。

V7 中的關鍵改進

  • 增強細節和連貫性:根據 Midjourney 的發布說明,與 V7 相比,V6.1 提供了更高的紋理分辨率和更一致的複雜元素渲染 - 手、織物褶皺和自然景觀都表現出更平滑的漸變和更精細的細節。
  • 預設個性化:V7 是首個預設模型「個人化」的 Midjourney 模型,要求使用者對大約 200 張樣本圖像進行評分,以解鎖完全個人化的體驗。這種回饋循環有助於系統更好地根據個人美學偏好調整輸出。

Alpha 版本和社區訪問

Midjourney 於 7 年 2025 月初開放了 VXNUMX 進行 alpha 測試。社區成員可以透過在 --v 7 標記到他們的提示或透過專用的 V7 頻道。此 Alpha 版本允許在全面公開發布之前對模型的核心改進(快速理解、影像品質和連貫性)進行更廣泛的測試。

為什麼我在 Midjourney 影像中看到 JPEG 偽影?

儘管 V7 內部採用基於 PNG 的渲染,但許多用戶仍然會報告 JPEG 風格的壓縮失真。這些可見的失真通常出現在下游處理過程中,尤其是在 Discord 等平台上。

內部 PNG 產生和外部 JPEG 轉換

Midjourney 本身會產生並以無損 PNG 格式儲存影像,確保模型的完整細節和細微的漸變效果得以保留。然而,當這些文件在 Discord 上分享或透過某些連結下載時,它們可能會轉換為有損格式(JPEG 或 WebP),以節省頻寬。

Discord 的自動壓縮

預設情況下,Discord 會重新編碼大型影像以減少檔案大小,通常使用 JPEG 或 WebP 壓縮。此自動化步驟會引入區塊邊界偽影(「宏塊」)和輕微的色偏,這在平滑漸變或均勻背景區域中尤其明顯。

工作流程引發的再壓縮

儘管 Midjourney 內部會產生並以無損 PNG 格式甚至更高精度的格式儲存影像,但當您選擇「另存為 JPEG」或透過自動轉換為 JPEG 的平台(例如某些網路圖庫、社群媒體)分享時,偽影就會出現。 Discord 的圖像代理、瀏覽器將預覽儲存為 WebP 格式以及透過右鍵點擊「將圖像儲存為...」進行轉換都會觸發重新壓縮。每個重新壓縮步驟都會累積生成損失:在預設品質設定(通常在 75% 到 85% 左右)下進行裁剪、調整大小或重新編碼會放大塊狀和條帶現象。

JPEG 壓縮如何產生偽影?

了解 JPEG 編碼的技術基礎可以闡明偽影出現的原因以及如何解決它們。

基於區塊的DCT和量化

JPEG 壓縮的工作原理是將影像分成 8×8 像素區塊,並對每個區塊應用離散餘弦轉換 (DCT)。為了減小檔案大小,它會量化高頻分量,從而有效地丟棄精細細節。當量化等級過高(即壓縮程度過高)時,此過程會導致可見的塊邊界、紋理丟失和色帶。如果 AI 產生的影像(尤其是具有複雜漸變和精細紋理的影像)在儲存或傳輸為 JPEG 格式且品質設定不足時,很容易出現這些偽影。

常見工件類型

  • 阻塞(宏塊):當整個 8×8 塊變得明顯不同時,就會形成「棋盤」圖案。
  • 振鈴/輪廓效果:由於高頻分量損失而導致尖銳邊緣出現光暈狀扭曲。
  • 色帶:當細微的差別消除後,平滑的漸變會退化為離散的色彩「帶」。

Midjourney 支援哪些文件格式?它們最近有何變化?

Midjourney 原生的格式有哪些?

Midjourney 預設提供高解析度 PNG 檔案——無損、每通道 8 位元(24 位元 RGB)影像,可保留每個像素值。當您進行升級或使用「輕度升級」模式時,您仍然可以透過網頁圖庫下載按鈕 取得 PNG 檔案。但是,Discord 中直接顯示的預覽縮圖將以 WebP(一種現代有損/可選無損格式)格式呈現,以加快載入速度。根據您的瀏覽器或 Discord 用戶端,右鍵點擊下載可能會取得 WebP 縮圖,而不是完整的 PNG 檔案。

為什麼有些用戶突然遇到 JPEG 輸出?

有幾個因素導致非自願的 JPEG 轉換:

  1. 第三方管道: 如果您透過預設將 Midjourney 影像儲存為 JPG 格式以容納較小負載的機器人或自動化工具來路由 Midjourney 影像,那麼您將繼承工件。
  2. 批次腳本: 一些社區升級器(例如,用於穩定擴散的 Automatic1111)以與輸入相同的格式保存輸出 - 如果在 JPG 之後鏈接,則將最終的 PNG 轉換回 JPG。
  3. 平台預設設定: Instagram 或 Twitter 等社群媒體平台會自動將用戶上傳的內容壓縮為基於 JPEG 的格式,從而進一步降低影像品質。

如何最大程度減少影像中的 JPEG 偽影?

雖然您無法變更 Discord 的預設壓縮策略,但您可以最佳化工作流程以保持影像保真度。

使用無損格式和更高位元率的匯出

  • 直接下載PNG:請務必從 Midjourney 網頁應用程式下載圖片的 PNG 版本,而不是依賴 Discord 預覽。 PNG 可以避免 JPEG 的量化缺陷。
  • 指定更高品質:如果必須使用 JPEG(用於網路傳送等),請以 90–100% 的質量設定導出,以保留更多 DCT 係數並減少可見的區塊邊界。

調整工作流程以避免重新壓縮

  • 繞過 Discord 的預覽層:在 Discord 中,替換來自 media.discordapp.net - cdn.discordapp.com 存取原始上傳內容而無需預覽壓縮。
  • 保持單步壓縮:只需在編輯器中開啟一次原始 PNG;如果需要 JPEG,則直接匯出,無需進行其他編輯或重新儲存。

利用人工智慧技術去除偽影

最近的研究已經提出了基於擴散的模型,這些模型可以選擇性地去除 JPEG 偽影,同時保留細節。例如,CODiff 模型採用壓縮感知視覺嵌入器 (CaVE) 來引導一步式擴散降噪器,以最小的開銷實現了最先進的偽影消除效果。

在 CometAPI 中使用 MidJourney

CometAPI 提供超過 500 種 AI 模型,包括用於聊天、映像、程式碼等的開源和專用多模式模型。其主要優勢在於簡化傳統上複雜的人工智慧整合過程。

彗星API 提供遠低於官方價格的價格,幫助您整合 Midjourney API,註冊登入後即可在帳號中免費試用!歡迎註冊體驗CometAPI。 CometAPI採用即用即付的方式。

重要先決條件: 在使用 MidJourney V7 之前,您需要開始建造 CometAPI 立即註冊 此處可免費存取。請訪問 文檔.

開始使用 MidJourney V7 非常簡單 - 只需添加 --v 7 提示末尾的參數。這個簡單的指令告訴 CometAPI 使用最新的 V7 模型來產生你的映像。

請參閱 Midjourney API 了解整合詳情。


結論

透過了解 JPEG 偽影在 Midjourney 工作流程中的位置和原因,您可以採取切實可行的措施來充分發揮模型的創作潛力。無論是透過策略性地使用 PNG、簡化的匯出流程,還是使用先進的偽影去除工具,您都可以展現 V7 卓越的保真度,而無需擔心有損壓縮帶來的副作用。

閱讀更多

一個 API 中超過 500 個模型

最高 20% 折扣