なぜ私の旅の途中の画像はjpgアーティファクトになるのか

CometAPI
AnnaJun 13, 2025
なぜ私の旅の途中の画像はjpgアーティファクトになるのか

ここ数週間、Midjourneyは7つの大きな進展により再び注目を集めています。待望のV7モデルのアルファ版リリースと、ディズニーとユニバーサルによる著作権訴訟です。VXNUMXは画質の劇的な向上を約束する一方で、多くのユーザーが作品の保存や共有時に予期せぬJPEGの「ブロックノイズ」や「リンギング」といったアーティファクトに遭遇しています。この記事では、これらのアーティファクトの根本原因を探り、JPEG圧縮の仕組みを説明し、Midjourneyで生成された画像における不要な歪みを最小限に抑えるための実践的な戦略を紹介します。

Midjourney V7とは何ですか?

Midjourney V7 は、XNUMX 年以上ぶりにモデルを根本から再設計したもので、スループットの高速化、プロンプトの解釈のスマート化、視覚的な忠実度の強化を実現しています。

V7の主な改善点

  • 強化されたディテールと一貫性Midjourney のリリース ノートによると、V7 ではテクスチャ解像度が大幅に向上し、複雑な要素のレンダリングがより一貫性のあるものになり、手、布の折り目、自然の風景などはすべて、V6.1 と比較して、より滑らかなグラデーションと細かいディテールが表示されます。
  • デフォルトでのパーソナライゼーションV7は、デフォルトのモデル「パーソナライゼーション」を備えた初のMidjourneyモデルです。ユーザーは約200枚のサンプル画像を評価すると、完全にパーソナライズされた体験を体験できます。このフィードバックループにより、システムは出力結果を個人の美的嗜好により適切に合わせることができます。

アルファリリースとコミュニティアクセス

Midjourneyは7年2025月初旬にVXNUMXのアルファテストを開始しました。コミュニティメンバーは、 --v 7 プロンプトにフラグを付けるか、専用のV7チャンネルを通じてフィードバックを送信してください。このアルファリリースでは、モデルのコアとなる改善点(プロンプトの理解、画像品質、一貫性)を、完全な一般公開前により広範囲にテストすることができます。

Midjourney 画像に JPEG アーティファクトが表示されるのはなぜですか?

V7は内部的にPNGベースのレンダリングを採用しているにもかかわらず、多くのユーザーからJPEG風の圧縮アーティファクトが報告されています。これらの目に見える歪みは、特にDiscordのようなプラットフォームにおいて、下流処理中に発生するのが一般的です。

内部PNG生成と外部JPEG変換

Midjourney自体は、モデルのディテールと微妙なグラデーションを完全に保持するために、ロスレスPNG形式で画像を生成・保存します。ただし、これらのファイルがDiscordで共有されたり、特定のリンクからダウンロードされたりする場合は、帯域幅効率のために非可逆形式(JPEGまたはWebP)に変換される場合があります。

Discordの自動圧縮

Discordはデフォルトで、ファイルサイズを縮小するために大きな画像を再エンコードします。多くの場合、JPEGまたはWebP圧縮が使用されます。この自動処理により、ブロック境界のアーティファクト(「マクロブロッキング」)やわずかな色の変化が生じ、特に滑らかなグラデーションや均一な背景領域で目立つ場合があります。

ワークフロー誘導再圧縮

Midjourneyは内部的にロスレスPNGまたはさらに高精度な画像形式として画像を生成・保存しますが、「JPEGとして保存」を選択したり、JPEGに自動変換するプラットフォーム(一部のウェブギャラリーやソーシャルメディアなど)で共有したりすると、アーティファクトが発生します。Discordの画像プロキシ、ブラウザによるプレビューのWebP保存、右クリック「名前を付けて画像を保存」による変換はすべて再圧縮をトリガーします。再圧縮の各ステップで生成ロスが蓄積され、トリミング、サイズ変更、またはデフォルトの品質設定(通常は75~85%程度)での再エンコードによって、ブロッキングやバンディングが増幅されます。

JPEG 圧縮によってアーティファクトが生成される理由は何ですか?

JPEG エンコーディングの技術的な基礎を理解すると、アーティファクトが発生する理由とその対処方法が明らかになります。

ブロックベースのDCTと量子化

JPEG圧縮は、画像を8×8ピクセルのブロックに分割し、各ブロックに離散コサイン変換(DCT)を適用することで機能します。ファイルサイズを縮小するために、高周波成分を量子化し、実質的に微細なディテールを破棄します。量子化レベルが高すぎる(つまり、圧縮率が高すぎる)と、この処理によってブロック境界が目に見えるようになり、テクスチャが失われ、カラーバンディングが発生します。AI生成画像、特に複雑なグラデーションや微細なテクスチャを持つ画像は、十分な品質設定を行わずにJPEGとして保存または転送すると、これらのアーティファクトの影響を非常に受けやすくなります。

一般的なアーティファクトの種類

  • **ブロッキング(マクロブロッキング)**8×8 のブロック全体が視覚的に区別できるようになり、「チェッカーボード」パターンが作成されます。
  • リンギング/輪郭効果: 高周波成分の損失により、鋭いエッジに沿ってハローのような歪みが発生します。
  • カラーバンド: 微妙な違いがなくなると、滑らかなグラデーションは個別の色の「帯」に変わります。

Midjourney はどのようなファイル形式をサポートしていますか? また、最近はどのように変更されましたか?

Midjourney にネイティブな形式は何ですか?

Midjourneyはデフォルトで高解像度PNGファイル(ロスレス、チャンネルあたり8ビット(24ビットRGB)画像)を配信し、すべてのピクセル値を維持します。アップスケールまたは「ライトアップスケール」モードを使用した場合でも、ウェブギャラリーのダウンロードボタン からPNGファイルを受け取ることができます。ただし、Discordで直接表示されるプレビューサムネイルは、読み込み速度を上げるため、WebP(最新の非可逆/オプションのロスレス形式)で提供されます。ブラウザやDiscordクライアントによっては、右クリックダウンロードで完全なPNGではなくWebPサムネイルがダウンロードされる場合があります。

一部のユーザーが突然 JPEG 出力に遭遇したのはなぜでしょうか?

不本意な JPEG 変換を引き起こす要因はいくつかあります。

  1. サードパーティのパイプライン: 小さいペイロード用にデフォルトで JPG として保存するボットまたは自動化ツールを介して Midjourney 画像をルーティングすると、アーティファクトが継承されます。
  2. バッチ処理スクリプト: 一部のコミュニティ アップスケーラー (例: Stable Diffusion の Automatic1111) は、出力を入力と同じ形式で保存します。つまり、 JPG の後に連鎖されている場合、最終的な PNG を JPG に戻します。
  3. プラットフォームのデフォルト: Instagram や Twitter などのソーシャル メディア プラットフォームは、ユーザーがアップロードした画像を JPEG ベースの形式に自動圧縮するため、画像の品質がさらに低下します。

画像内の JPEG アーティファクトを最小限に抑えるにはどうすればよいでしょうか?

Discord のデフォルトの圧縮ポリシーを変更することはできませんが、ワークフローを最適化して画像の忠実度を維持することはできます。

ロスレス形式と高ビットレートのエクスポートを使用する

  • 直接PNGダウンロードDiscordのプレビューに頼るのではなく、必ずMidjourneyウェブアプリからPNG形式の画像をダウンロードしてください。PNGはJPEGの量子化の落とし穴を回避します。
  • より高い品質を指定する: JPEG を使用する必要がある場合 (Web 配信など)、より多くの DCT 係数を保持し、目に見えるブロック境界を減らすために、90 ~ 100% の品質設定でエクスポートします。

再圧縮を避けるためにワークフローを調整する

  • DiscordのプレビューレイヤーをバイパスするDiscordで、 media.discordapp.net   cdn.discordapp.com プレビュー圧縮なしでオリジナルのアップロードにアクセスします。
  • シングルステップ圧縮を維持: オリジナルの PNG をエディターで一度だけ開きます。JPEG が必要な場合は、追加の編集や再保存を行わずに直接エクスポートします。

AIを活用したアーティファクト除去を活用

最近の研究では、JPEGのアーティファクトを選択的に除去しながらディテールを維持できる拡散ベースのモデルが開発されています。例えば、CODiffモデルは、圧縮を考慮したビジュアル埋め込み器(CaVE)を用いてワンステップ拡散ノイズ除去器を誘導し、最小限のオーバーヘッドで最先端のアーティファクト除去を実現します。

CometAPI で MidJourney を使用する

CometAPIは、チャット、画像、コードなどに対応したオープンソースおよび特化型のマルチモーダルモデルを含む、500以上のAIモデルへのアクセスを提供します。その最大の強みは、従来複雑だったAI統合プロセスを簡素化できることです。

コメットAPI 統合を支援するために、公式価格よりもはるかに安い価格を提供します ミッドジャーニーAPI登録してログインすると、アカウントで無料でお試しいただけます。ぜひ登録して CometAPI を体験してください。CometAPI は従量制です。

重要な前提条件: MidJourney V7を使用する前に、 今すぐ CometAPI にサインアップ 無料でアクセスするには、こちらをクリックしてください。 ドキュメント.

MidJourney V7の使い始めはとても簡単です。 --v 7 パラメータをプロンプトの最後に追加します。この単純なコマンドは、CometAPI に最新の V7 モデルを使用して画像を生成するように指示します。

を参照してください ミッドジャーニーAPI 統合の詳細については、こちらをご覧ください。


結論

JPEGアーティファクトがMidjourneyワークフローのどこで、そしてなぜ発生するかを理解することで、モデルのクリエイティブなポテンシャルを最大限に引き出すための具体的な対策を講じることができます。PNGの戦略的な活用、効率的なエクスポート手順、最先端のアーティファクト除去ツールなどを活用することで、非可逆圧縮による望ましくない副作用なしに、V7の卓越した忠実度を活かすことが可能です。

もっと読む

1つのAPIで500以上のモデル

最大20%オフ