Perché le mie immagini di metà viaggio sono artefatti jpg

CometAPI
AnnaJun 13, 2025
Perché le mie immagini di metà viaggio sono artefatti jpg

Nelle ultime settimane, due importanti sviluppi hanno riportato Midjourney sotto i riflettori: l'attesissima versione alpha del modello V7 e un'importante causa per violazione del copyright intentata da Disney e Universal. Sebbene V7 prometta notevoli miglioramenti nella qualità delle immagini, molti utenti continuano a riscontrare inaspettati artefatti JPEG di tipo "a blocchi" o "squillanti" durante il salvataggio e la condivisione delle proprie creazioni. Questo articolo esplora le cause profonde di questi artefatti, spiega come funziona la compressione JPEG e offre strategie pratiche per ridurre al minimo le distorsioni indesiderate nelle immagini generate da Midjourney.

Che cos'è Midjourney V7?

Midjourney V7 rappresenta la prima riprogettazione completa del modello in oltre un anno, introducendo una maggiore velocità di elaborazione, un'interpretazione più intelligente dei prompt e una fedeltà visiva migliorata.

Miglioramenti chiave nella versione V7

  • Dettagli e coerenza migliorati:Secondo le note di rilascio di Midjourney, la versione V7 offre una risoluzione delle texture significativamente più elevata e un rendering più coerente di elementi complessi: mani, pieghe di tessuti e paesaggi naturali presentano tutti gradienti più uniformi e dettagli più fini rispetto alla versione V6.1.
  • Personalizzazione predefinita: V7 è il primo modello Midjourney con la "personalizzazione" predefinita, che richiede agli utenti di valutare circa 200 immagini campione per sbloccare un'esperienza completamente personalizzata. Questo ciclo di feedback aiuta il sistema ad allineare meglio gli output alle preferenze estetiche individuali.

Versione Alpha e accesso alla community

Midjourney ha aperto V7 per i test alpha all'inizio di aprile 2025. I membri della community possono accedere al nuovo modello aggiungendo il --v 7 Segnalare tramite i prompt o tramite il canale V7 dedicato. Questa versione alpha consente di testare più ampiamente i principali miglioramenti del modello (comprensione dei prompt, qualità delle immagini e coerenza) prima di un lancio pubblico completo.

Perché vedo artefatti JPEG nelle mie immagini Midjourney?

Nonostante il rendering interno di V7 basato su PNG, molti utenti segnalano ancora artefatti di compressione in stile JPEG. Queste distorsioni visibili si verificano in genere durante la gestione a valle, soprattutto su piattaforme come Discord.

Generazione PNG interna e conversione JPEG esterna

Midjourney genera e memorizza immagini in formato PNG lossless, garantendo la conservazione di tutti i dettagli e dei sottili gradienti del modello. Tuttavia, quando questi file vengono condivisi su Discord o scaricati tramite link specifici, potrebbero essere convertiti in formati lossy (JPEG o WebP) per ottimizzare la larghezza di banda.

Compressione automatizzata di Discord

Di default, Discord ricodifica le immagini di grandi dimensioni per ridurne le dimensioni, spesso utilizzando la compressione JPEG o WebP. Questo passaggio automatico introduce artefatti ai bordi dei blocchi ("macroblocking") e lievi variazioni di colore, che possono essere particolarmente evidenti in gradienti uniformi o aree di sfondo uniformi.

Ricompressione indotta dal flusso di lavoro

Sebbene Midjourney generi e memorizzi internamente le immagini come PNG lossless o rappresentazioni con una precisione ancora maggiore, nel momento in cui si sceglie "Salva come JPEG" o si condivide tramite piattaforme che convertono automaticamente in JPEG (ad esempio, alcune gallerie web e social media), gli artefatti compaiono. Il proxy delle immagini di Discord, i browser che salvano le anteprime come WebP e la conversione tramite il tasto destro del mouse su "Salva immagine con nome..." attivano tutti la ricompressione. Ogni fase di ricompressione accumula perdite di generazione: il ritaglio, il ridimensionamento o la ricodifica con le impostazioni di qualità predefinite (spesso intorno al 75-85%) amplificano blocchi e bande.

In che modo la compressione JPEG produce artefatti?

Comprendere i fondamenti tecnici della codifica JPEG aiuta a capire perché compaiono gli artefatti e come contrastarli.

DCT e quantizzazione basate su blocchi

La compressione JPEG funziona dividendo un'immagine in blocchi di 8×8 pixel e applicando una trasformata discreta del coseno (DCT) a ciascun blocco. Per ridurre le dimensioni del file, quantizza le componenti ad alta frequenza, scartando di fatto i dettagli più fini. Quando il livello di quantizzazione è troppo alto (ovvero, una compressione più forte), questo processo porta a bordi di blocco visibili, perdita di texture e banding di colore. Le immagini generate dall'intelligenza artificiale, in particolare quelle con gradienti complessi e texture fini, sono altamente suscettibili a questi artefatti se salvate o trasmesse in formato JPEG senza impostazioni di qualità adeguate.

Tipi comuni di artefatti

  • Blocco (Macroblocco):Quando interi blocchi 8×8 diventano visibilmente distinti, creando un motivo a “scacchiera”.
  • Effetti di suoneria/contorno: Distorsioni simili ad aloni lungo bordi netti, derivanti dalla perdita di componenti ad alta frequenza.
  • Bande di colore:I gradienti uniformi si degradano in "bande" discrete di colore quando vengono eliminate le sottili differenze.

Quali formati di file supporta Midjourney e come sono cambiati di recente?

Quali formati sono nativi di Midjourney?

Per impostazione predefinita, Midjourney fornisce file PNG ad alta risoluzione: immagini lossless a 8 bit per canale (RGB a 24 bit) che preservano ogni valore in pixel. Anche quando si esegue l'upscaling o si utilizzano le modalità "Light Upscale", si ricevono comunque i PNG tramite il pulsante di download della galleria web. Tuttavia, le miniature di anteprima mostrate direttamente su Discord sono fornite in WebP (un moderno formato lossy/opzionale lossless) per velocizzare il caricamento. A seconda del browser o del client Discord, i download con clic destro potrebbero acquisire la miniatura WebP anziché il PNG completo.

Perché alcuni utenti hanno improvvisamente riscontrato risultati in formato JPEG?

Alcuni fattori determinano la conversione involontaria in JPEG:

  1. Pipeline di terze parti: Se si instradano le immagini Midjourney tramite bot o strumenti di automazione che salvano per impostazione predefinita come JPG per payload più piccoli, si ereditano degli artefatti.
  2. Script di elaborazione batch: Alcuni upscaler della community (ad esempio Automatic1111 per Stable Diffusion) salvano gli output nello stesso formato dell'input, trasformando i PNG finali di nuovo in JPG se concatenati dopo un JPG.
  3. Impostazioni predefinite della piattaforma: Le piattaforme di social media come Instagram o Twitter comprimono automaticamente i caricamenti degli utenti in formati basati su JPEG, degradando ulteriormente l'immagine.

Come puoi ridurre al minimo gli artefatti JPEG nelle tue immagini?

Sebbene non sia possibile modificare la politica di compressione predefinita di Discord, è possibile ottimizzare il flusso di lavoro per preservare la fedeltà delle immagini.

Utilizza formati lossless ed esportazioni a bitrate più elevato

  • Download PNG diretti: Scarica sempre la versione PNG della tua immagine dall'app web Midjourney invece di affidarti alle anteprime di Discord. Il formato PNG evita le insidie ​​di quantizzazione del JPEG.
  • Specificare una qualità superiore: Se devi utilizzare JPEG (per la distribuzione sul Web, ecc.), esporta con un'impostazione di qualità del 90-100% per conservare più coefficienti DCT e ridurre i confini dei blocchi visibili.

Adatta il flusso di lavoro per evitare la ricompressione

  • Bypassare il livello di anteprima di Discord: In Discord, sostituisci i link da media.discordapp.net con cdn.discordapp.com per accedere ai caricamenti originali senza compressione dell'anteprima.
  • Mantenere la compressione a singolo passaggio: Apri il tuo PNG originale una sola volta nel tuo editor; se è necessario un JPEG, esportalo direttamente senza ulteriori modifiche o salvataggi.

Sfrutta la rimozione degli artefatti basata sull'intelligenza artificiale

Ricerche recenti hanno prodotto modelli basati sulla diffusione in grado di rimuovere selettivamente gli artefatti JPEG mantenendo inalterati i dettagli. Ad esempio, il modello CODiff impiega un visual embedder sensibile alla compressione (CaVE) per guidare un denoiser a diffusione one-step, ottenendo una riduzione degli artefatti all'avanguardia con un overhead minimo.

Utilizzare MidJourney in CometAPI

CometAPI fornisce accesso a oltre 500 modelli di intelligenza artificiale, inclusi modelli multimodali open source e specializzati per chat, immagini, codice e altro ancora. Il suo punto di forza principale risiede nella semplificazione del processo di integrazione dell'intelligenza artificiale, tradizionalmente complesso.

CometaAPI offrire un prezzo molto più basso del prezzo ufficiale per aiutarti a integrare API di metà viaggio, e puoi provarlo gratuitamente nel tuo account dopo esserti registrato e aver effettuato l'accesso! Benvenuto, registrati e prova CometAPI. CometAPI paga a consumo.

Prerequisito importante: Prima di utilizzare MidJourney V7, è necessario iniziare a costruire su CometAPI oggi – registrati qui per l'accesso gratuito. Si prega di visitare docs.

Iniziare a usare MidJourney V7 è molto semplice: basta aggiungere --v 7 parametro alla fine del prompt. Questo semplice comando dice a CometAPI di usare l'ultimo modello V7 per generare la tua immagine.

Si prega di fare riferimento a API di metà viaggio per i dettagli sull'integrazione.


Conclusione

Comprendendo dove e perché gli artefatti JPEG entrano nel flusso di lavoro Midjourney, è possibile adottare misure concrete per preservare il pieno potenziale creativo del modello. Che si tratti di un uso strategico del formato PNG, di procedure di esportazione semplificate o di strumenti all'avanguardia per la rimozione degli artefatti, è possibile mostrare la straordinaria fedeltà di V7 senza gli effetti collaterali indesiderati della compressione con perdita di dati.

Leggi di più

500+ Modelli in Una API

Fino al 20% di sconto