En las últimas semanas, dos acontecimientos importantes han vuelto a poner a Midjourney en el punto de mira: el esperado lanzamiento alfa del modelo V7 y una sonada demanda por derechos de autor interpuesta por Disney y Universal. Si bien V7 promete mejoras drásticas en la calidad de imagen, muchos usuarios siguen experimentando imprevistos efectos de bloqueo o zumbido en JPEG al guardar y compartir sus creaciones. Este artículo explora las causas de estos efectos, explica cómo funciona la compresión JPEG y ofrece estrategias prácticas para minimizar las distorsiones no deseadas en las imágenes generadas por Midjourney.
¿Qué es Midjourney V7?
Midjourney V7 representa el primer rediseño del modelo desde cero en más de un año, introduciendo un rendimiento más rápido, una interpretación de indicaciones más inteligente y una fidelidad visual mejorada.
Mejoras clave en la versión 7
- Mayor detalle y coherenciaSegún las notas de lanzamiento de Midjourney, la V7 ofrece una resolución de textura significativamente mayor y una representación más consistente de elementos complejos (manos, pliegues de tela y paisajes naturales): todos muestran gradientes más suaves y detalles más finos en comparación con la V6.1.
- Personalización por defectoV7 es el primer modelo Midjourney con personalización predeterminada, que requiere que los usuarios califiquen aproximadamente 200 imágenes de muestra para acceder a una experiencia totalmente personalizada. Este ciclo de retroalimentación ayuda al sistema a adaptar mejor los resultados a las preferencias estéticas individuales.
Versión alfa y acceso a la comunidad
Midjourney abrió la versión V7 para pruebas alfa a principios de abril de 2025. Los miembros de la comunidad pueden acceder al nuevo modelo adjuntando el --v 7 Marcar en sus indicaciones o a través del canal dedicado V7. Esta versión alfa permite realizar pruebas más amplias de las mejoras principales del modelo (comprensión de las indicaciones, calidad de imagen y coherencia) antes de su lanzamiento público completo.
¿Por qué veo artefactos JPEG en mis imágenes de Midjourney?
A pesar del renderizado interno basado en PNG de V7, muchos usuarios aún reportan artefactos de compresión similares a JPEG. Estas distorsiones visibles suelen surgir durante el procesamiento posterior, especialmente en plataformas como Discord.
Generación interna de PNG y conversión externa de JPEG
Midjourney genera y almacena imágenes en formato PNG sin pérdida, lo que garantiza la conservación de todos los detalles y los sutiles gradientes del modelo. Sin embargo, al compartir estos archivos en Discord o descargarlos a través de ciertos enlaces, pueden convertirse a formatos con pérdida (JPEG o WebP) para optimizar el ancho de banda.
Compresión automatizada de Discord
De forma predeterminada, Discord recodifica las imágenes grandes para reducir el tamaño del archivo, a menudo mediante compresión JPEG o WebP. Este proceso automatizado produce artefactos en los límites de los bloques (macrobloques) y ligeros cambios de color, especialmente visibles en degradados suaves o áreas de fondo uniformes.
Recompresión inducida por el flujo de trabajo
Aunque Midjourney genera y almacena imágenes internamente como archivos PNG sin pérdida o incluso con representaciones de mayor precisión, al seleccionar "Guardar como JPEG" o compartirlas a través de plataformas que convierten automáticamente a JPEG (por ejemplo, algunas galerías web, redes sociales), aparecen los artefactos. El proxy de imágenes de Discord, los navegadores que guardan las vistas previas como WebP y la conversión mediante el botón derecho del ratón al seleccionar "Guardar imagen como..." activan la recompresión. Cada paso de recompresión acumula pérdida de generación: recortar, redimensionar o recodificar con la configuración de calidad predeterminada (que suele rondar el 75-85 %) amplifica el bloqueo y el bandeo.
¿Cómo la compresión JPEG produce artefactos?
Comprender los fundamentos técnicos de la codificación JPEG arroja luz sobre por qué aparecen los artefactos y cómo combatirlos.
DCT basada en bloques y cuantificación
La compresión JPEG funciona dividiendo una imagen en bloques de 8×8 píxeles y aplicando una transformada discreta del coseno (DCT) a cada bloque. Para reducir el tamaño del archivo, cuantifica los componentes de alta frecuencia, descartando así los detalles finos. Cuando el nivel de cuantificación es demasiado alto (es decir, una compresión más fuerte), este proceso provoca límites de bloque visibles, pérdida de textura y bandas de color. Las imágenes generadas por IA, especialmente aquellas con gradientes complejos y texturas finas, son muy susceptibles a estos artefactos si se guardan o transmiten como JPEG sin una configuración de calidad adecuada.
Tipos de artefactos comunes
- Bloqueo (Macrobloqueo):Cuando bloques enteros de 8×8 se vuelven visiblemente distintos, creando un patrón de “tablero de ajedrez”.
- Efectos de timbre/contorno:Distorsiones tipo halo a lo largo de bordes afilados, que surgen de la pérdida de componentes de alta frecuencia.
- Bandas de color:Los gradientes suaves se degradan en “bandas” de color discretas cuando se eliminan las diferencias sutiles.
¿Qué formatos de archivos admite Midjourney y cómo han cambiado recientemente?
¿Qué formatos son nativos de Midjourney?
De forma predeterminada, Midjourney ofrece archivos PNG de alta resolución: imágenes sin pérdida de 8 bits por canal (RGB de 24 bits) que conservan cada píxel. Al aumentar la escala o usar los modos "Aumento de escala ligero", se siguen recibiendo los archivos PNG a través del botón de descarga de la galería web. Sin embargo, las miniaturas de vista previa que se muestran directamente en Discord se muestran como WebP (un formato moderno con pérdida/opcional sin pérdida) para acelerar la carga. Dependiendo del navegador o cliente de Discord, las descargas con el botón derecho pueden capturar la miniatura WebP en lugar del PNG completo.
¿Por qué algunos usuarios de repente se han encontrado con salidas JPEG?
Algunos factores provocan la conversión involuntaria de JPEG:
- Tuberías de terceros: Si enruta imágenes de Midjourney a través de bots o herramientas de automatización que, de manera predeterminada, guardan como JPG para cargas más pequeñas, heredará artefactos.
- Scripts de procesamiento por lotes: Algunos escaladores comunitarios (por ejemplo, Automatic1111 para Stable Diffusion) guardan las salidas en el mismo formato que la entrada, convirtiendo los PNG finales nuevamente en JPG si se encadenan después de un JPG.
- Valores predeterminados de la plataforma: Las plataformas de redes sociales como Instagram o Twitter comprimen automáticamente las cargas de los usuarios a formatos basados en JPEG, lo que degrada aún más la imagen.
¿Cómo puedes minimizar los artefactos JPEG en tus imágenes?
Si bien no puedes cambiar la política de compresión predeterminada de Discord, puedes optimizar tu flujo de trabajo para preservar la fidelidad de la imagen.
Utilice formatos sin pérdida y exportaciones con mayor tasa de bits
- Descargas directas de PNGDescarga siempre la versión PNG de tu imagen desde la aplicación web de Midjourney en lugar de depender de las vistas previas de Discord. PNG evita los problemas de cuantificación de JPEG.
- Especificar mayor calidad:Si debe utilizar JPEG (para entrega web, etc.), exporte con una configuración de calidad del 90 al 100 % para conservar más coeficientes DCT y reducir los límites de bloques visibles.
Ajuste su flujo de trabajo para evitar la recompresión
- Omitir la capa de vista previa de Discord:En Discord, reemplaza los enlaces de
media.discordapp.netconcdn.discordapp.compara acceder a las cargas originales sin compresión de vista previa. - Mantener la compresión de un solo paso:Abra su PNG original solo una vez en su editor; si necesita un JPEG, expórtelo directamente sin ediciones adicionales ni volver a guardarlo.
Aproveche la eliminación de artefactos impulsada por IA
Investigaciones recientes han generado modelos basados en la difusión que pueden eliminar selectivamente artefactos JPEG, manteniendo el detalle. Por ejemplo, el modelo CODiff emplea un incrustador visual con compresión (CaVE) para guiar un denoiser de difusión de un solo paso, logrando una reducción de artefactos de vanguardia con una sobrecarga mínima.
Utilice MidJourney en CometAPI
CometAPI proporciona acceso a más de 500 modelos de IA, incluyendo modelos multimodales especializados y de código abierto para chat, imágenes, código y más. Su principal ventaja reside en simplificar el proceso tradicionalmente complejo de integración de IA.
CometAPI Ofrecemos un precio mucho más bajo que el precio oficial para ayudarte a integrarte API de viaje a mitad de camino¡Puedes probarlo gratis en tu cuenta después de registrarte e iniciar sesión! Bienvenido a registrarte y a experimentar CometAPI. CometAPI es de pago por uso.
Prerrequisito importante: Antes de utilizar MidJourney V7, debe comenzar a construir en CometAPI hoy: regístrate Aquí para acceso gratuito. Por favor, visite documentos.
Comenzar a usar MidJourney V7 es muy sencillo: solo agregue el --v 7 Parámetro al final del mensaje. Este sencillo comando indica a CometAPI que utilice el modelo V7 más reciente para generar la imagen.
Por favor, consulte API de viaje a mitad de camino Para detalles de integración.
Conclusión
Al comprender dónde y por qué los artefactos JPEG entran en su flujo de trabajo de Midjourney, puede tomar medidas concretas para preservar todo el potencial creativo del modelo. Ya sea mediante el uso estratégico de PNG, prácticas de exportación optimizadas o herramientas de eliminación de artefactos de vanguardia, es posible mostrar la extraordinaria fidelidad de V7 sin los efectos secundarios indeseados de la compresión con pérdida.
