최근 몇 주 동안 두 가지 주요 사건으로 Midjourney가 다시 주목을 받게 되었습니다. 오랫동안 기다려온 V7 모델의 알파 버전 출시와 디즈니와 유니버설이 제기한 심각한 저작권 소송입니다. V7은 이미지 품질을 획기적으로 향상시킨다고 약속하지만, 많은 사용자들이 작품을 저장하고 공유할 때 예상치 못한 JPEG "블록 현상"이나 "링잉" 아티팩트를 계속해서 경험하고 있습니다. 이 글에서는 이러한 아티팩트의 근본 원인을 살펴보고, JPEG 압축의 작동 방식을 설명하며, Midjourney로 생성된 이미지에서 원치 않는 왜곡을 최소화하는 실용적인 전략을 제시합니다.
Midjourney V7이란 무엇인가요?
Midjourney V7은 XNUMX년 만에 처음으로 모델을 전면적으로 재설계한 제품으로, 더 빠른 처리량, 더욱 스마트하고 신속한 해석, 향상된 시각적 충실도를 선보입니다.
V7의 주요 개선 사항
- 향상된 디테일과 일관성: Midjourney의 릴리스 노트에 따르면, V7은 훨씬 더 높은 텍스처 해상도와 복잡한 요소의 더 일관된 렌더링을 제공합니다. 손, 직물 주름, 자연 풍경은 모두 V6.1에 비해 더 부드러운 그라데이션과 더 세부적인 디테일을 보여줍니다.
- 기본 개인화: V7은 기본 모델 "개인화"를 갖춘 최초의 Midjourney 모델로, 사용자가 약 200개의 샘플 이미지를 평가하여 완전히 개인화된 경험을 제공하도록 요구합니다. 이러한 피드백 루프는 시스템이 개인의 미적 선호도에 맞춰 결과물을 더욱 효과적으로 정렬하는 데 도움이 됩니다.
알파 릴리스 및 커뮤니티 액세스
Midjourney는 7년 2025월 초 알파 테스트를 위해 VXNUMX을 오픈했습니다. 커뮤니티 구성원은 다음을 추가하여 새 모델에 액세스할 수 있습니다. --v 7 프롬프트에 플래그를 지정하거나 전용 V7 채널을 통해 플래그를 지정할 수 있습니다. 이번 알파 릴리스를 통해 정식 출시 전에 모델의 핵심 개선 사항(프롬프트 이해, 이미지 품질, 일관성)을 더욱 폭넓게 테스트할 수 있습니다.
Midjourney 이미지에 JPEG 아티팩트가 보이는 이유는 무엇인가요?
V7의 내부 PNG 기반 렌더링에도 불구하고, 많은 사용자가 여전히 JPEG 스타일의 압축 아티팩트를 보고하고 있습니다. 이러한 눈에 띄는 왜곡은 일반적으로 다운스트림 처리 과정에서 발생하며, 특히 Discord와 같은 플랫폼에서 발생합니다.
내부 PNG 생성 및 외부 JPEG 변환
Midjourney는 이미지를 무손실 PNG 형식으로 생성하고 저장하여 모델의 모든 디테일과 미묘한 그라데이션을 그대로 유지합니다. 하지만 이러한 파일을 Discord에서 공유하거나 특정 링크를 통해 다운로드하는 경우, 대역폭 효율을 위해 손실 가능 형식(JPEG 또는 WebP)으로 변환될 수 있습니다.
Discord의 자동 압축
기본적으로 Discord는 파일 크기를 줄이기 위해 큰 이미지를 재인코딩하는데, 이때 JPEG 또는 WebP 압축을 사용하는 경우가 많습니다. 이 자동화된 단계에서는 블록 경계 아티팩트("매크로블로킹")와 미세한 색상 변화가 발생하는데, 이는 부드러운 그라데이션이나 균일한 배경 영역에서 특히 두드러질 수 있습니다.
워크플로 유도 재압축
Midjourney는 이미지를 무손실 PNG 또는 더 높은 정밀도로 내부적으로 생성하고 저장하지만, "JPEG로 저장"을 선택하거나 JPEG로 자동 변환하는 플랫폼(예: 일부 웹 갤러리, 소셜 미디어)을 통해 공유하는 순간 아티팩트가 나타납니다. Discord의 이미지 프록시, 미리보기를 WebP로 저장하는 브라우저, 그리고 마우스 오른쪽 버튼을 클릭하여 "이미지를 다른 이름으로 저장..."을 통해 변환하는 모든 과정에서 재압축이 발생합니다. 각 재압축 단계에서는 생성 손실이 누적됩니다. 기본 품질 설정(보통 75~85%)으로 자르거나, 크기를 조정하거나, 다시 인코딩하면 블로킹과 밴딩 현상이 심화됩니다.
JPEG 압축은 어떻게 아티팩트를 생성합니까?
JPEG 인코딩의 기술적 기반을 이해하면 아티팩트가 나타나는 이유와 이를 해결하는 방법을 알 수 있습니다.
블록 기반 DCT 및 양자화
JPEG 압축은 이미지를 8x8 픽셀 블록으로 나누고 각 블록에 이산 코사인 변환(DCT)을 적용하는 방식으로 작동합니다. 파일 크기를 줄이기 위해 고주파 성분을 양자화하여 미세한 디테일을 효과적으로 제거합니다. 양자화 수준이 너무 높으면(즉, 압축률이 높으면) 이 과정에서 블록 경계가 눈에 띄고, 텍스처가 손실되며, 색상 밴딩이 발생합니다. AI로 생성된 이미지, 특히 복잡한 그라데이션과 미세한 텍스처가 있는 이미지는 충분한 품질 설정 없이 JPEG로 저장하거나 전송할 경우 이러한 아티팩트에 매우 취약합니다.
일반적인 아티팩트 유형
- 블로킹(매크로블로킹): 8×8 블록 전체가 눈에 띄게 뚜렷해지면서 "체커보드" 패턴이 생성됩니다.
- 울림/윤곽 효과: 고주파 성분 손실로 인해 날카로운 모서리를 따라 후광과 같은 왜곡이 발생합니다.
- 컬러 밴딩: 미묘한 차이가 제거되면 부드러운 그라데이션이 뚜렷한 색상 "띠"로 저하됩니다.
Midjourney는 어떤 파일 형식을 지원하며, 최근 어떻게 변경되었나요?
Midjourney에는 어떤 포맷이 기본으로 포함되어 있나요?
기본적으로 Midjourney는 고해상도 PNG 파일을 제공합니다. 이 파일은 모든 픽셀 값을 보존하는 채널당 8비트(24비트 RGB) 무손실 이미지입니다. 업스케일링하거나 "Light Upscale" 모드를 사용하면 웹 갤러리 다운로드 버튼을 통해 PNG 파일을 받을 수 있습니다. 하지만 Discord에 직접 표시되는 미리보기 썸네일은 로딩 속도를 높이기 위해 WebP(최신 손실/선택적 무손실 형식)로 제공됩니다. 브라우저 또는 Discord 클라이언트에 따라 마우스 오른쪽 버튼을 클릭하여 다운로드하면 전체 PNG가 아닌 WebP 썸네일이 표시될 수 있습니다.
일부 사용자가 갑자기 JPEG 출력을 접하게 된 이유는 무엇입니까?
비자발적인 JPEG 변환을 유발하는 몇 가지 요인은 다음과 같습니다.
- 타사 파이프라인: 작은 페이로드를 위해 기본적으로 JPG로 저장하는 봇이나 자동화 도구를 통해 Midjourney 이미지를 라우팅하는 경우 아티팩트를 상속받게 됩니다.
- 일괄 처리 스크립트: 일부 커뮤니티 업스케일러(예: Stable Diffusion의 Automatic1111)는 JPG 뒤에 체인으로 연결된 경우 최종 PNG를 JPG로 다시 변환하여 입력과 동일한 형식으로 출력을 저장합니다.
- 플랫폼 기본값: Instagram이나 Twitter와 같은 소셜 미디어 플랫폼은 사용자가 업로드한 이미지를 JPEG 기반 포맷으로 자동 압축하여 이미지 품질을 더욱 저하시킵니다.
이미지의 JPEG 아티팩트를 최소화하려면 어떻게 해야 하나요?
Discord의 기본 압축 정책은 변경할 수 없지만, 워크플로를 최적화하여 이미지 충실도를 유지할 수 있습니다.
손실 없는 형식 및 더 높은 비트 전송률 내보내기 사용
- PNG 직접 다운로드: Discord 미리보기에 의존하기보다는 Midjourney 웹 앱에서 항상 PNG 버전의 이미지를 다운로드하세요. PNG는 JPEG의 양자화 문제를 피할 수 있습니다.
- 더 높은 품질을 지정하세요: JPEG를 사용해야 하는 경우(웹 전달 등), 더 많은 DCT 계수를 유지하고 눈에 보이는 블록 경계를 줄이기 위해 90~100%의 품질 설정으로 내보내세요.
재압축을 방지하기 위해 워크플로우 조정
- Discord 미리보기 레이어 우회: Discord에서 링크를 다음에서 교체하세요.
media.discordapp.net과cdn.discordapp.com미리보기 압축 없이 원본 업로드에 액세스하세요. - 단일 단계 압축 유지: 편집기에서 원본 PNG 파일을 한 번만 열고, JPEG가 필요한 경우 추가 편집이나 재저장 없이 바로 내보내세요.
AI 기반 아티팩트 제거 활용
최근 연구에서는 디테일을 유지하면서 JPEG 아티팩트를 선택적으로 제거할 수 있는 확산 기반 모델이 개발되었습니다. 예를 들어, CODiff 모델은 압축 인식 비주얼 임베더(CaVE)를 사용하여 단일 단계 확산 디노이저를 유도하여 최소한의 오버헤드로 최첨단 아티팩트 감소 효과를 달성합니다.
CometAPI에서 MidJourney 사용하기
CometAPI는 채팅, 이미지, 코드 등을 위한 오픈 소스 및 특수 멀티모달 모델을 포함하여 500개 이상의 AI 모델에 대한 액세스를 제공합니다. CometAPI의 주요 강점은 기존의 복잡한 AI 통합 프로세스를 간소화하는 것입니다.
코멧API 공식 가격보다 훨씬 낮은 가격을 제공하여 통합을 돕습니다. 중간 여정 API, 등록 및 로그인 후 계정에서 무료로 체험해 보세요! CometAPI에 가입하고 체험해 보세요. CometAPI는 사용량에 따라 결제됩니다.
중요한 전제 조건: MidJourney V7을 사용하기 전에 먼저 빌드를 시작해야 합니다. 오늘 CometAPI에 가입하세요 여기에서 무료로 접속하세요. 방문해주세요. 문서.
MidJourney V7을 시작하는 것은 매우 간단합니다. --v 7 프롬프트 끝에 매개변수를 추가합니다. 이 간단한 명령은 CometAPI에 최신 V7 모델을 사용하여 이미지를 생성하라고 지시합니다.
를 참조하십시오 중간 여정 API 통합 세부 정보를 확인하세요.
결론
JPEG 아티팩트가 Midjourney 워크플로에 어디에서, 그리고 왜 유입되는지 파악하면 모델의 창의적인 잠재력을 최대한 보존하기 위한 구체적인 조치를 취할 수 있습니다. PNG를 전략적으로 활용하거나, 간소화된 내보내기 방식을 사용하거나, 최첨단 아티팩트 제거 도구를 활용하면 손실 압축의 부작용 없이 V7의 놀라운 충실도를 보여줄 수 있습니다.
