ทำไมรูปภาพ Midjourney ของฉันถึงเป็น jpg

CometAPI
AnnaJun 13, 2025
ทำไมรูปภาพ Midjourney ของฉันถึงเป็น jpg

ในช่วงไม่กี่สัปดาห์ที่ผ่านมา มีการพัฒนาที่สำคัญสองประการที่ทำให้ Midjourney กลับมาเป็นที่สนใจอีกครั้ง ได้แก่ การเปิดตัวรุ่น V7 ซึ่งเป็นรุ่นอัลฟ่าที่ทุกคนรอคอยมานาน และคดีละเมิดลิขสิทธิ์ที่ฟ้องร้องโดย Disney และ Universal แม้ว่า V7 จะสัญญาว่าจะปรับปรุงคุณภาพของภาพได้อย่างมาก แต่ผู้ใช้จำนวนมากยังคงพบกับปัญหาภาพ JPEG ที่เป็น "ภาพแตก" หรือ "ภาพสั่น" ที่ไม่คาดคิดเมื่อบันทึกและแชร์ผลงานสร้างสรรค์ของตน บทความนี้จะเจาะลึกถึงสาเหตุหลักของปัญหาเหล่านี้ อธิบายการทำงานของการบีบอัด JPEG และเสนอแนวทางปฏิบัติเพื่อลดการบิดเบือนที่ไม่ต้องการในภาพที่สร้างโดย Midjourney

Midjourney V7 คืออะไร?

Midjourney V7 ถือเป็นการออกแบบโมเดลใหม่ทั้งหมดครั้งแรกในรอบกว่าหนึ่งปี โดยมาพร้อมกับความเร็วที่รวดเร็วขึ้น การตีความที่รวดเร็วชาญฉลาดยิ่งขึ้น และความเที่ยงตรงของภาพที่ได้รับการปรับปรุง

การปรับปรุงที่สำคัญใน V7

  • เพิ่มรายละเอียดและความสอดคล้องกัน:ตามบันทึกการเปิดตัวของ Midjourney ระบุว่า V7 มอบความละเอียดพื้นผิวที่สูงขึ้นอย่างเห็นได้ชัด และการเรนเดอร์องค์ประกอบที่ซับซ้อนได้สม่ำเสมอมากขึ้น ไม่ว่าจะเป็นมือ รอยพับของผ้า และทิวทัศน์ธรรมชาติ ซึ่งทั้งหมดล้วนแสดงการไล่ระดับสีที่นุ่มนวลกว่าและรายละเอียดที่ละเอียดกว่าเมื่อเปรียบเทียบกับ V6.1
  • การปรับแต่งตามค่าเริ่มต้น:V7 เป็นรุ่น Midjourney รุ่นแรกที่มี "การปรับแต่งส่วนบุคคล" แบบเริ่มต้น ซึ่งผู้ใช้ต้องให้คะแนนภาพตัวอย่างประมาณ 200 ภาพเพื่อปลดล็อกประสบการณ์ที่ปรับแต่งส่วนบุคคลอย่างสมบูรณ์ วงจรข้อเสนอแนะนี้ช่วยให้ระบบปรับเอาต์พุตให้สอดคล้องกับความชอบด้านสุนทรียศาสตร์ของแต่ละบุคคลได้ดีขึ้น

การเปิดตัว Alpha และการเข้าถึงชุมชน

Midjourney เปิดตัว V7 สำหรับการทดสอบอัลฟ่าในช่วงต้นเดือนเมษายน 2025 สมาชิกชุมชนสามารถเข้าถึงโมเดลใหม่ได้โดยผนวก --v 7 ตั้งค่าสถานะเป็นการแจ้งเตือนหรือผ่านช่องทาง V7 เฉพาะ การเปิดตัวรุ่นอัลฟ่านี้ช่วยให้สามารถทดสอบการปรับปรุงหลักของโมเดลได้อย่างกว้างขวางยิ่งขึ้น ไม่ว่าจะเป็นความเข้าใจอย่างรวดเร็ว คุณภาพของภาพ และความสอดคล้องกัน ก่อนจะเปิดตัวสู่สาธารณะเต็มรูปแบบ

เหตุใดฉันจึงเห็นสิ่งประดิษฐ์ JPEG ในภาพ Midjourney ของฉัน

แม้ว่า V7 จะทำการเรนเดอร์โดยใช้ไฟล์ PNG ภายใน แต่ผู้ใช้หลายรายยังคงรายงานถึงอาตีแฟกต์การบีบอัดแบบ JPEG การบิดเบือนที่มองเห็นได้นี้มักเกิดขึ้นระหว่างการจัดการดาวน์สตรีม โดยเฉพาะบนแพลตฟอร์มอย่าง Discord

การสร้าง PNG ภายในและการแปลง JPEG ภายนอก

Midjourney สร้างและจัดเก็บรูปภาพในรูปแบบ PNG ที่ไม่มีการสูญเสียข้อมูล ทำให้มั่นใจได้ว่ารายละเอียดทั้งหมดของโมเดลและการไล่ระดับสีที่ละเอียดอ่อนจะคงอยู่ อย่างไรก็ตาม เมื่อแชร์ไฟล์เหล่านี้บน Discord หรือดาวน์โหลดผ่านลิงก์บางรายการ ไฟล์เหล่านี้อาจถูกแปลงเป็นรูปแบบที่มีการสูญเสียข้อมูล (JPEG หรือ WebP) เพื่อประสิทธิภาพแบนด์วิดท์

การบีบอัดข้อมูลอัตโนมัติของ Discord

ตามค่าเริ่มต้น Discord จะเข้ารหัสรูปภาพขนาดใหญ่ใหม่เพื่อลดขนาดไฟล์ โดยมักจะใช้การบีบอัด JPEG หรือ WebP ขั้นตอนอัตโนมัตินี้จะทำให้เกิดการสร้างภาพขอบบล็อก (“การบล็อกมาโคร”) และการเปลี่ยนสีเล็กน้อย ซึ่งสามารถสังเกตเห็นได้ชัดเจนโดยเฉพาะในเฉดสีแบบไล่ระดับที่ราบรื่นหรือพื้นหลังที่สม่ำเสมอ

การบีบอัดซ้ำที่เกิดจากเวิร์กโฟลว์

แม้ว่า Midjourney จะสร้างและจัดเก็บรูปภาพภายในเป็นไฟล์ PNG ที่ไม่มีการสูญเสียข้อมูลหรือแม้กระทั่งภาพที่มีความแม่นยำสูงกว่า แต่ทันทีที่คุณเลือก "บันทึกเป็น JPEG" หรือแชร์ผ่านแพลตฟอร์มที่แปลงเป็น JPEG โดยอัตโนมัติ (เช่น แกลเลอรีบนเว็บบางแห่ง โซเชียลมีเดีย) สิ่งแปลกปลอมก็จะปรากฏขึ้น พร็อกซีรูปภาพของ Discord เบราว์เซอร์ที่บันทึกภาพตัวอย่างเป็น WebP และการแปลงโดยคลิกขวาที่ "บันทึกรูปภาพเป็น..." ทั้งหมดนี้ทำให้เกิดการบีบอัดซ้ำ ขั้นตอนการบีบอัดซ้ำแต่ละขั้นตอนจะสะสมการสูญเสียจากการสร้างภาพ การครอบตัด การปรับขนาด หรือการเข้ารหัสใหม่ที่การตั้งค่าคุณภาพเริ่มต้น (มักจะอยู่ที่ประมาณ 75–85%) จะขยายการบล็อกและการแบ่งแถบ

การบีบอัด JPEG สร้างสิ่งแปลกปลอมได้อย่างไร

ความเข้าใจเกี่ยวกับพื้นฐานทางเทคนิคของการเข้ารหัส JPEG จะช่วยให้ทราบสาเหตุที่เกิดสิ่งแปลกปลอม และวิธีต่อสู้กับสิ่งแปลกปลอมเหล่านี้

DCT และการวัดปริมาณแบบบล็อก

การบีบอัด JPEG ทำงานโดยแบ่งภาพออกเป็นบล็อกพิกเซลขนาด 8×8 และใช้การแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) กับแต่ละบล็อก เพื่อลดขนาดไฟล์ การบีบอัดจะวัดค่าองค์ประกอบความถี่สูง ซึ่งจะช่วยกำจัดรายละเอียดที่ละเอียดออกไป เมื่อระดับการวัดค่าสูงเกินไป (กล่าวคือ การบีบอัดที่แรงขึ้น) กระบวนการนี้จะทำให้เกิดขอบบล็อกที่มองเห็นได้ สูญเสียพื้นผิว และแถบสี รูปภาพที่สร้างโดย AI โดยเฉพาะรูปภาพที่มีการไล่ระดับสีที่ซับซ้อนและพื้นผิวละเอียด จะเสี่ยงต่อสิ่งแปลกปลอมเหล่านี้อย่างมาก หากบันทึกหรือส่งเป็น JPEG โดยไม่มีการตั้งค่าคุณภาพที่เพียงพอ

ประเภทสิ่งประดิษฐ์ทั่วไป

  • **การบล็อค (Macroblocking)**เมื่อบล็อกขนาด 8×8 ทั้งหมดแยกออกจากกันอย่างเห็นได้ชัด จะสร้างรูปแบบ “กระดานหมากรุก”
  • เอฟเฟกต์เสียงกริ่ง/คอนทัวร์:การบิดเบือนคล้ายรัศมีตามขอบคม ซึ่งเกิดจากการสูญเสียส่วนประกอบความถี่สูง
  • การแบ่งแถบสี:การไล่ระดับสีแบบเรียบเนียนจะค่อยๆ จางหายไปเป็น "แถบ" สีที่แตกต่างกันเมื่อความแตกต่างที่ละเอียดอ่อนถูกกำจัดออกไป

Midjourney รองรับรูปแบบไฟล์อะไรบ้าง และมีการเปลี่ยนแปลงอะไรบ้างเมื่อเร็วๆ นี้

รูปแบบใดบ้างที่เป็นแบบดั้งเดิมของ Midjourney?

โดยค่าเริ่มต้น Midjourney จะส่งไฟล์ PNG ที่มีความละเอียดสูงแบบไม่สูญเสียข้อมูล 8 บิตต่อช่องสัญญาณ (RGB 24 บิต) โดยรักษาค่าพิกเซลทุกพิกเซลไว้ เมื่อคุณอัปสเกลหรือใช้โหมด "อัปสเกลแบบเบา" คุณยังคงได้รับไฟล์ PNG ผ่านปุ่มดาวน์โหลดแกลเลอรีเว็บ อย่างไรก็ตาม ภาพขนาดย่อที่แสดงใน Discord โดยตรงจะแสดงเป็น WebP (รูปแบบที่ไม่สูญเสียข้อมูล/ไม่สูญเสียข้อมูลแบบทันสมัย) เพื่อเพิ่มความเร็วในการโหลด ขึ้นอยู่กับเบราว์เซอร์หรือไคลเอนต์ Discord ของคุณ การดาวน์โหลดโดยคลิกขวาอาจดึงภาพขนาดย่อ WebP แทนที่จะเป็น PNG แบบเต็ม

เหตุใดผู้ใช้บางรายจึงพบผลลัพธ์เป็น JPEG กะทันหัน?

ปัจจัยบางประการทำให้เกิดการแปลง JPEG โดยไม่สมัครใจ:

  1. ท่อส่งของบุคคลที่สาม: หากคุณกำหนดเส้นทางภาพ Midjourney ผ่านบอทหรือเครื่องมืออัตโนมัติที่ตั้งค่าเริ่มต้นให้บันทึกเป็น JPG สำหรับเพย์โหลดขนาดเล็ก คุณจะสืบทอดอาร์ทิแฟกต์
  2. สคริปต์การประมวลผลแบบแบตช์: ตัวอัปสเกลชุมชนบางตัว (เช่น Automatic1111 สำหรับการแพร่กระจายที่เสถียร) จะบันทึกเอาท์พุตในรูปแบบเดียวกับอินพุต โดยเปลี่ยน PNG สุดท้ายกลับเป็น JPG หากทำการเชื่อมต่อหลัง JPG
  3. ค่าเริ่มต้นของแพลตฟอร์ม: แพลตฟอร์มโซเชียลมีเดีย เช่น Instagram หรือ Twitter จะบีบอัดไฟล์ที่ผู้ใช้อัปโหลดให้เป็นรูปแบบ JPEG โดยอัตโนมัติ ส่งผลให้คุณภาพของภาพแย่ลงไปอีก

คุณจะลดสิ่งแปลกปลอม JPEG ในภาพของคุณได้อย่างไร?

แม้ว่าคุณจะไม่สามารถเปลี่ยนนโยบายการบีบอัดเริ่มต้นของ Discord ได้ แต่คุณสามารถเพิ่มประสิทธิภาพเวิร์กโฟลว์ของคุณเพื่อรักษาความเที่ยงตรงของภาพได้

ใช้รูปแบบไร้การสูญเสียและการส่งออกบิตเรตที่สูงขึ้น

  • ดาวน์โหลด PNG โดยตรง:ดาวน์โหลดรูปภาพเวอร์ชัน PNG จากแอปเว็บ Midjourney เสมอ แทนที่จะพึ่งพาการแสดงตัวอย่าง Discord PNG ช่วยหลีกเลี่ยงปัญหาการวัดปริมาณแบบ JPEG
  • ระบุคุณภาพที่สูงกว่า:หากคุณต้องใช้ JPEG (สำหรับการจัดส่งทางเว็บ ฯลฯ) ให้ส่งออกด้วยการตั้งค่าคุณภาพ 90–100% เพื่อรักษาค่าสัมประสิทธิ์ DCT มากขึ้นและลดขอบเขตบล็อกที่มองเห็นได้

ปรับเวิร์กโฟลว์ของคุณเพื่อหลีกเลี่ยงการบีบอัดซ้ำ

  • ข้ามเลเยอร์ตัวอย่างของ Discord:ใน Discord ให้แทนที่ลิงก์จาก media.discordapp.net สีสดสวย cdn.discordapp.com เพื่อเข้าถึงอัพโหลดต้นฉบับโดยไม่ต้องบีบอัดตัวอย่าง
  • รักษาการบีบอัดแบบขั้นตอนเดียว:เปิดไฟล์ PNG ต้นฉบับของคุณเพียงครั้งเดียวในโปรแกรมแก้ไขของคุณ หากจำเป็นต้องใช้ JPEG ให้ส่งออกโดยตรงโดยไม่ต้องแก้ไขเพิ่มเติมหรือบันทึกซ้ำ

ใช้ประโยชน์จากการลบสิ่งประดิษฐ์ที่ขับเคลื่อนด้วย AI

งานวิจัยล่าสุดได้สร้างแบบจำลองตามการแพร่กระจายที่สามารถลบสิ่งแปลกปลอมใน JPEG ได้อย่างเลือกสรรในขณะที่ยังคงรักษารายละเอียดเอาไว้ ตัวอย่างเช่น แบบจำลอง CODiff ใช้ตัวฝังภาพที่รับรู้การบีบอัด (CaVE) เพื่อนำทางตัวลดสัญญาณรบกวนการแพร่กระจายแบบขั้นตอนเดียว ทำให้สามารถลดสิ่งแปลกปลอมได้ในระดับที่ล้ำสมัยด้วยค่าใช้จ่ายขั้นต่ำ

ใช้ MidJourney ใน CometAPI

CometAPI ช่วยให้เข้าถึงโมเดล AI ได้มากกว่า 500 โมเดล รวมถึงโมเดลโอเพ่นซอร์สและโมเดลมัลติโมดัลเฉพาะทางสำหรับการแชท รูปภาพ โค้ด และอื่นๆ จุดแข็งหลักของ CometAPI อยู่ที่การทำให้กระบวนการบูรณาการ AI ที่มีความซับซ้อนแบบดั้งเดิมนั้นง่ายขึ้น

โคเมทเอพีไอ เสนอราคาต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ API กลางการเดินทางและคุณสามารถทดลองใช้งานฟรีในบัญชีของคุณได้หลังจากลงทะเบียนและเข้าสู่ระบบแล้ว! ยินดีต้อนรับสู่การลงทะเบียนและสัมผัสประสบการณ์ CometAPICometAPI จ่ายตามการใช้งาน

ข้อกำหนดเบื้องต้นที่สำคัญ: ก่อนที่จะใช้ MidJourney V7 คุณต้องเริ่มสร้างบน CometAPI วันนี้ – ลงทะเบียน เข้าใช้งานได้ฟรีที่นี่ กรุณาเยี่ยมชม เอกสาร.

การเริ่มต้นใช้งาน MidJourney V7 นั้นง่ายมาก เพียงเพิ่ม --v 7 พารามิเตอร์ที่ส่วนท้ายของพรอมต์ของคุณ คำสั่งง่ายๆ นี้จะบอก CometAPI ให้ใช้โมเดล V7 ล่าสุดเพื่อสร้างอิมเมจของคุณ

โปรดดูที่ API กลางการเดินทาง สำหรับรายละเอียดการบูรณาการ


สรุป

การทำความเข้าใจว่าไฟล์ JPEG เข้ามาอยู่ในเวิร์กโฟลว์ Midjourney ของคุณที่ใดและเพราะเหตุใด จะช่วยให้คุณดำเนินขั้นตอนที่เป็นรูปธรรมเพื่อรักษาศักยภาพในการสร้างสรรค์ทั้งหมดของโมเดลได้ ไม่ว่าจะผ่านการใช้ PNG เชิงกลยุทธ์ แนวทางการส่งออกที่คล่องตัว หรือเครื่องมือลบไฟล์ JPEG ที่ทันสมัย ​​ก็สามารถแสดงให้เห็นถึงความเที่ยงตรงอันน่าทึ่งของ V7 ได้โดยไม่ต้องเผชิญกับผลข้างเคียงที่ไม่ต้องการจากการบีบอัดข้อมูลที่มีการสูญเสีย

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%