ในช่วงไม่กี่สัปดาห์ที่ผ่านมา มีการพัฒนาที่สำคัญสองประการที่ทำให้ Midjourney กลับมาเป็นที่สนใจอีกครั้ง ได้แก่ การเปิดตัวรุ่น V7 ซึ่งเป็นรุ่นอัลฟ่าที่ทุกคนรอคอยมานาน และคดีละเมิดลิขสิทธิ์ที่ฟ้องร้องโดย Disney และ Universal แม้ว่า V7 จะสัญญาว่าจะปรับปรุงคุณภาพของภาพได้อย่างมาก แต่ผู้ใช้จำนวนมากยังคงพบกับปัญหาภาพ JPEG ที่เป็น "ภาพแตก" หรือ "ภาพสั่น" ที่ไม่คาดคิดเมื่อบันทึกและแชร์ผลงานสร้างสรรค์ของตน บทความนี้จะเจาะลึกถึงสาเหตุหลักของปัญหาเหล่านี้ อธิบายการทำงานของการบีบอัด JPEG และเสนอแนวทางปฏิบัติเพื่อลดการบิดเบือนที่ไม่ต้องการในภาพที่สร้างโดย Midjourney
Midjourney V7 คืออะไร?
Midjourney V7 ถือเป็นการออกแบบโมเดลใหม่ทั้งหมดครั้งแรกในรอบกว่าหนึ่งปี โดยมาพร้อมกับความเร็วที่รวดเร็วขึ้น การตีความที่รวดเร็วชาญฉลาดยิ่งขึ้น และความเที่ยงตรงของภาพที่ได้รับการปรับปรุง
การปรับปรุงที่สำคัญใน V7
- เพิ่มรายละเอียดและความสอดคล้องกัน:ตามบันทึกการเปิดตัวของ Midjourney ระบุว่า V7 มอบความละเอียดพื้นผิวที่สูงขึ้นอย่างเห็นได้ชัด และการเรนเดอร์องค์ประกอบที่ซับซ้อนได้สม่ำเสมอมากขึ้น ไม่ว่าจะเป็นมือ รอยพับของผ้า และทิวทัศน์ธรรมชาติ ซึ่งทั้งหมดล้วนแสดงการไล่ระดับสีที่นุ่มนวลกว่าและรายละเอียดที่ละเอียดกว่าเมื่อเปรียบเทียบกับ V6.1
- การปรับแต่งตามค่าเริ่มต้น:V7 เป็นรุ่น Midjourney รุ่นแรกที่มี "การปรับแต่งส่วนบุคคล" แบบเริ่มต้น ซึ่งผู้ใช้ต้องให้คะแนนภาพตัวอย่างประมาณ 200 ภาพเพื่อปลดล็อกประสบการณ์ที่ปรับแต่งส่วนบุคคลอย่างสมบูรณ์ วงจรข้อเสนอแนะนี้ช่วยให้ระบบปรับเอาต์พุตให้สอดคล้องกับความชอบด้านสุนทรียศาสตร์ของแต่ละบุคคลได้ดีขึ้น
การเปิดตัว Alpha และการเข้าถึงชุมชน
Midjourney เปิดตัว V7 สำหรับการทดสอบอัลฟ่าในช่วงต้นเดือนเมษายน 2025 สมาชิกชุมชนสามารถเข้าถึงโมเดลใหม่ได้โดยผนวก --v 7 ตั้งค่าสถานะเป็นการแจ้งเตือนหรือผ่านช่องทาง V7 เฉพาะ การเปิดตัวรุ่นอัลฟ่านี้ช่วยให้สามารถทดสอบการปรับปรุงหลักของโมเดลได้อย่างกว้างขวางยิ่งขึ้น ไม่ว่าจะเป็นความเข้าใจอย่างรวดเร็ว คุณภาพของภาพ และความสอดคล้องกัน ก่อนจะเปิดตัวสู่สาธารณะเต็มรูปแบบ
เหตุใดฉันจึงเห็นสิ่งประดิษฐ์ JPEG ในภาพ Midjourney ของฉัน
แม้ว่า V7 จะทำการเรนเดอร์โดยใช้ไฟล์ PNG ภายใน แต่ผู้ใช้หลายรายยังคงรายงานถึงอาตีแฟกต์การบีบอัดแบบ JPEG การบิดเบือนที่มองเห็นได้นี้มักเกิดขึ้นระหว่างการจัดการดาวน์สตรีม โดยเฉพาะบนแพลตฟอร์มอย่าง Discord
การสร้าง PNG ภายในและการแปลง JPEG ภายนอก
Midjourney สร้างและจัดเก็บรูปภาพในรูปแบบ PNG ที่ไม่มีการสูญเสียข้อมูล ทำให้มั่นใจได้ว่ารายละเอียดทั้งหมดของโมเดลและการไล่ระดับสีที่ละเอียดอ่อนจะคงอยู่ อย่างไรก็ตาม เมื่อแชร์ไฟล์เหล่านี้บน Discord หรือดาวน์โหลดผ่านลิงก์บางรายการ ไฟล์เหล่านี้อาจถูกแปลงเป็นรูปแบบที่มีการสูญเสียข้อมูล (JPEG หรือ WebP) เพื่อประสิทธิภาพแบนด์วิดท์
การบีบอัดข้อมูลอัตโนมัติของ Discord
ตามค่าเริ่มต้น Discord จะเข้ารหัสรูปภาพขนาดใหญ่ใหม่เพื่อลดขนาดไฟล์ โดยมักจะใช้การบีบอัด JPEG หรือ WebP ขั้นตอนอัตโนมัตินี้จะทำให้เกิดการสร้างภาพขอบบล็อก (“การบล็อกมาโคร”) และการเปลี่ยนสีเล็กน้อย ซึ่งสามารถสังเกตเห็นได้ชัดเจนโดยเฉพาะในเฉดสีแบบไล่ระดับที่ราบรื่นหรือพื้นหลังที่สม่ำเสมอ
การบีบอัดซ้ำที่เกิดจากเวิร์กโฟลว์
แม้ว่า Midjourney จะสร้างและจัดเก็บรูปภาพภายในเป็นไฟล์ PNG ที่ไม่มีการสูญเสียข้อมูลหรือแม้กระทั่งภาพที่มีความแม่นยำสูงกว่า แต่ทันทีที่คุณเลือก "บันทึกเป็น JPEG" หรือแชร์ผ่านแพลตฟอร์มที่แปลงเป็น JPEG โดยอัตโนมัติ (เช่น แกลเลอรีบนเว็บบางแห่ง โซเชียลมีเดีย) สิ่งแปลกปลอมก็จะปรากฏขึ้น พร็อกซีรูปภาพของ Discord เบราว์เซอร์ที่บันทึกภาพตัวอย่างเป็น WebP และการแปลงโดยคลิกขวาที่ "บันทึกรูปภาพเป็น..." ทั้งหมดนี้ทำให้เกิดการบีบอัดซ้ำ ขั้นตอนการบีบอัดซ้ำแต่ละขั้นตอนจะสะสมการสูญเสียจากการสร้างภาพ การครอบตัด การปรับขนาด หรือการเข้ารหัสใหม่ที่การตั้งค่าคุณภาพเริ่มต้น (มักจะอยู่ที่ประมาณ 75–85%) จะขยายการบล็อกและการแบ่งแถบ
การบีบอัด JPEG สร้างสิ่งแปลกปลอมได้อย่างไร
ความเข้าใจเกี่ยวกับพื้นฐานทางเทคนิคของการเข้ารหัส JPEG จะช่วยให้ทราบสาเหตุที่เกิดสิ่งแปลกปลอม และวิธีต่อสู้กับสิ่งแปลกปลอมเหล่านี้
DCT และการวัดปริมาณแบบบล็อก
การบีบอัด JPEG ทำงานโดยแบ่งภาพออกเป็นบล็อกพิกเซลขนาด 8×8 และใช้การแปลงโคไซน์แบบไม่ต่อเนื่อง (DCT) กับแต่ละบล็อก เพื่อลดขนาดไฟล์ การบีบอัดจะวัดค่าองค์ประกอบความถี่สูง ซึ่งจะช่วยกำจัดรายละเอียดที่ละเอียดออกไป เมื่อระดับการวัดค่าสูงเกินไป (กล่าวคือ การบีบอัดที่แรงขึ้น) กระบวนการนี้จะทำให้เกิดขอบบล็อกที่มองเห็นได้ สูญเสียพื้นผิว และแถบสี รูปภาพที่สร้างโดย AI โดยเฉพาะรูปภาพที่มีการไล่ระดับสีที่ซับซ้อนและพื้นผิวละเอียด จะเสี่ยงต่อสิ่งแปลกปลอมเหล่านี้อย่างมาก หากบันทึกหรือส่งเป็น JPEG โดยไม่มีการตั้งค่าคุณภาพที่เพียงพอ
ประเภทสิ่งประดิษฐ์ทั่วไป
- **การบล็อค (Macroblocking)**เมื่อบล็อกขนาด 8×8 ทั้งหมดแยกออกจากกันอย่างเห็นได้ชัด จะสร้างรูปแบบ “กระดานหมากรุก”
- เอฟเฟกต์เสียงกริ่ง/คอนทัวร์:การบิดเบือนคล้ายรัศมีตามขอบคม ซึ่งเกิดจากการสูญเสียส่วนประกอบความถี่สูง
- การแบ่งแถบสี:การไล่ระดับสีแบบเรียบเนียนจะค่อยๆ จางหายไปเป็น "แถบ" สีที่แตกต่างกันเมื่อความแตกต่างที่ละเอียดอ่อนถูกกำจัดออกไป
Midjourney รองรับรูปแบบไฟล์อะไรบ้าง และมีการเปลี่ยนแปลงอะไรบ้างเมื่อเร็วๆ นี้
รูปแบบใดบ้างที่เป็นแบบดั้งเดิมของ Midjourney?
โดยค่าเริ่มต้น Midjourney จะส่งไฟล์ PNG ที่มีความละเอียดสูงแบบไม่สูญเสียข้อมูล 8 บิตต่อช่องสัญญาณ (RGB 24 บิต) โดยรักษาค่าพิกเซลทุกพิกเซลไว้ เมื่อคุณอัปสเกลหรือใช้โหมด "อัปสเกลแบบเบา" คุณยังคงได้รับไฟล์ PNG ผ่านปุ่มดาวน์โหลดแกลเลอรีเว็บ อย่างไรก็ตาม ภาพขนาดย่อที่แสดงใน Discord โดยตรงจะแสดงเป็น WebP (รูปแบบที่ไม่สูญเสียข้อมูล/ไม่สูญเสียข้อมูลแบบทันสมัย) เพื่อเพิ่มความเร็วในการโหลด ขึ้นอยู่กับเบราว์เซอร์หรือไคลเอนต์ Discord ของคุณ การดาวน์โหลดโดยคลิกขวาอาจดึงภาพขนาดย่อ WebP แทนที่จะเป็น PNG แบบเต็ม
เหตุใดผู้ใช้บางรายจึงพบผลลัพธ์เป็น JPEG กะทันหัน?
ปัจจัยบางประการทำให้เกิดการแปลง JPEG โดยไม่สมัครใจ:
- ท่อส่งของบุคคลที่สาม: หากคุณกำหนดเส้นทางภาพ Midjourney ผ่านบอทหรือเครื่องมืออัตโนมัติที่ตั้งค่าเริ่มต้นให้บันทึกเป็น JPG สำหรับเพย์โหลดขนาดเล็ก คุณจะสืบทอดอาร์ทิแฟกต์
- สคริปต์การประมวลผลแบบแบตช์: ตัวอัปสเกลชุมชนบางตัว (เช่น Automatic1111 สำหรับการแพร่กระจายที่เสถียร) จะบันทึกเอาท์พุตในรูปแบบเดียวกับอินพุต โดยเปลี่ยน PNG สุดท้ายกลับเป็น JPG หากทำการเชื่อมต่อหลัง JPG
- ค่าเริ่มต้นของแพลตฟอร์ม: แพลตฟอร์มโซเชียลมีเดีย เช่น Instagram หรือ Twitter จะบีบอัดไฟล์ที่ผู้ใช้อัปโหลดให้เป็นรูปแบบ JPEG โดยอัตโนมัติ ส่งผลให้คุณภาพของภาพแย่ลงไปอีก
คุณจะลดสิ่งแปลกปลอม JPEG ในภาพของคุณได้อย่างไร?
แม้ว่าคุณจะไม่สามารถเปลี่ยนนโยบายการบีบอัดเริ่มต้นของ Discord ได้ แต่คุณสามารถเพิ่มประสิทธิภาพเวิร์กโฟลว์ของคุณเพื่อรักษาความเที่ยงตรงของภาพได้
ใช้รูปแบบไร้การสูญเสียและการส่งออกบิตเรตที่สูงขึ้น
- ดาวน์โหลด PNG โดยตรง:ดาวน์โหลดรูปภาพเวอร์ชัน PNG จากแอปเว็บ Midjourney เสมอ แทนที่จะพึ่งพาการแสดงตัวอย่าง Discord PNG ช่วยหลีกเลี่ยงปัญหาการวัดปริมาณแบบ JPEG
- ระบุคุณภาพที่สูงกว่า:หากคุณต้องใช้ JPEG (สำหรับการจัดส่งทางเว็บ ฯลฯ) ให้ส่งออกด้วยการตั้งค่าคุณภาพ 90–100% เพื่อรักษาค่าสัมประสิทธิ์ DCT มากขึ้นและลดขอบเขตบล็อกที่มองเห็นได้
ปรับเวิร์กโฟลว์ของคุณเพื่อหลีกเลี่ยงการบีบอัดซ้ำ
- ข้ามเลเยอร์ตัวอย่างของ Discord:ใน Discord ให้แทนที่ลิงก์จาก
media.discordapp.netสีสดสวยcdn.discordapp.comเพื่อเข้าถึงอัพโหลดต้นฉบับโดยไม่ต้องบีบอัดตัวอย่าง - รักษาการบีบอัดแบบขั้นตอนเดียว:เปิดไฟล์ PNG ต้นฉบับของคุณเพียงครั้งเดียวในโปรแกรมแก้ไขของคุณ หากจำเป็นต้องใช้ JPEG ให้ส่งออกโดยตรงโดยไม่ต้องแก้ไขเพิ่มเติมหรือบันทึกซ้ำ
ใช้ประโยชน์จากการลบสิ่งประดิษฐ์ที่ขับเคลื่อนด้วย AI
งานวิจัยล่าสุดได้สร้างแบบจำลองตามการแพร่กระจายที่สามารถลบสิ่งแปลกปลอมใน JPEG ได้อย่างเลือกสรรในขณะที่ยังคงรักษารายละเอียดเอาไว้ ตัวอย่างเช่น แบบจำลอง CODiff ใช้ตัวฝังภาพที่รับรู้การบีบอัด (CaVE) เพื่อนำทางตัวลดสัญญาณรบกวนการแพร่กระจายแบบขั้นตอนเดียว ทำให้สามารถลดสิ่งแปลกปลอมได้ในระดับที่ล้ำสมัยด้วยค่าใช้จ่ายขั้นต่ำ
ใช้ MidJourney ใน CometAPI
CometAPI ช่วยให้เข้าถึงโมเดล AI ได้มากกว่า 500 โมเดล รวมถึงโมเดลโอเพ่นซอร์สและโมเดลมัลติโมดัลเฉพาะทางสำหรับการแชท รูปภาพ โค้ด และอื่นๆ จุดแข็งหลักของ CometAPI อยู่ที่การทำให้กระบวนการบูรณาการ AI ที่มีความซับซ้อนแบบดั้งเดิมนั้นง่ายขึ้น
โคเมทเอพีไอ เสนอราคาต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณบูรณาการ API กลางการเดินทางและคุณสามารถทดลองใช้งานฟรีในบัญชีของคุณได้หลังจากลงทะเบียนและเข้าสู่ระบบแล้ว! ยินดีต้อนรับสู่การลงทะเบียนและสัมผัสประสบการณ์ CometAPICometAPI จ่ายตามการใช้งาน
ข้อกำหนดเบื้องต้นที่สำคัญ: ก่อนที่จะใช้ MidJourney V7 คุณต้องเริ่มสร้างบน CometAPI วันนี้ – ลงทะเบียน เข้าใช้งานได้ฟรีที่นี่ กรุณาเยี่ยมชม เอกสาร.
การเริ่มต้นใช้งาน MidJourney V7 นั้นง่ายมาก เพียงเพิ่ม --v 7 พารามิเตอร์ที่ส่วนท้ายของพรอมต์ของคุณ คำสั่งง่ายๆ นี้จะบอก CometAPI ให้ใช้โมเดล V7 ล่าสุดเพื่อสร้างอิมเมจของคุณ
โปรดดูที่ API กลางการเดินทาง สำหรับรายละเอียดการบูรณาการ
สรุป
การทำความเข้าใจว่าไฟล์ JPEG เข้ามาอยู่ในเวิร์กโฟลว์ Midjourney ของคุณที่ใดและเพราะเหตุใด จะช่วยให้คุณดำเนินขั้นตอนที่เป็นรูปธรรมเพื่อรักษาศักยภาพในการสร้างสรรค์ทั้งหมดของโมเดลได้ ไม่ว่าจะผ่านการใช้ PNG เชิงกลยุทธ์ แนวทางการส่งออกที่คล่องตัว หรือเครื่องมือลบไฟล์ JPEG ที่ทันสมัย ก็สามารถแสดงให้เห็นถึงความเที่ยงตรงอันน่าทึ่งของ V7 ได้โดยไม่ต้องเผชิญกับผลข้างเคียงที่ไม่ต้องการจากการบีบอัดข้อมูลที่มีการสูญเสีย
