OpenAI ตรวจจับภาพที่สร้างโดย AI ได้อย่างไร

CometAPI
AnnaMay 16, 2025
OpenAI ตรวจจับภาพที่สร้างโดย AI ได้อย่างไร

รูปภาพที่สร้างโดยปัญญาประดิษฐ์กำลังเปลี่ยนแปลงอุตสาหกรรมสร้างสรรค์ การสื่อสารมวลชน และการสื่อสารดิจิทัล เนื่องจากเครื่องมือเหล่านี้เข้าถึงได้ง่ายขึ้น การรับรองความถูกต้องของเนื้อหาวิดีโอจึงกลายเป็นปัญหาสำคัญ OpenAI ซึ่งเป็นผู้นำด้านการวิจัยและการนำ AI มาใช้ ได้ริเริ่มกลยุทธ์ต่างๆ มากมายเพื่อตรวจจับและติดป้ายกำกับรูปภาพที่สร้างขึ้นโดยโมเดลเชิงสร้างสรรค์ บทความนี้จะตรวจสอบกลไกที่ OpenAI ใช้ในการระบุรูปภาพที่สร้างโดย AI โดยอาศัยการพัฒนาล่าสุดในด้านลายน้ำ มาตรฐานเมตาเดตา แหล่งที่มาของเนื้อหา และการวิจัยการตรวจจับที่เกิดขึ้นใหม่

เหตุใดจึงต้องตรวจจับรูปภาพที่สร้างโดย AI?

การแพร่กระจายของเครื่องสร้างภาพด้วย AI ก่อให้เกิดความเสี่ยงตั้งแต่การแพร่กระจายของข้อมูลที่ผิดพลาดและการสร้างภาพแบบ Deepfake ไปจนถึงการลอกเลียนแบบผลงานของศิลปินโดยไม่ได้รับอนุญาต การตรวจจับภาพที่สร้างโดย AI ช่วยให้องค์กรข่าวตรวจสอบแหล่งที่มา ปกป้องสิทธิในทรัพย์สินทางปัญญา และรักษาความไว้วางใจของสาธารณชนที่มีต่อสื่อดิจิทัล นอกจากนี้ การติดฉลากที่ชัดเจนยังช่วยให้แพลตฟอร์มและผู้ใช้สามารถใช้หลักเกณฑ์การควบคุมดูแลและโปรโตคอลลิขสิทธิ์ที่เหมาะสมได้ หากไม่มีวิธีการตรวจจับที่แข็งแกร่ง ภาพที่ถูกปลอมแปลงอาจส่งผลต่อการเลือกตั้ง บิดเบือนความคิดเห็นของสาธารณชน หรือละเมิดลิขสิทธิ์ด้านความคิดสร้างสรรค์โดยที่เหยื่อแทบไม่มีช่องทางในการเยียวยา

OpenAI นำการตรวจจับแบบอิงตามลายน้ำไปใช้ได้อย่างไร

OpenAI ได้เริ่มทดสอบลายน้ำที่มองเห็นได้และมองไม่เห็นโดยเฉพาะสำหรับภาพที่สร้างขึ้นโดยใช้เครื่องสร้าง "omnimodal" GPT-4o สำหรับผู้ใช้ ChatGPT แบบฟรี รูปภาพอาจมีลายน้ำที่มองเห็นได้เล็กน้อย เช่น โอเวอร์เลย์ที่มีลวดลายหรือแท็กมุม ซึ่งระบุแหล่งที่มาของ AI ลายน้ำเหล่านี้สามารถตรวจจับได้ด้วยโปรแกรมโดยการสแกนหาลวดลายที่ฝังไว้ ในทางตรงกันข้าม สมาชิกที่ชำระเงินมักจะได้รับภาพที่ไม่มีลายน้ำ แต่ภาพเหล่านี้ยังคงมีลายเซ็นที่มองไม่เห็นในข้อมูลพิกเซลหรือข้อมูลเมตา

การฝึกอบรมการฉีดลายน้ำและการจำแนกประเภท

กระบวนการฝังลายน้ำเกิดขึ้นภายหลังการสร้าง ระหว่างการฝึก เครือข่ายจำแนกประเภทจะเรียนรู้ที่จะจดจำสัญญาณลายน้ำ ไม่ว่าจะเป็นภาพซ้อนที่มองเห็นได้หรือการรบกวนในแอมพลิจูดของพิกเซล และทำการแฟล็กภาพตามนั้น โดยการฝึกร่วมกันระหว่างตัวแทรกลายน้ำและตัวตรวจจับ OpenAI จึงรับประกันความแม่นยำในการตรวจจับที่สูงในขณะที่รักษาสิ่งแปลกปลอมทางสายตาให้น้อยที่สุด การทดสอบในช่วงแรกแสดงให้เห็นอัตราการตรวจจับที่สูงกว่า 95% สำหรับภาพที่มีลายน้ำ โดยมีค่าบวกปลอมที่เกือบเป็นศูนย์ในภาพถ่ายมนุษย์ที่ไม่ได้แก้ไข

ข้อจำกัดของแนวทางการใช้ลายน้ำ

ลายน้ำสามารถลบหรือทำลายได้โดยการแก้ไขรูปภาพง่ายๆ เช่น การครอบตัด การบีบอัด หรือการปรับสี การวิจัยแสดงให้เห็นว่าการรบกวนจากฝ่ายตรงข้ามที่มีความเข้มข้นเพียง 1% ของพิกเซลสามารถหลบเลี่ยงการตรวจจับลายน้ำได้โดยไม่เกิดความแตกต่างที่มองเห็นได้ ซึ่งแสดงให้เห็นถึงการแข่งขันระหว่างผู้ปกป้องลายน้ำและผู้โจมตีด้วยการหลบเลี่ยง

OpenAI ใช้ประโยชน์จากข้อมูลเมตาของ C2PA เพื่อพิสูจน์ที่มาได้อย่างไร

OpenAI ยังฝังเมตาเดตาที่มาที่สอดคล้องกับกรอบงาน Coalition for Content Provenance and Authenticity (C2PA) อีกด้วย เมตาเดตานี้ซึ่งประกอบด้วยข้อมูลที่มีโครงสร้างรวมถึงเวอร์ชันของโมเดล ไทม์สแตมป์ของรุ่น และการระบุผู้ใช้ จะได้รับการลงนามด้วยการเข้ารหัสเพื่อป้องกันการปลอมแปลง

กระบวนการฝังและการตรวจสอบ

เมื่อส่งออกรูปภาพ API ของ OpenAI จะแนบไฟล์ Manifest ของ C2PA ไว้ในส่วนหัวหรือไฟล์เสริม ไฟล์ Manifest นี้ประกอบด้วย:

  • ตัวระบุรุ่น (เช่น, gpt-4o-image-1)
  • พารามิเตอร์การสร้าง (ข้อความแจ้งเตือน, ค่าเมล็ดพันธุ์)
  • ไทม์สแตมป์และรหัสผู้ใช้
  • ลายเซ็นดิจิทัล จากคีย์ส่วนตัวของ OpenAI

เครื่องมือตรวจสอบที่สร้างไว้ในแพลตฟอร์มเนื้อหาหรือพร้อมใช้งานเป็นยูทิลิตี้โอเพนซอร์สจะใช้คีย์สาธารณะของ OpenAI เพื่อยืนยันลายเซ็นและอ่านเมนิเฟสต์ หากไม่มีข้อมูลเมตาหรือลายเซ็นไม่ถูกต้อง รูปภาพอาจถูกทำเครื่องหมายว่าไม่ผ่านการตรวจสอบสิทธิ์

OpenAI

ข้อได้เปรียบเหนือลายน้ำที่มองเห็นได้

เมตาดาต้ามีความทนทานต่อการปรับแต่งรูปภาพแบบง่ายๆ การครอบตัดหรือการจัดระดับสีมักจะช่วยรักษาส่วนหัวของไฟล์ นอกจากนี้ เมตาดาต้ายังช่วยให้มีชุดข้อมูลที่สมบูรณ์ยิ่งขึ้นสำหรับการติดตามแหล่งที่มา แพลตฟอร์มต่างๆ สามารถติดตามวงจรชีวิตของรูปภาพทั้งหมดได้ โดยระบุทั้งการสร้างและการแก้ไขในภายหลัง ซึ่งแตกต่างจากลายน้ำที่มองเห็นได้ เมตาดาต้าจะมองไม่เห็นสำหรับผู้ใช้ปลายทาง ทำให้รักษาความสมบูรณ์ของสุนทรียศาสตร์ไว้ได้

ChatGPT สามารถตรวจจับภาพวาดที่สร้างโดย AI เองได้หรือไม่

ChatGPT มีความแม่นยำในระดับใดในการตรวจจับสิ่งแปลกปลอมทางภาพสังเคราะห์

การศึกษาวิจัยในปี 2024 จากมหาวิทยาลัยบัฟฟาโลได้ประเมินความสามารถของ ChatGPT ในการตรวจจับภาพที่สร้างโดย AI (จากการแพร่กระจายแฝงและโมเดล StyleGAN) โดยใช้คำแนะนำที่จัดทำขึ้นอย่างพิถีพิถัน ChatGPT สามารถตรวจจับสิ่งแปลกปลอมสังเคราะห์ได้ด้วยความแม่นยำ 79.5% บนภาพที่สร้างโดยการแพร่กระจาย และ 77.2% บนเอาต์พุต StyleGAN ซึ่งประสิทธิภาพเทียบได้กับเครื่องตรวจจับดีพเฟกเฉพาะทางในช่วงแรกๆ

ควรออกแบบการแจ้งเตือนอย่างไรเพื่อการตรวจจับที่เหมาะสมที่สุด?

แนวทางปฏิบัติที่ดีที่สุดแนะนำให้รวมคำแนะนำที่ชัดเจนเพื่อวิเคราะห์ความสม่ำเสมอของรูปทรงเรขาคณิต แสง และความไม่เรียบของพื้นผิว ตัวอย่างเช่น:

“ตรวจสอบภาพว่ามีมุมเงาที่ไม่สม่ำเสมอ รูปแบบพื้นผิวซ้ำซาก และขอบที่เรียบเนียนไม่เป็นธรรมชาติหรือไม่ ระบุว่าสัญญาณเหล่านี้บ่งชี้ถึงต้นกำเนิดของแบบจำลองการแพร่กระจายหรือไม่”
แนวทางที่ชัดเจนดังกล่าวจะช่วยกำหนดความสนใจของโมเดลให้มุ่งเน้นไปที่สัญญาณทางนิติเวชมากกว่าความหมายผิวเผิน

มีกลไกการตรวจจับแบบพาสซีฟด้วยหรือไม่?

แม้ว่าระบบลายน้ำและเมตาข้อมูลของ OpenAI จะเป็นเชิงรุก แต่การตรวจจับแบบพาสซีฟจะวิเคราะห์สิ่งแปลกปลอมที่มีอยู่ในภาพที่สร้างโดย AI เช่น ความผิดปกติทางสถิติในรูปแบบของสัญญาณรบกวน ความไม่สอดคล้องของพื้นผิว หรือรอยเท้าการบีบอัดที่เหลือจากโมเดลการแพร่กระจาย

ตัวจำแนกประเภทตามสิ่งประดิษฐ์

การวิจัยอิสระได้แสดงให้เห็นว่าเครื่องกำเนิดไฟฟ้าแบบกระจายตัวนั้นสามารถถ่ายทอดลายเซ็นโดเมนความถี่ที่ละเอียดอ่อนได้ ตัวตรวจจับแบบพาสซีฟใช้เครือข่ายประสาทเทียมแบบคอนโวลูชั่นที่ฝึกมาจากชุดข้อมูลขนาดใหญ่ของภาพจริงเทียบกับภาพ AI เพื่อตรวจจับสิ่งแปลกปลอมเหล่านี้ แม้ว่า OpenAI จะยังไม่ได้เปิดเผยรายละเอียดเกี่ยวกับตัวตรวจจับแบบพาสซีฟที่เป็นกรรมสิทธิ์ของบริษัทใดๆ ต่อสาธารณะ แต่บริษัทก็ร่วมมือกับทีมวิชาการเพื่อประเมินวิธีการดังกล่าวในการทำเครื่องหมายภาพที่ไม่มีลายน้ำ

การบูรณาการกับท่อควบคุม

สามารถผสานรวมเครื่องตรวจจับแบบพาสซีฟเข้ากับเวิร์กโฟลว์การกลั่นกรองเนื้อหาได้ โดยรูปภาพที่ไม่มีข้อมูลเมตาของ C2PA หรือลายน้ำที่มองเห็นได้จะได้รับการตรวจสอบเพิ่มเติมโดยตัวจำแนกอาร์ทิแฟกต์ แนวทางแบบหลายชั้นนี้ช่วยลดการพึ่งพาวิธีการเดียวและลดกลวิธีหลีกเลี่ยงที่ลบหรือเปลี่ยนแปลงลายน้ำ

มีมาตรการป้องกันอะไรบ้างเพื่อป้องกันการใช้ในทางที่ผิด?

กระบวนการสร้างภาพของ OpenAI อยู่ภายใต้การควบคุมของนโยบายเนื้อหา ซึ่งรวมถึง:

  1. การกรองแบบแจ้งเตือน:บล็อกการร้องขอเนื้อหาที่ไม่อนุญาต (Deepfake ของบุคคลจริง, กิจกรรมที่ผิดกฎหมาย)
  2. การตรวจสอบบริบท:การป้องกันการสร้างภาพที่เป็นอันตรายหรือส่งเสริมความเกลียดชัง
  3. การบังคับใช้ลายน้ำ:เพื่อให้แน่ใจว่ารูปภาพแบบฟรีเทียร์ทั้งหมดมีเครื่องหมายที่ตรวจจับได้
  4. รายงานผู้ใช้:อนุญาตให้แพลตฟอร์มทำเครื่องหมายภาพที่น่าสงสัยเพื่อตรวจสอบด้วยตนเอง

การป้องกันเหล่านี้ร่วมกันก่อให้เกิดกลยุทธ์การป้องกันเชิงลึก โดยรวมการตรวจจับทางเทคนิคเข้ากับนโยบายและการกำกับดูแลโดยมนุษย์

การตรวจจับและการยืนยันยังคงท้าทายอะไรบ้าง?

แม้จะมีความก้าวหน้าเหล่านี้ แต่ยังคงมีอุปสรรคบางประการอยู่:

การขจัดและหลีกเลี่ยงความขัดแย้ง

ผู้ดำเนินการที่มีความซับซ้อนสามารถใช้การโจมตีที่ใช้ AI เพื่อลบหรือบิดเบือนลายน้ำและข้อมูลเมตา หรือใช้ตัวกรองที่เป็นปฏิปักษ์เพื่อหลอกเครื่องตรวจจับแบบพาสซีฟ จำเป็นต้องมีการวิจัยอย่างต่อเนื่องเพื่อเสริมความแข็งแกร่งให้กับอัลกอริทึมลายน้ำและฝึกตัวจำแนกใหม่เพื่อต่อต้านเวกเตอร์การโจมตีใหม่ๆ

การทำงานร่วมกันข้ามแพลตฟอร์ม

หากต้องการให้เมตาเดตาที่มามีประสิทธิผล ระบบนิเวศของแพลตฟอร์มที่หลากหลาย เช่น โซเชียลเน็ตเวิร์ก แหล่งข่าว บรรณาธิการกราฟิก จะต้องนำมาตรฐาน C2PA มาใช้และให้เกียรติลายเซ็น OpenAI มีส่วนร่วมอย่างแข็งขันในกลุ่มอุตสาหกรรมเพื่อส่งเสริมการสร้างมาตรฐาน แต่การนำไปใช้อย่างทั่วถึงจะต้องใช้เวลา

การสร้างสมดุลระหว่างความเป็นส่วนตัวและความโปร่งใส

การฝังคำเตือนโดยละเอียดหรือตัวระบุผู้ใช้ทำให้ต้องคำนึงถึงความเป็นส่วนตัว OpenAI ต้องออกแบบโครงร่างข้อมูลเมตาอย่างระมัดระวังเพื่อรักษาที่มาโดยไม่เปิดเผยข้อมูลส่วนบุคคลที่ละเอียดอ่อน

ความพยายามในการตรวจจับในอนาคตจะดำเนินไปในทิศทางใด?

OpenAI และชุมชนนักวิจัยที่กว้างขึ้นกำลังสำรวจ:

  • ลายน้ำแบบปรับได้:ลายน้ำแบบไดนามิกในแต่ละภาพที่เปลี่ยนรูปแบบตามเนื้อหา ทำให้การลบออกซับซ้อนมากขึ้น
  • เครือข่ายตรวจจับแบบสหพันธ์:บันทึกที่แชร์และไม่เปิดเผยตัวตนของภาพ AI ที่ตรวจพบเพื่อปรับปรุงตัวจำแนกโดยไม่เปิดเผยข้อมูลส่วนตัว
  • เครื่องตรวจจับที่สามารถอธิบายได้:เครื่องมือที่ไม่เพียงแต่ทำเครื่องหมายรูปภาพที่สร้างโดย AI แต่ยังเน้นภูมิภาคหรือคุณสมบัติที่บ่งบอกถึงการสร้างได้มากที่สุด เพื่อช่วยในการตรวจสอบโดยมนุษย์
  • ที่มาบนพื้นฐานบล็อคเชน:บัญชีแยกประเภทที่ไม่เปลี่ยนแปลงซึ่งเชื่อมโยงข้อมูลเมตากับบันทึกบนเครือข่ายเพื่อการตรวจสอบที่ดียิ่งขึ้น

สรุป

การตรวจจับภาพที่สร้างโดย AI เป็นความท้าทายที่เปลี่ยนแปลงไปซึ่งต้องใช้การผสมผสานระหว่างการใส่ลายน้ำเชิงรุก การระบุแหล่งที่มาของข้อมูลเมตาที่มั่นคง และการวิเคราะห์สิ่งประดิษฐ์แบบพาสซีฟ แนวทางหลายชั้นของ OpenAI ได้แก่ ลายน้ำที่มองเห็นได้สำหรับผู้ใช้ฟรี เมตาข้อมูล C2PA สำหรับรูปภาพทั้งหมด และความร่วมมือในการวิจัยการตรวจจับแบบพาสซีฟ ถือเป็นรากฐานที่แข็งแกร่ง อย่างไรก็ตาม เกมแมวไล่หนูในการหลบเลี่ยงลายน้ำและการโจมตีแบบต่อต้านหมายความว่านวัตกรรมอย่างต่อเนื่องมีความจำเป็น OpenAI มุ่งมั่นที่จะปกป้องความสมบูรณ์ของสื่อภาพในโลกที่ขับเคลื่อนด้วย AI โดยพัฒนาเทคโนโลยีการตรวจจับควบคู่ไปกับการส่งเสริมมาตรฐานอุตสาหกรรมและแนวทางปฏิบัติทางจริยธรรม

เริ่มต้นใช้งาน

CometAPI มอบอินเทอร์เฟซ REST แบบรวมที่รวบรวมโมเดล AI หลายร้อยโมเดล รวมถึงกลุ่ม ChatGPT ภายใต้จุดสิ้นสุดที่สอดคล้องกัน พร้อมการจัดการคีย์ API ในตัว โควตาการใช้งาน และแดชบอร์ดการเรียกเก็บเงิน แทนที่จะต้องจัดการ URL และข้อมูลรับรองของผู้ขายหลายราย

นักพัฒนาสามารถเข้าถึงได้ API ของ GPT-image-1  (GPT‑4o รูปภาพ API ชื่อรุ่น: gpt-image-1) and API กลางการเดินทางตลอด โคเมทเอพีไอในการเริ่มต้น ให้สำรวจความสามารถของโมเดลใน Playground และดู คู่มือ API สำหรับคำแนะนำโดยละเอียด โปรดทราบว่านักพัฒนาบางคนอาจจำเป็นต้องตรวจสอบองค์กรของตนก่อนใช้โมเดลนี้

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%