GPT Image 2 คืออะไร?
GPT Image 2 เป็นโมเดลสร้างภาพล้ำสมัยของ OpenAI ที่ถูกรวมเข้ากับ ChatGPT โดยตรงในชื่อ ChatGPT Images 2.0 แตกต่างจากเครื่องมือแบบสแตนด์อโลนรุ่นก่อนอย่าง DALL·E 3 โมเดลนี้ผสานความเข้าใจภาษาจากตระกูล GPT เข้ากับการสังเคราะห์ภาพขั้นสูง โมเดลสามารถสร้างภาพที่แม่นยำ ใช้งานได้จริง และปรับให้เหมาะกับงานระดับมืออาชีพมากกว่าการทดลองเชิงศิลป์
ความสามารถหลัก
- การเรนเดอร์ข้อความเกือบสมบูรณ์แบบ: ให้ความแม่นยำในระดับอักขระ ~99% แสดงข้อความที่อ่านออกและถูกต้องตามบริบททั้งในภาษาอังกฤษและสคริปต์ที่ไม่ใช่ละติน รองรับย่อหน้ายาว เมนู โปสเตอร์ และอินโฟกราฟิก โดยไม่มีปัญหาตัวอักษรเพี้ยนที่พบในโมเดลรุ่นก่อนๆ
- องค์ประกอบซับซ้อนและความเที่ยงตรงของเลย์เอาต์: สร้างผลลัพธ์ที่มีโครงสร้าง เช่น ม็อกอัป UI แปลนพื้น การทำให้ข้อมูลเป็นภาพ สไลด์ แผนที่ หน้ามังงะ และกริดหลายองค์ประกอบ (เช่น อาร์เรย์ไอคอน 10x10 หรือโปสเตอร์สินค้า)
- รองรับหลายภาษาและบริบททางวัฒนธรรม: สร้างข้อความที่ถูกต้องและภาพที่สอดคล้องกับวัฒนธรรมในหลายภาษา
- การแก้ไขภาพและการจัดการภาพอ้างอิง: ปรับแก้ภาพที่อัปโหลดได้ โดยคงรายละเอียด ใบหน้า และสไตล์ไว้อย่างสม่ำเสมอสูง
- การสร้างเป็นชุด: สร้างภาพที่สอดคล้องกันได้สูงสุด 8 ภาพจากพรอมต์เดียว โดยรักษาความสม่ำเสมอของตัวละครและวัตถุทั่วทั้งชุด
- ความสมจริงระดับภาพถ่ายและความพร้อมใช้งาน: ผลลัพธ์ดูเป็นธรรมชาติและพร้อมใช้งานจริงมากขึ้น มีอาร์ติแฟกต์น้อยลง ไอคอนกราฟิกที่ดีขึ้น และการจัดองค์ประกอบแบบมืออาชีพ