จีพีที-อิมเมจ-1-มินิ คือ แบบจำลองภาพแบบหลายโหมดที่ปรับต้นทุนให้เหมาะสม จาก OpenAI ที่ยอมรับ อินพุตข้อความและรูปภาพ และผลิต เอาท์พุตภาพมันถูกวางตำแหน่งให้เป็นรุ่นน้องที่เล็กกว่าและราคาถูกกว่าของตระกูล GPT-Image-1 ทั้งหมดของ OpenAI ซึ่งออกแบบมาสำหรับการใช้งานในการผลิตที่มีปริมาณงานสูง ซึ่งต้นทุนและเวลาแฝงเป็นข้อจำกัดที่สำคัญ โมเดลนี้มีไว้สำหรับงานต่างๆ เช่น การสร้างข้อความเป็นรูปภาพ, การแก้ไขภาพ / การลงสีใหม่และเวิร์กโฟลว์ที่รวมภาพอ้างอิง
หัวข้อสำคัญ
- การสร้างข้อความ→รูปภาพ: แปลงคำเตือนภาษาธรรมชาติเป็นภาพพร้อมคำแนะนำการปฏิบัติตามอย่างเคร่งครัด
- การแก้ไขภาพ / การลงสีใหม่: ยอมรับภาพอ้างอิงและหน้ากากเพื่อดำเนินการแก้ไขแบบกำหนดเป้าหมาย
- การออกแบบที่ปรับต้นทุนให้เหมาะสม (“มินิ”): ขนาดเล็กกว่าที่ OpenAI และผู้สังเกตการณ์อธิบายว่ามีราคาถูกกว่ามากต่อภาพเมื่อเทียบกับโมเดลขนาดใหญ่ (ข้อความ OpenAI/DevDay และรายงานเบื้องต้นระบุว่าราคาถูกกว่าประมาณ 80%)
- การควบคุมเอาต์พุตที่ยืดหยุ่น: รองรับขนาด, รูปแบบเอาท์พุต (JPEG/PNG/WEBP), การบีบอัด และปุ่มปรับคุณภาพ (ต่ำ/กลาง/สูง/อัตโนมัติ ในคู่มือ)
รายละเอียดทางเทคนิค (สถาปัตยกรรมและความสามารถ)
- ครอบครัวโมเดลและอินพุต/เอาต์พุต: สมาชิกของ จีพีที-อิมเมจ-1 ครอบครัว; ยอมรับ ข้อความแจ้ง และ อินพุตภาพ (สำหรับการแก้ไข) และส่งคืนเอาท์พุตภาพที่สร้างขึ้น คุณภาพ/ขนาด พารามิเตอร์ควบคุมความละเอียด (โดยทั่วไปสูงสุด ~1536×1024 ในตระกูลนี้—ดูเอกสารสำหรับขนาดที่รองรับที่แน่นอน)
- การแลกเปลี่ยนการปฏิบัติงาน: ออกแบบมาให้เป็นรุ่นที่มีขนาดเล็กกว่า—แลกกับความเที่ยงตรงระดับสูงบางส่วน ปริมาณงานและต้นทุน การปรับปรุงในขณะที่ยังคงคุณลักษณะการติดตามและแก้ไขที่แข็งแกร่ง
- ความปลอดภัยและข้อมูลเมตา: ปฏิบัติตามแนวทางความปลอดภัยของภาพของ OpenAI และฝังตัวเลือกเมตาข้อมูล C2PA สำหรับแหล่งที่มาเมื่อพร้อมใช้งาน
อินพุตและเอาต์พุต — การใช้งานตามหลักเกณฑ์รองรับ:
- ข้อความแจ้ง (สตริง) เพื่อสร้างภาพใหม่
- ภาพ + หน้ากาก เพื่อดำเนินการแก้ไข/แก้ไขภาพแบบกำหนดเป้าหมาย
- ภาพอ้างอิง เพื่อควบคุมรูปแบบหรือองค์ประกอบ
สิ่งเหล่านี้จะถูกเปิดเผยผ่าน Images API (ชื่อรุ่นgpt-image-1-mini).
ข้อ จำกัด
- ความเที่ยงตรงสูงสุดที่ต่ำกว่า: เมื่อเปรียบเทียบกับโมเดล gpt-image-1 ขนาดใหญ่ โมเดลขนาดเล็กอาจ สูญเสียรายละเอียดเล็กๆ น้อยๆ และความสมจริงระดับสูง (ผลตอบแทนที่คาดหวังสำหรับต้นทุน)
- การเรนเดอร์ข้อความและรายละเอียดเล็กๆ น้อยๆ: เช่นเดียวกับโมเดลภาพอื่นๆ มันสามารถ ดิ้นรนกับตัวอักษรขนาดเล็กที่อ่านได้แผนภูมิที่มีความหนาแน่นสูงหรือพื้นผิวที่มีความละเอียดระดับไมโคร คาดว่าจะดำเนินการภายหลังหรือใช้โมเดลที่มีความจุสูงกว่าสำหรับความต้องการเหล่านี้
- แก้ไขขอบเขต: มีฟีเจอร์แก้ไข/ทาสีใหม่ แต่แนะนำบางอย่าง ข้อจำกัดในการแก้ไข เมื่อเทียบกับเครื่องมือเว็บ ChatGPT แบบโต้ตอบ การแก้ไขจะมีประสิทธิภาพสำหรับงานหลายอย่างแต่จำเป็นต้องมีการปรับปรุงซ้ำๆ
- ข้อจำกัดด้านความปลอดภัยและนโยบาย: ผลลัพธ์จะต้องอยู่ภายใต้การควบคุมดูแล/มาตรการความปลอดภัยของ OpenAI (เนื้อหาที่ไม่เหมาะสม ข้อจำกัดเนื้อหาที่มีลิขสิทธิ์ ผลลัพธ์ที่ไม่อนุญาต) นักพัฒนาสามารถควบคุมความละเอียดอ่อนในการควบคุมดูแลได้ผ่านพารามิเตอร์ API ที่มีให้
กรณีการใช้งานที่แนะนำ
- การสร้างเนื้อหาที่มีปริมาณมาก (สินทรัพย์ทางการตลาด ภาพขนาดย่อ งานศิลปะแนวคิดด่วน) — ที่ไหน ต้นทุนต่อภาพ เป็นหลัก
- การแก้ไขโปรแกรม / การสร้างเทมเพลต — การทาสีทับจำนวนมากหรือการสร้างตัวแปรจากสินทรัพย์ฐาน
- แอปพลิเคชันแบบโต้ตอบที่มีข้อจำกัดด้านงบประมาณ — อินเทอร์เฟซการแชทหรือเครื่องมือออกแบบแบบบูรณาการที่ความเร็วในการตอบสนองและต้นทุนมีความสำคัญมากกว่าความเที่ยงตรงสูงสุด
- การสร้างต้นแบบและการสร้างภาพ A/B — สร้างภาพผู้สมัครจำนวนมากอย่างรวดเร็วและปรับขนาดภาพอย่างเลือกสรรหรือรันซ้ำบนโมเดลขนาดใหญ่สำหรับผู้เข้ารอบสุดท้าย
วิธีการเรียกใช้ API gpt-image-1-mini จาก CometAPI
gpt-image-1-mini ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:
| อินพุตโทเค็น | $2.00 |
| โทเค็นเอาท์พุต | $6.40 |
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- ลงชื่อเข้าใช้ของคุณ คอนโซล CometAPI.
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง

ใช้วิธีการ
- เลือกปลายทาง “gpt-image-1-mini” เพื่อส่งคำขอ API และตั้งค่าเนื้อหาคำขอ วิธีการและเนื้อหาคำขอสามารถดูได้จากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีบริการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
- แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ การสร้างภาพ:
- URL ฐาน: https://api.cometapi.com/v1/images/generations
- ชื่อรุ่น: จีพีที-อิมเมจ-1-มินิ
- รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEYส่วนหัว - ชนิดของเนื้อหา:
application/json.
การแก้ไขรูปภาพ (gpt-image-1): https://api.cometapi.com/v1/images/แก้ไข
ดูเพิ่มเติม API ของ GPT-image-1


