วิธีแก้ไขรูปภาพโดยใช้ OpenAI GPT-Image-1 API

CometAPI
AnnaApr 28, 2025
วิธีแก้ไขรูปภาพโดยใช้ OpenAI GPT-Image-1 API

API GPT-Image-1 ของ OpenAI กำลังปฏิวัติแนวทางของนักพัฒนาและนักสร้างสรรค์ในการแก้ไขรูปภาพ ด้วยการรวมความสามารถมัลติโมดัลขั้นสูงเข้ากับข้อความแจ้งเตือนที่ใช้งานง่าย ทำให้สามารถจัดการรูปภาพได้อย่างแม่นยำและมีคุณภาพสูงโดยตรงผ่านโค้ด ไม่ว่าคุณต้องการสร้างภาพใหม่ แก้ไขรูปภาพที่มีอยู่ หรือสร้างรูปแบบต่างๆ gpt-image-1 ก็มีโซลูชันที่แข็งแกร่ง

gpt-image-1 คืออะไร?

GPT-Image-1 คือโมเดลการสร้างภาพล่าสุดของ OpenAI ซึ่งออกแบบมาเพื่อสร้างและแก้ไขภาพโดยอิงตามคำอธิบายข้อความ โดยสามารถทำความเข้าใจข้อความที่ซับซ้อนและสร้างภาพที่มีความเที่ยงตรงสูงซึ่งสอดคล้องกับความตั้งใจของผู้ใช้ คุณสมบัติหลัก ได้แก่:​

  • การสร้างภาพที่มีความเที่ยงตรงสูง: สร้างภาพที่มีรายละเอียดและถูกต้องแม่นยำ
  • สไตล์ภาพที่หลากหลาย:รองรับสุนทรียศาสตร์หลากหลาย ตั้งแต่แบบสมจริงไปจนถึงแบบนามธรรม
  • การแก้ไขภาพที่แม่นยำ: ช่วยให้สามารถปรับเปลี่ยนรูปภาพที่สร้างขึ้นได้อย่างตรงเป้าหมาย
  • ความรู้โลกที่อุดมสมบูรณ์:เข้าใจคำเตือนที่ซับซ้อนด้วยความแม่นยำตามบริบท
  • การแสดงข้อความที่สอดคล้องกัน:แสดงข้อความภายในรูปภาพได้อย่างน่าเชื่อถือ

แอปพลิเคชั่นในโลกแห่งความจริง

อุตสาหกรรมที่ใช้ประโยชน์จาก gpt-image-1 ได้แก่:​

  • การออกแบบและการสร้างต้นแบบ:เครื่องมือเช่น Figma ผสาน gpt-image-1 เพื่อปรับปรุงเวิร์กโฟลว์ที่สร้างสรรค์
  • E-Commerce:แพลตฟอร์มต่าง ๆ ใช้เพื่อสร้างภาพผลิตภัณฑ์และสื่อการตลาด
  • การศึกษา:สร้างไดอะแกรมและสื่อภาพสำหรับแพลตฟอร์มการเรียนรู้
  • การตลาด:สร้างกราฟิกโฆษณาและภาพบนโซเชียลมีเดียได้อย่างรวดเร็ว

การตั้งค่าสภาพแวดล้อมของคุณ

เบื้องต้น

ก่อนที่คุณจะเริ่มต้น ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:

  • คีย์ API ของ OpenAI
  • Python ติดตั้งอยู่บนระบบของคุณ
  • การขอ openai ติดตั้งแพ็คเกจ Python แล้ว

คุณสามารถติดตั้ง openai แพ็กเกจที่ใช้ pip:

bashpip install openai

การตั้งค่าไคลเอนต์ API ของ OpenAI

ขั้นแรก ให้ตั้งค่าไคลเอนต์ API ของ OpenAI ในสคริปต์ Python ของคุณ:​

pythonimport openai

openai.api_key = 'your-api-key-here'

แทนที่ 'your-api-key-here' ด้วยคีย์ API OpenAI จริงของคุณ


วิธีการแก้ไขรูปภาพด้วย GPT-Image-1

การแก้ไขรูปภาพทำงานอย่างไร?

GPT-Image-1 ช่วยให้คุณแก้ไขรูปภาพได้โดยจัดเตรียมรูปภาพพื้นฐาน หน้ากากเสริมเพื่อระบุพื้นที่ที่แก้ไขได้ และข้อความแจ้งที่อธิบายผลลัพธ์ที่ต้องการ API จะประมวลผลอินพุตเหล่านี้และส่งคืนรูปภาพที่แก้ไขแล้วซึ่งสอดคล้องกับข้อกำหนดของคุณ

การเตรียมภาพและหน้ากาก

ตรวจสอบให้แน่ใจว่ารูปภาพอินพุตและหน้ากากของคุณตรงตามเกณฑ์ต่อไปนี้:

  • ทั้งสองภาพควรเป็นภาพสี่เหลี่ยมจัตุรัส
  • หน้ากากควรเป็นไฟล์ PNG โปร่งใส โดยที่พื้นที่โปร่งใสระบุภูมิภาคที่ต้องการแก้ไข

การเขียนสคริปต์ Python

นี่คือตัวอย่างสคริปต์ Python สำหรับแก้ไขรูปภาพโดยใช้ API gpt-image-1:​

import requests
edit_url = "https://api.openai.com/v1/images/edits"
headers = {
"Authorization": "Bearer YOUR_API_KEY"
}
files = {
"image": open("input-image.png", "rb")
"mask":open("path_to_your_mask.png", "rb"),
}
data = {
"model": "gpt-image-1",
"prompt": "Add a bright red balloon in the sky",
"n": 1,
"size": "1024x1024"
}
response = requests.post(edit_url, headers=headers, files=files, data=data)
image_url = response.json()
print("Edited Image URL:", image_url)

แทนที่:

  • 'Bearer YOUR_API_KEY' ด้วยคีย์ API ของ OpenAI ของคุณ
  • "path_to_your_image.png" ด้วยเส้นทางสู่ภาพต้นฉบับของคุณ
  • "path_to_your_mask.png" พร้อมเส้นทางไปยังภาพหน้ากากของคุณ
  • "Describe the desired edit here" พร้อมคำอธิบายถึงการแก้ไขที่คุณต้องการทำ​

ตัวอย่าง: การเปลี่ยนแปลงสีของวัตถุ

สมมติว่าคุณมีรูปภาพลูกบอลสีแดง และคุณต้องการเปลี่ยนสีเป็นสีน้ำเงิน คำสั่งของคุณคือ:

pythonprompt="Change the red ball to a blue ball"

ตรวจสอบให้แน่ใจว่าหน้ากากของคุณเน้นเฉพาะบริเวณลูกบอลสีแดงเท่านั้น


GPT-รูปภาพ-1

เคล็ดลับและข้อควรพิจารณาขั้นสูง

คุณสมบัติขั้นสูงมีอะไรบ้าง?

  • การถ่ายโอนสไตล์: ใช้รูปแบบศิลปะที่แตกต่างกันโดยการแก้ไขคำเตือน
  • การเพิ่ม/ลบวัตถุ:เพิ่มหรือลบองค์ประกอบภายในรูปภาพด้วยคำอธิบายประกอบ
  • การแสดงผลข้อความ:แทรกข้อความลงในรูปภาพด้วยแบบอักษรและตำแหน่งที่กำหนด

ขนาดภาพและอัตราส่วนภาพ

API ของ GPT-Image-1 กำหนดให้รูปภาพต้องเป็นรูปสี่เหลี่ยมจัตุรัส โดยมีขนาดที่รองรับ เช่น 256×256, 512×512 หรือ 1024×1024 พิกเซล รูปภาพที่ไม่ใช่รูปสี่เหลี่ยมจัตุรัสอาจถูกปรับขนาดหรือครอบตัด ซึ่งอาจส่งผลต่อผลลัพธ์ได้

การใช้งานและต้นทุนโทเค็น

เมื่อใช้รูปภาพที่เข้ารหัสด้วย Base64 โปรดทราบว่าขนาดเพย์โหลดจะเพิ่มขึ้นประมาณ 33% ซึ่งอาจส่งผลต่อการใช้งานโทเค็นและต้นทุน หากต้องการบรรเทาปัญหานี้ โปรดพิจารณาโฮสต์รูปภาพของคุณและระบุ URL แทนข้อมูล Base64

ข้อจำกัดของโมเดล

แม้ว่า gpt-image-1 จะมีคุณสมบัติการแก้ไขรูปภาพที่ทรงพลัง แต่ก็อาจไม่สามารถจัดการการแก้ไขที่ซับซ้อนที่เกี่ยวข้องกับหลายวัตถุหรือรายละเอียดที่ซับซ้อนได้อย่างมีประสิทธิภาพเท่ากับซอฟต์แวร์แก้ไขรูปภาพเฉพาะทาง เหมาะที่สุดสำหรับการแก้ไขโดยตรงโดยมีคำแนะนำที่ชัดเจน

แนวทางปฏิบัติที่ดีที่สุดเพื่อผลลัพธ์ที่ดีที่สุด

จะปรับปรุงผลลัพธ์การแก้ไขรูปภาพได้อย่างไร?

  • เฉพาะเจาะจง:การแจ้งให้ทราบอย่างละเอียดจะทำให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น
  • ใช้รูปภาพคุณภาพสูง:ให้แน่ใจว่าภาพฐานมีความชัดเจนและมีแสงสว่างเพียงพอ
  • ทดสอบคำเตือนต่างๆ:ทดลองใช้คำอธิบายต่างๆ เพื่อให้ได้ผลลัพธ์ที่ต้องการ
  • มาสก์เลเวอเรจ:ใช้หน้ากากเพื่อควบคุมพื้นที่ที่แก้ไขได้อย่างแม่นยำ

การรวม gpt-image-1 เข้ากับเวิร์กโฟลว์การออกแบบ

การผสานรวม gpt-image-1 เข้ากับเครื่องมือต่างๆ เช่น Figma และ Adobe Firefly จะทำให้กระบวนการออกแบบมีประสิทธิภาพมากขึ้น นักออกแบบสามารถสร้างและแก้ไขรูปภาพได้โดยตรงภายในแพลตฟอร์มเหล่านี้โดยใช้ข้อความแจ้งเตือน ทำให้สามารถสร้างต้นแบบและทำซ้ำได้อย่างรวดเร็ว

ตัวอย่างเช่น ใน Figma คุณสามารถเลือกองค์ประกอบการออกแบบ ป้อนคำสั่ง เช่น "เพิ่มเงาให้กับอ็อบเจ็กต์นี้" และการรวม GPT-Image-1 จะใช้การแก้ไขตามนั้น


สรุป

API GPT-Image-1 ของ OpenAI ถือเป็นความก้าวหน้าครั้งสำคัญในการแก้ไขรูปภาพที่ขับเคลื่อนด้วย AI ด้วยการเปิดใช้คำแนะนำภาษาธรรมชาติเพื่อแนะนำการแก้ไขรูปภาพ ทำให้ผู้ออกแบบและนักพัฒนาสามารถสร้างและแก้ไขภาพได้อย่างมีประสิทธิภาพ ด้วยการบูรณาการกับเครื่องมือออกแบบที่พัฒนาอย่างต่อเนื่อง gpt-image-1 จึงพร้อมที่จะกลายเป็นสินทรัพย์ที่ขาดไม่ได้ในเวิร์กโฟลว์สร้างสรรค์

เริ่มต้นใช้งาน

นักพัฒนาสามารถเข้าถึงได้ API ของ GPT-image-1  ตลอด โคเมทเอพีไอในการเริ่มต้น ให้สำรวจความสามารถของโมเดลใน Playground และดู คู่มือ API (ชื่อรุ่น: gpt-image-1) สำหรับคำแนะนำโดยละเอียด โปรดทราบว่านักพัฒนาบางคนอาจจำเป็นต้องตรวจสอบองค์กรของตนก่อนใช้โมเดลนี้

GPT-Image-1 ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:

โทเค็นเอาต์พุต: $32/ M โทเค็น

อินพุตโทเค็น: $8 / M โทเค็น

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%