Gemini 2.5 Flash Image (หรือที่เรียกว่า “Nano banana”) คือโมเดลการสร้างและแก้ไขรูปภาพแบบเนทีฟใหม่ล่าสุดของ Google ในตระกูล Gemini 2.5 เน้นการผสมผสานภาพหลายภาพ การแก้ไขภาษาธรรมชาติที่แม่นยำ และเวิร์กโฟลว์แบบมัลติโมดัลที่รวดเร็ว
การแนะนำโมเดล
มันคืออะไร — ภาพแฟลช Gemini 2.5 เป็นโมเดลการสร้างและแก้ไขภาพแบบหลายโหมดที่สร้างขึ้นบนตระกูล Gemini 2.5 ออกแบบมาเพื่อผลิต ภาพเหมือนจริง, ดำเนินการ การแก้ไขแบบกำหนดเป้าหมาย (การทาสีทับ การถ่ายโอนสไตล์ การสลับวัตถุ) และ ผสมผสานภาพจากหลายแหล่ง เป็นผลลัพธ์เดียวที่มีความสอดคล้องกัน — ในขณะที่ใช้การใช้เหตุผลทางภาษาที่ได้รับการปรับปรุงของ Gemini เพื่อควบคุมการเรียบเรียงและความหมาย
หัวข้อสำคัญ
- การสร้างและแก้ไขภาพดั้งเดิม — สร้างรูปภาพหรือแก้ไขภาพที่มีอยู่โดยใช้คำแนะนำภาษาธรรมชาติ (สร้าง / แก้ไข).
- การรวมภาพหลายภาพ — รวมภาพอินพุตหลายภาพเข้าเป็นฉากที่เหมือนจริงฉากเดียว
- ความสม่ำเสมอของตัวละคร — รักษาลักษณะตัวละครหรือเรื่องเดียวกันในการแก้ไขและคำเตือนต่างๆ (ความสม่ำเสมอ).
- ลายน้ำ SynthID — เอาท์พุตทั้งหมดรวมถึง SynthID ที่มองไม่เห็น เพื่อระบุเนื้อหาที่สร้างโดย AI (ลายน้ำ).
รายละเอียดทางเทคนิค
- สถาปัตยกรรมและการวางตำแหน่ง: สร้างขึ้นบนตระกูล Gemini 2.5 Flash — ออกแบบมาเป็น เวลาแฝงต่ำ เวอร์ชัน "Flash" ที่เปลี่ยนขนาดโมเดล/ปริมาณงานเล็กน้อยเพื่อให้ตอบสนองต่อการโทรได้เร็วขึ้นมาก และคุ้มต้นทุนมากขึ้น ในขณะที่ยังคงการใช้เหตุผลที่แข็งแกร่งกว่าระดับ Flash รุ่นก่อนๆ
- รูปแบบและข้อจำกัดของอินพุต: ยอมรับ รูปภาพ base64 แบบอินไลน์ สำหรับอินพุตขนาดเล็กและ อัพโหลดไฟล์ ผ่าน File API สำหรับรูปภาพขนาดใหญ่ (แนะนำสำหรับไฟล์ขนาดมากกว่า 20 MB) รองรับประเภท MIME ทั่วไป (JPEG, PNG)
- โหมดการทำงาน: การแปลงข้อความเป็นรูปภาพ การแก้ไขรูปภาพ (การทาสีทับ / การปกปิดความหมาย) การถ่ายโอนสไตล์ การจัดองค์ประกอบหลายภาพ และ บรรณนิทัศน์ ตอบกลับข้อความ+รูปภาพ (มีประโยชน์สำหรับคำแนะนำแบบมีภาพประกอบ สูตรอาหาร หรือเนื้อหาผสม)
- ที่มาและกลไกความปลอดภัย: ลายน้ำที่มองเห็นได้บนเอาท์พุต AI รวมถึงเครื่องหมาย SynthID ที่ซ่อนอยู่และเลเยอร์การบังคับใช้นโยบายเพื่อจำกัดเนื้อหาที่ไม่อนุญาตอย่างชัดเจน
ประสิทธิภาพมาตรฐาน

ข้อจำกัดและความเสี่ยงที่ทราบ
- ข้อจำกัดนโยบายเนื้อหา: โมเดลบังคับใช้นโยบายเนื้อหา (เช่น ไม่อนุญาตให้มีเนื้อหาทางเพศที่ชัดเจนและเนื้อหาที่ผิดกฎหมายบางประเภท) แต่การบังคับใช้ยังไม่สมบูรณ์แบบ — การสร้างภาพของบุคคลสาธารณะหรือไอคอนที่ก่อให้เกิดการโต้แย้งอาจยังเป็นไปได้ในบางสถานการณ์ ดังนั้น การตรวจสอบนโยบายเป็นสิ่งจำเป็น. )
- โหมดความล้มเหลว: เป็นไปได้ การเลื่อนลอยของตัวตน ในการแก้ไขที่รุนแรง ความไม่ตรงกันทางความหมายที่เกิดขึ้นเป็นครั้งคราว (เมื่อมีการระบุคำเตือนไม่เพียงพอ) และสิ่งประดิษฐ์ในฉากที่ซับซ้อนมากหรือการเปลี่ยนแปลงมุมมองที่รุนแรง
- แหล่งที่มาและการใช้ในทางที่ผิด: แม้ว่าจะมีลายน้ำและ SynthID อยู่ แต่สิ่งเหล่านี้ไม่ได้ป้องกันการใช้งานในทางที่ผิด แต่ช่วยในการตรวจจับและระบุแหล่งที่มา แต่ไม่สามารถใช้แทนการตรวจสอบโดยมนุษย์ในเวิร์กโฟลว์ที่ละเอียดอ่อนได้
กรณีใช้งานทั่วไป
- ผลิตภัณฑ์และอีคอมเมิร์ซ: วาง/จัดรายการผลิตภัณฑ์ลงในภาพถ่ายไลฟ์สไตล์ ผ่านการรวมภาพหลายภาพ
- เครื่องมือ/การออกแบบที่สร้างสรรค์: การวนซ้ำอย่างรวดเร็ว ในแอปการออกแบบ (อ้างอิงการรวม Adobe Firefly)
- การแก้ไขและปรับแต่งภาพ: การแก้ไขจากภาษาธรรมชาติ (ลบวัตถุ, เปลี่ยนสี/แสง, เปลี่ยนรูปแบบใหม่)
- การเล่าเรื่อง / ทรัพย์สินตัวละคร: รักษาความสม่ำเสมอของตัวละคร ข้ามแผงและฉากต่างๆ
วิธีการโทร ภาพแฟลช Gemini 2.5 API จาก CometAPI
Gemini 2.5 Flash Image ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:
| ราคา | $0.3120 |
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
ใช้วิธีการ
- เลือก“
Gemini-2.5 Flash-Image” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:
- ปลายทาง:
https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent - พารามิเตอร์รุ่น: ตัวอย่างภาพแฟลช-2.5-เจมินี่ / ภาพแฟลช-2.5-เจมินี่
- รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEY - ชนิดของเนื้อหา:
application/json.
หมายเหตุ: เมื่อเรียกใช้ API ให้ตั้งค่าพารามิเตอร์ “stream”: true
curl --location --request POST 'https://api.cometapi.com/v1beta/models/gemini-2.5-flash-image-preview:generateContent' \
--header 'Authorization: sk-xxx' \
--header 'User-Agent: Apidog/1.0.0 (https://apidog.com)' \
--header 'Content-Type: application/json' \
--header 'Accept: */*' \
--header 'Host: api.cometapi.com' \
--header 'Connection: keep-alive' \
--data-raw '{
"contents": [
{
"role": "user",
"parts": [
{
"text": "cat"
},
{
"inline_data": {
"mime_type": "image/jpeg",
"data": "iVBORw0KGgoA Note: Base64 data here"
}
]
}
],
"generationConfig": {
"responseModalities": [
"TEXT",
"IMAGE"
]
}
}'
ดูเพิ่มเติม API ของ GPT-image-1



