Gemini 2.0 Flash Exp-Image-Generation API เป็นเครื่องมือ AI หลายโหมดเชิงทดลองจาก Google ที่ช่วยให้นักพัฒนาสามารถสร้างและแก้ไขรูปภาพควบคู่ไปกับข้อความด้วยคำสั่งภาษาธรรมชาติ โดยใช้ประโยชน์จากความรู้เกี่ยวกับโลกและความเข้าใจบริบทเพื่อสร้างผลลัพธ์ภาพที่มีความสอดคล้องกัน

ภาพรวมสินค้า
การขอ gemini-2.0-flash-exp-image-generation โมเดลนี้เป็นตัวแปรทดลองของ Gemini 2.0 Flash AI ของ Google ซึ่งออกแบบมาเพื่อสร้างและแก้ไขภาพโดยใช้คำสั่งภาษาธรรมชาติ โมเดลนี้เป็นส่วนหนึ่งของโครงการ Gemini ที่กว้างขึ้นของ Google ซึ่งมุ่งเน้นไปที่ความสามารถของ AI แบบหลายโหมด ซึ่งช่วยให้สามารถผสานรวมข้อความ รูปภาพ เสียง และวิดีโออินพุตได้อย่างราบรื่น
Key Features
- การแก้ไขภาพสนทนา:ผู้ใช้สามารถปรับแต่งรูปภาพได้อย่างต่อเนื่องผ่านบทสนทนาหลายรอบ โดยรักษาบริบทตลอดการสนทนา คุณสมบัตินี้มีประโยชน์อย่างยิ่งสำหรับงานต่างๆ เช่น การสร้างโฆษณา โพสต์บนโซเชียลมีเดีย หรือการเชิญ
- การแสดงผลข้อความที่ได้รับการปรับปรุง:แตกต่างจากโมเดลการสร้างภาพอื่นๆ จำนวนมากที่ประสบปัญหาในการแสดงข้อความอย่างแม่นยำ Gemini 2.0 Flash แสดงให้เห็นถึงความสามารถที่ได้รับการปรับปรุงในการสร้างภาพที่มีข้อความที่อ่านออกและมีการจัดรูปแบบที่ดี ทำให้เหมาะกับเนื้อหาที่รวมข้อมูลภาพและข้อความเข้าด้วยกัน
- การบูรณาการความรู้ของโลก:โมเดลนี้ใช้ประโยชน์จากความเข้าใจโลกเพื่อสร้างภาพที่สมจริงและเหมาะสมกับบริบท เช่น การแสดงสูตรอาหารหรือเนื้อหาทางการศึกษา
- การสร้างภาพด้วยการรวมข้อความ:Gemini 2.0 Flash โดดเด่นในด้านการสร้างเรื่องราวที่มีภาพประกอบซึ่งข้อความและรูปภาพทำงานร่วมกันได้อย่างกลมกลืน เมื่อได้รับมอบหมายให้เล่าเรื่องราว โมเดลสามารถสร้างภาพประกอบที่รักษาตัวละครและฉากที่สอดคล้องกันตลอดเรื่องราวได้ ซึ่งทำให้มีประโยชน์อย่างยิ่งในการสร้างเรื่องราวของเด็ก เนื้อหาเพื่อการศึกษา หรือสื่อการตลาด
เริ่มต้นใช้งาน
นักพัฒนาและผู้ผู้ใช้สามารถทดลองใช้โมเดลนี้ได้โดย:
- กูเกิล เอไอ สตูดิโอ:ด้วยการเลือกโมเดล “Gemini 2.0 Flash Experimental” ผู้ใช้สามารถป้อนคำแนะนำและรับภาพที่สร้างขึ้นโดยตรงภายในแพลตฟอร์มได้
- API ราศีเมถุน:สามารถเข้าถึงโมเดลได้ผ่าน Gemini API ซึ่งช่วยให้สามารถรวมเข้ากับแอปพลิเคชันและบริการได้
- GitHub เริ่มต้นใช้งานด่วน:Google จัดทำคู่มือเริ่มต้นใช้งานด่วนสำหรับ Next.js บน GitHub สำหรับนักพัฒนาที่สนใจในการสร้างแอปพลิเคชันที่ใช้ความสามารถในการสร้างและแก้ไขภาพของ Gemini
สิ่งที่ควรพิจารณา
แม้ว่าโมเดลนี้จะมีคุณสมบัติขั้นสูง แต่สิ่งสำคัญที่ต้องทราบคือ:
- สถานะการทดลอง:เนื่องจากเป็นการเปิดตัวรุ่นทดลอง ดังนั้นโมเดลนี้อาจมีข้อจำกัด และอาจมีการพัฒนาและปรับแต่งอย่างต่อเนื่อง
- ลายน้ำ:รูปภาพที่สร้างขึ้นทั้งหมดมีลายน้ำ SynthID เพื่อระบุเนื้อหาที่สร้างโดย AI ส่งเสริมความโปร่งใสและการใช้งานอย่างรับผิดชอบ
- การใช้อย่างมีจริยธรรมผู้ใช้ควรคำนึงถึงประเด็นทางจริยธรรม โดยเฉพาะอย่างยิ่งเกี่ยวกับการสร้างภาพที่เกี่ยวข้องกับบุคคลจริงหรือเนื้อหาที่ละเอียดอ่อน
หากต้องการดูภาพรวมและการสาธิตความสามารถของ Gemini 2.0 Flash โปรดดูวิดีโอต่อไปนี้ซึ่งให้ข้อมูลที่เป็นประโยชน์:
วิธีการเรียกใช้ Gemini 2.0 Flash Exp-Image-Generation API จาก CometAPI
1.ล็อกอิน ไปยัง โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
2.รับรหัส API ของข้อมูลรับรองการเข้าถึง ของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx และส่ง
- รับ URL ของเว็บไซต์นี้: https://api.cometapi.com/
4 เลือก Gemini 2.0 Flash Exp-การสร้างภาพ (ราคา: $0.04 จ่ายต่อการดู) จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอจะได้รับจาก เอกสาร API ของเว็บไซต์ของเราเว็บไซต์ของเรายังให้บริการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
▪️ แทนที่ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
▪️ ใส่คำถามหรือคำขอของคุณลงในช่องเนื้อหา ซึ่งเป็นสิ่งที่นางแบบจะตอบสนอง
สำหรับข้อมูลการเปิดตัวโมเดลใน Comet API โปรดดู https://api.cometapi.com/new-model.
สำหรับข้อมูลราคาโมเดลใน Comet API โปรดดู https://api.cometapi.com/pricing
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI ผสานรวม Google Gemini API รุ่นล่าสุด โปรดดู API เจมินี่ 2.5 โปร และ API แฟลช Gemini 2.0 สำหรับรายละเอียดการบูรณาการ



