การขอ API แฟลช-ไลท์ Gemini 2.5 เป็นตัวแทนของผลิตภัณฑ์ล่าสุดของ Google ในกลุ่มโมเดลการใช้เหตุผลแบบไฮบริด ซึ่งออกแบบมาเพื่อส่งมอบ ความคุ้มทุนที่ไม่มีใครเทียบได้ และ เวลาแฝงต่ำมาก สำหรับแอปพลิเคชั่นที่มีปริมาณข้อมูลสูงและมีความหน่วงเวลาสูง
ข้อมูลพื้นฐานและคุณสมบัติ
Flash-Lite ซึ่งเปิดตัวในรุ่นพรีวิวเมื่อวันที่ 17 มิถุนายน 2025 ได้ปิดท้ายกลุ่มผลิตภัณฑ์ Gemini 2.5 ร่วมกับ Flash และ Pro โดยมอบตัวเลือกที่เหมาะสมสำหรับนักพัฒนา ความเร็ว, ราคา-ประสิทธิภาพและ การคิดแบบปรับตัว ความสามารถ .
คุณสามารถเริ่มใช้ Gemini 2.5 Flash-Lite ได้โดยระบุ “gemini-2.5-flash-lite” ในโค้ดของคุณ หากคุณใช้เวอร์ชันพรีวิว คุณสามารถเปลี่ยนไปใช้ “gemini-2.5-flash-lite” ซึ่งเหมือนกับเวอร์ชันพรีวิว Google วางแผนที่จะลบชื่อแทนเวอร์ชันพรีวิวสำหรับ Flash-Lite ในวันที่ 25 สิงหาคม
| Stability | รุ่น | วันที่ |
| เสถียร (GA) | gemini-2.5-flash-lite | กรกฎาคม 22, 2025 |
| ตัวอย่างการทดลอง | gemini-2.5-flash-lite-06-17 | ระยะเวลาวางจำหน่าย: 17 มิถุนายน – 25 สิงหาคม 2025 |
| รุ่นล่าสุด | gemini-2.5-flash-lite-preview-09-2025 | 09-2025 |
- การควบคุมความคิด: ดำเนินการตาม งบประมาณการคิดแบบไดนามิก ผ่านพารามิเตอร์ API ที่มีการคิด ปิดใช้งานโดยค่าเริ่มต้น เพื่อเพิ่มความเร็วให้สูงสุดและลดต้นทุน
- ความล่าช้าต่ำ: ออกแบบมาเพื่อ เวลาที่รวดเร็วในการรับโทเค็นแรกFlash-Lite ช่วยลดค่าใช้จ่ายในการเริ่มต้นระบบ โดยลดเวลาแฝงให้ต่ำกว่า 100 มิลลิวินาทีบนโครงสร้างพื้นฐาน Google Cloud มาตรฐาน
- ปริมาณงานสูง:ด้วยท่อถอดรหัสที่มีประสิทธิภาพ จึงรองรับ หลายร้อยโทเค็นต่อวินาทีปลดล็อคประสบการณ์ผู้ใช้แบบเรียลไทม์ในแชทบอทและแอปพลิเคชันสตรีมมิ่ง
- การสนับสนุนหลายรูปแบบ:แม้ว่าจะได้รับการปรับให้เหมาะสมโดยเฉพาะสำหรับข้อความ แต่ Flash-Lite ยังยอมรับ ภาพ, เสียงและ วีดีโอ อินพุตผ่าน Gemini API ช่วยให้เกิดกรณีการใช้งานที่หลากหลายตั้งแต่การสรุปเอกสารไปจนถึงงานการมองเห็นแบบแสง
รายละเอียดทางเทคนิค
- การใช้เหตุผลเชิงปรับตัว:
Gemini 2.5 Flash-Liteรองรับตามความต้องการ คิดโดยอนุญาตให้ผู้พัฒนาจัดสรรทรัพยากรการประมวลผลได้เฉพาะเมื่อจำเป็นต้องมีการใช้เหตุผลที่ลึกซึ้งกว่าเท่านั้น - การรวมเครื่องมือ:เข้ากันได้อย่างสมบูรณ์กับเครื่องมือดั้งเดิมของ Gemini 2.5 รวมถึง การต่อสายดินด้วยการค้นหาของ Google, การรันโค้ด, บริบท URLและ การเรียกใช้ฟังก์ชัน เพื่อเวิร์กโฟลว์หลายโหมดที่ราบรื่น
- โมเดลบริบทโปรโตคอล (MCP):ใช้ประโยชน์จาก MCP ของ Google เพื่อดึงข้อมูลเว็บแบบเรียลไทม์ เพื่อให้แน่ใจว่ามีการตอบกลับ ทันเหตุการณ์ และ มีความเกี่ยวข้องตามบริบท.
- ตัวเลือกการปรับใช้: มีวางจำหน่ายผ่านทาง โคเมทเอพีไอ, API ราศีเมถุน, เวอร์เท็กซ์ AIและ กูเกิล เอไอ สตูดิโอโดยมีแทร็กการแสดงตัวอย่างสำหรับผู้เริ่มต้นใช้งานเพื่อทดลองและให้ข้อเสนอแนะ
ประสิทธิภาพมาตรฐานของ Gemini 2.5 Flash-Lite
- ความแอบแฝง: บรรลุถึง เวลาตอบสนองเฉลี่ยลดลง 50% เมื่อเทียบกับ Gemini 2.5 Flash ที่มีคุณลักษณะทั่วไป ต่ำกว่า 100 มิลลิวินาที ความหน่วงในการวัดมาตรฐานการจำแนกประเภทและสรุปผล
- ทางเข้า: ปรับให้เหมาะสมสำหรับ เสียงดัง ปริมาณงานที่รองรับการร้องขอได้หลายหมื่นรายการต่อนาทีโดยไม่ทำให้ประสิทธิภาพลดลง
- ราคา-ประสิทธิภาพ: แสดงให้เห็นถึง ลดต้นทุน 25% ต่อ 1,000 โทเค็น เทียบกับ Flash ทำให้มันกลายเป็น Pareto-เหมาะสมที่สุด ทางเลือกสำหรับการใช้งานที่คำนึงถึงต้นทุน
- การยอมรับในอุตสาหกรรม:ผู้ใช้ในช่วงแรกรายงานการบูรณาการที่ราบรื่นสู่ขั้นตอนการผลิตโดยที่มาตรวัดประสิทธิภาพสอดคล้องหรือเกินกว่าการคาดการณ์เริ่มต้น

กรณีการใช้งานในอุดมคติ
- งานที่มีความถี่สูงและความซับซ้อนต่ำ: การแท็กอัตโนมัติ การวิเคราะห์ความรู้สึก และการแปลจำนวนมาก
- ท่อส่งที่คำนึงถึงต้นทุน: การดึงข้อมูลจากคลังเอกสารขนาดใหญ่ การสรุปข้อมูลเป็นชุดเป็นระยะ
- สถานการณ์ Edge และ Mobile: เมื่อเวลาแฝงมีความสำคัญแต่มีงบประมาณทรัพยากรจำกัด
ข้อ จำกัด ของ Gemini 2.5 Flash-Lite
- สถานะการแสดงตัวอย่าง:อาจต้องมีการเปลี่ยนแปลง API ก่อน GA การรวมระบบควรคำนึงถึงการเปลี่ยนแปลงเวอร์ชันที่อาจเกิดขึ้น
- ไม่ต้องปรับแต่งแบบ On-the-Flyไม่สามารถอัปโหลดน้ำหนักที่กำหนดเองได้ ต้องอาศัยการแจ้งเตือนทางวิศวกรรมและข้อความของระบบ
- ความคิดสร้างสรรค์ลดลง:ปรับให้เหมาะกับงานที่กำหนดได้และปริมาณงานสูง ไม่เหมาะกับการสร้างแบบเปิดกว้างหรือการเขียน "เชิงสร้างสรรค์"
- เพดานทรัพยากร:ปรับขนาดเชิงเส้นได้สูงสุดถึง 16 vCPU เท่านั้น หากเกินกว่านี้ อัตราทรูพุตจะลดลง
- ข้อจำกัดหลายโหมด:รองรับอินพุตภาพ/เสียง แต่มีความเที่ยงตรงจำกัด ไม่เหมาะสำหรับงานที่มีภาพหนักหรือการถอดเสียง
- การแลกเปลี่ยนระหว่างหน้าต่างบริบท :แม้ว่าจะยอมรับโทเค็นสูงสุด 1 M แต่การอนุมานเชิงปฏิบัติในระดับนั้นอาจทำให้ปริมาณงานลดลง
วิธีการโทร Gemini 2.5 Flash-Lite API จาก CometAPI
เจมินี่ 2.5 แฟลช-ไลท์ ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:
- อินพุตโทเค็น: $0.08/M โทเค็น
- โทเค็นเอาต์พุต: $0.32/ M โทเค็น
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
วิธีการใช้งาน
- เลือก“
gemini-2.5-flash-lite” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:
- URL ฐาน: https://api.cometapi.com/v1/chat/completions
- ชื่อรุ่น: "
gemini-2.5-flash-lite" - รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEYส่วนหัว
ดูเพิ่มเติม ราศีเมถุน 2.5 โปร
