API แฟลช-ไลท์ Gemini 2.5

CometAPI
AnnaJun 26, 2025
API แฟลช-ไลท์ Gemini 2.5

การขอ API แฟลช-ไลท์ Gemini 2.5 เป็นตัวแทนของผลิตภัณฑ์ล่าสุดของ Google ในกลุ่มโมเดลการใช้เหตุผลแบบไฮบริด ซึ่งออกแบบมาเพื่อส่งมอบ ความคุ้มทุนที่ไม่มีใครเทียบได้ และ เวลาแฝงต่ำมาก สำหรับแอปพลิเคชั่นที่มีปริมาณข้อมูลสูงและมีความหน่วงเวลาสูง


ข้อมูลพื้นฐานและคุณสมบัติ

Flash-Lite ซึ่งเปิดตัวในรุ่นพรีวิวเมื่อวันที่ 17 มิถุนายน 2025 ได้ปิดท้ายกลุ่มผลิตภัณฑ์ Gemini 2.5 ร่วมกับ Flash และ Pro โดยมอบตัวเลือกที่เหมาะสมสำหรับนักพัฒนา ความเร็ว, ราคา-ประสิทธิภาพและ การคิดแบบปรับตัว ความสามารถ .

คุณสามารถเริ่มใช้ Gemini 2.5 Flash-Lite ได้โดยระบุ “gemini-2.5-flash-lite” ในโค้ดของคุณ หากคุณใช้เวอร์ชันพรีวิว คุณสามารถเปลี่ยนไปใช้ “gemini-2.5-flash-lite” ซึ่งเหมือนกับเวอร์ชันพรีวิว Google วางแผนที่จะลบชื่อแทนเวอร์ชันพรีวิวสำหรับ Flash-Lite ในวันที่ 25 สิงหาคม

Stabilityรุ่นวันที่
เสถียร (GA)gemini-2.5-flash-liteกรกฎาคม 22, 2025
ตัวอย่างการทดลองgemini-2.5-flash-lite-06-17ระยะเวลาวางจำหน่าย: 17 มิถุนายน – 25 สิงหาคม 2025
รุ่นล่าสุดgemini-2.5-flash-lite-preview-09-202509-2025
  • การควบคุมความคิด: ดำเนินการตาม งบประมาณการคิดแบบไดนามิก ผ่านพารามิเตอร์ API ที่มีการคิด ปิดใช้งานโดยค่าเริ่มต้น เพื่อเพิ่มความเร็วให้สูงสุดและลดต้นทุน
  • ความล่าช้าต่ำ: ออกแบบมาเพื่อ เวลาที่รวดเร็วในการรับโทเค็นแรกFlash-Lite ช่วยลดค่าใช้จ่ายในการเริ่มต้นระบบ โดยลดเวลาแฝงให้ต่ำกว่า 100 มิลลิวินาทีบนโครงสร้างพื้นฐาน Google Cloud มาตรฐาน
  • ปริมาณงานสูง:ด้วยท่อถอดรหัสที่มีประสิทธิภาพ จึงรองรับ หลายร้อยโทเค็นต่อวินาทีปลดล็อคประสบการณ์ผู้ใช้แบบเรียลไทม์ในแชทบอทและแอปพลิเคชันสตรีมมิ่ง
  • การสนับสนุนหลายรูปแบบ:แม้ว่าจะได้รับการปรับให้เหมาะสมโดยเฉพาะสำหรับข้อความ แต่ Flash-Lite ยังยอมรับ ภาพ, เสียงและ วีดีโอ อินพุตผ่าน Gemini API ช่วยให้เกิดกรณีการใช้งานที่หลากหลายตั้งแต่การสรุปเอกสารไปจนถึงงานการมองเห็นแบบแสง

รายละเอียดทางเทคนิค

  • การใช้เหตุผลเชิงปรับตัว: Gemini 2.5 Flash-Lite รองรับตามความต้องการ คิดโดยอนุญาตให้ผู้พัฒนาจัดสรรทรัพยากรการประมวลผลได้เฉพาะเมื่อจำเป็นต้องมีการใช้เหตุผลที่ลึกซึ้งกว่าเท่านั้น
  • การรวมเครื่องมือ:เข้ากันได้อย่างสมบูรณ์กับเครื่องมือดั้งเดิมของ Gemini 2.5 รวมถึง การต่อสายดินด้วยการค้นหาของ Google, การรันโค้ด, บริบท URLและ การเรียกใช้ฟังก์ชัน เพื่อเวิร์กโฟลว์หลายโหมดที่ราบรื่น
  • โมเดลบริบทโปรโตคอล (MCP):ใช้ประโยชน์จาก MCP ของ Google เพื่อดึงข้อมูลเว็บแบบเรียลไทม์ เพื่อให้แน่ใจว่ามีการตอบกลับ ทันเหตุการณ์ และ มีความเกี่ยวข้องตามบริบท.
  • ตัวเลือกการปรับใช้: มีวางจำหน่ายผ่านทาง โคเมทเอพีไอ, API ราศีเมถุน, เวอร์เท็กซ์ AIและ กูเกิล เอไอ สตูดิโอโดยมีแทร็กการแสดงตัวอย่างสำหรับผู้เริ่มต้นใช้งานเพื่อทดลองและให้ข้อเสนอแนะ

ประสิทธิภาพมาตรฐานของ Gemini 2.5 Flash-Lite

  • ความแอบแฝง: บรรลุถึง เวลาตอบสนองเฉลี่ยลดลง 50% เมื่อเทียบกับ Gemini 2.5 Flash ที่มีคุณลักษณะทั่วไป ต่ำกว่า 100 มิลลิวินาที ความหน่วงในการวัดมาตรฐานการจำแนกประเภทและสรุปผล
  • ทางเข้า: ปรับให้เหมาะสมสำหรับ เสียงดัง ปริมาณงานที่รองรับการร้องขอได้หลายหมื่นรายการต่อนาทีโดยไม่ทำให้ประสิทธิภาพลดลง
  • ราคา-ประสิทธิภาพ: แสดงให้เห็นถึง ลดต้นทุน 25% ต่อ 1,000 โทเค็น เทียบกับ Flash ทำให้มันกลายเป็น Pareto-เหมาะสมที่สุด ทางเลือกสำหรับการใช้งานที่คำนึงถึงต้นทุน
  • การยอมรับในอุตสาหกรรม:ผู้ใช้ในช่วงแรกรายงานการบูรณาการที่ราบรื่นสู่ขั้นตอนการผลิตโดยที่มาตรวัดประสิทธิภาพสอดคล้องหรือเกินกว่าการคาดการณ์เริ่มต้น

API แฟลช-ไลท์ Gemini 2.5


กรณีการใช้งานในอุดมคติ

  • งานที่มีความถี่สูงและความซับซ้อนต่ำ: การแท็กอัตโนมัติ การวิเคราะห์ความรู้สึก และการแปลจำนวนมาก
  • ท่อส่งที่คำนึงถึงต้นทุน: การดึงข้อมูลจากคลังเอกสารขนาดใหญ่ การสรุปข้อมูลเป็นชุดเป็นระยะ
  • สถานการณ์ Edge และ Mobile: เมื่อเวลาแฝงมีความสำคัญแต่มีงบประมาณทรัพยากรจำกัด

ข้อ จำกัด ของ Gemini 2.5 Flash-Lite

  • สถานะการแสดงตัวอย่าง:อาจต้องมีการเปลี่ยนแปลง API ก่อน GA การรวมระบบควรคำนึงถึงการเปลี่ยนแปลงเวอร์ชันที่อาจเกิดขึ้น
  • ไม่ต้องปรับแต่งแบบ On-the-Flyไม่สามารถอัปโหลดน้ำหนักที่กำหนดเองได้ ต้องอาศัยการแจ้งเตือนทางวิศวกรรมและข้อความของระบบ
  • ความคิดสร้างสรรค์ลดลง:ปรับให้เหมาะกับงานที่กำหนดได้และปริมาณงานสูง ไม่เหมาะกับการสร้างแบบเปิดกว้างหรือการเขียน "เชิงสร้างสรรค์"
  • เพดานทรัพยากร:ปรับขนาดเชิงเส้นได้สูงสุดถึง 16 vCPU เท่านั้น หากเกินกว่านี้ อัตราทรูพุตจะลดลง
  • ข้อจำกัดหลายโหมด:รองรับอินพุตภาพ/เสียง แต่มีความเที่ยงตรงจำกัด ไม่เหมาะสำหรับงานที่มีภาพหนักหรือการถอดเสียง
  • การแลกเปลี่ยนระหว่างหน้าต่างบริบท :แม้ว่าจะยอมรับโทเค็นสูงสุด 1 M แต่การอนุมานเชิงปฏิบัติในระดับนั้นอาจทำให้ปริมาณงานลดลง

วิธีการโทร Gemini 2.5 Flash-Lite API จาก CometAPI

เจมินี่ 2.5 แฟลช-ไลท์ ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:

  • อินพุตโทเค็น: $0.08/M โทเค็น
  • โทเค็นเอาต์พุต: $0.32/ M โทเค็น

ขั้นตอนที่ต้องดำเนินการ

  • เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
  • รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
  • รับ url ของเว็บไซต์นี้: https://api.cometapi.com/

วิธีการใช้งาน

  1. เลือก“gemini-2.5-flash-lite” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
  2. แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
  3. แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
  4. ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น

CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:

ดูเพิ่มเติม ราศีเมถุน 2.5 โปร

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%