Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

อินพุต:$0.08/M
เอาต์พุต:$0.32/M
บริบท:1M
เอาต์พุตสูงสุด:65K
โมเดล Gemini 2.5 Flash ที่ได้รับการปรับแต่งเพื่อความคุ้มค่าสูงและอัตราการประมวลผลสูง. โมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุด ออกแบบมาเพื่อการใช้งานขนาดใหญ่.
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

รายละเอียดทางเทคนิค

  • การให้เหตุผลแบบปรับตัว (Adaptive Reasoning): Gemini 2.5 Flash-Lite รองรับการ คิด แบบออนดีมานด์ ช่วยให้ผู้พัฒนาสามารถจัดสรรทรัพยากรคอมพิวต์เฉพาะเมื่อจำเป็นต้องใช้การให้เหตุผลเชิงลึก
  • การผสานเครื่องมือ (Tool Integrations): รองรับร่วมงานได้เต็มรูปแบบกับเครื่องมือเนทีฟของ Gemini 2.5 รวมถึง Grounding with Google Search, Code Execution, URL Context และ Function Calling เพื่อเวิร์กโฟลว์มัลติโหมดที่ลื่นไหล
  • Model Context Protocol (MCP): ใช้ประโยชน์จาก MCP ของ Google เพื่อดึงข้อมูลเว็บแบบเรียลไทม์ ให้คำตอบที่เป็นข้อมูล ล่าสุด และ สอดคล้องตามบริบท
  • ตัวเลือกการปรับใช้ (Deployment Options): พร้อมใช้งานผ่าน CometAPI, Gemini API, Vertex AI และ Google AI Studio โดยมีแทร็กพรีวิวสำหรับผู้ใช้งานกลุ่มแรกเพื่อทดลองและให้ข้อเสนอแนะ .

ประสิทธิภาพตามเกณฑ์มาตรฐานของ Gemini 2.5 Flash-Lite

  • เวลาแฝง (Latency): ให้เวลาแฝงมัธยฐานต่ำลงสูงสุด 50% เมื่อเทียบกับ Gemini 2.5 Flash โดยทั่วไปทำได้ ต่ำกว่า 100 ms ในชุดเกณฑ์มาตรฐานการจัดประเภทและการสรุปทั่วไป
  • Throughput: ปรับแต่งสำหรับปริมาณงานสูง รองรับคำขอหลายหมื่นครั้งต่อนาทีโดยไม่ทำให้ประสิทธิภาพลดลง
  • ความคุ้มค่าต่อราคา (Price-Performance): ลดต้นทุนต่อ 1,000 โทเค็น ลง 25% เมื่อเทียบกับรุ่น Flash ทำให้เป็นตัวเลือกที่ Pareto-optimal สำหรับการปรับใช้ที่คำนึงถึงต้นทุน
  • การยอมรับในอุตสาหกรรม (Industry Adoption): ผู้ใช้งานระยะแรกแจ้งว่าการผสานเข้ากับไปป์ไลน์การใช้งานจริงเป็นไปอย่างราบรื่น โดยตัวชี้วัดด้านประสิทธิภาพสอดคล้องหรือเหนือกว่าการคาดการณ์เบื้องต้น .

Gemini 2.5 Flash Lite


กรณีการใช้งานที่เหมาะสม

  • งานความถี่สูง ความซับซ้อนต่ำ: การติดแท็กอัตโนมัติ การวิเคราะห์อารมณ์ และการแปลแบบจำนวนมาก
  • ไปป์ไลน์ที่คำนึงถึงต้นทุน: การดึงข้อมูลจากคลังเอกสารขนาดใหญ่ การสรุปแบบเป็นรอบตามกำหนดเวลา
  • กรณีใช้งานที่ Edge และบนอุปกรณ์พกพา: เมื่อต้องการเวลาแฝงต่ำเป็นสำคัญแต่มีงบทรัพยากรจำกัด

ข้อจำกัดของ Gemini 2.5 Flash-Lite

  • สถานะพรีวิว: อาจมีการเปลี่ยนแปลง API ก่อน GA; การผสานระบบควรรองรับการเพิ่มเวอร์ชันที่อาจเกิดขึ้น
  • ไม่มีการปรับจูนแบบ On-the-Fly: ไม่สามารถอัปโหลด weights แบบกำหนดเอง; ต้องพึ่งพา prompt engineering และ system messages
  • ความคิดสร้างสรรค์ลดลง: ปรับจูนเพื่อความเป็นเชิงกำหนดและปริมาณงานสูง; ไม่เหมาะกับการสร้างเนื้อหาแบบปลายเปิดหรือการเขียนเชิง “creative”
  • ข้อจำกัดด้านทรัพยากร: สเกลแบบเชิงเส้นได้เพียงถึง ~16 vCPUs; เกินกว่านี้ การเพิ่มขึ้นของปริมาณงานจะลดลง
  • ข้อจำกัดด้านมัลติโหมด: รองรับอินพุตภาพ/เสียงแต่ความเที่ยงตรงจำกัด; ไม่เหมาะกับงานวิชั่นหนักหรือการถอดเสียงขนาดใหญ่
  • ข้อแลกเปลี่ยนของหน้าต่างบริบท : แม้ว่าจะรับได้สูงสุด 1 M โทเค็น แต่การอนุมานในการใช้งานจริงที่สเกลดังกล่าวอาจทำให้ปริมาณงานลดลง

คุณสมบัติสำหรับ Gemini 2.5 Flash Lite

สำรวจคุณสมบัติหลักของ Gemini 2.5 Flash Lite ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Gemini 2.5 Flash Lite

สำรวจราคาที่แข่งขันได้สำหรับ Gemini 2.5 Flash Lite ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Gemini 2.5 Flash Lite สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

โค้ดตัวอย่างและ API สำหรับ Gemini 2.5 Flash Lite

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Gemini 2.5 Flash Lite เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Gemini 2.5 Flash Lite ในโครงการของคุณ

รุ่นของ Gemini 2.5 Flash Lite

เหตุผลที่ Gemini 2.5 Flash Lite มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-thinking

โมเดลเพิ่มเติม