โมเดลสนับสนุนองค์กรบล็อก
500+ AI Model API ทั้งหมดในหนึ่ง API เพียงแค่ใน CometAPI
API โมเดล
นักพัฒนา
เริ่มต้นอย่างรวดเร็วเอกสารประกอบแดชบอร์ด API
ทรัพยากร
โมเดล AIบล็อกองค์กรบันทึกการเปลี่ยนแปลงเกี่ยวกับ
2025 CometAPI สงวนลิขสิทธิ์ทั้งหมดนโยบายความเป็นส่วนตัวข้อกำหนดการให้บริการ
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

อินพุต:$0.08/M
เอาต์พุต:$0.32/M
บริบท:1M
เอาต์พุตสูงสุด:65K
โมเดล Gemini 2.5 Flash ที่ได้รับการปรับแต่งเพื่อความคุ้มค่าสูงและอัตราการประมวลผลสูง. โมเดลที่มีขนาดเล็กที่สุดและคุ้มค่าที่สุด ออกแบบมาเพื่อการใช้งานขนาดใหญ่.
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

รายละเอียดทางเทคนิค

  • การให้เหตุผลแบบปรับตัว (Adaptive Reasoning): Gemini 2.5 Flash-Lite รองรับการ คิด แบบออนดีมานด์ ช่วยให้ผู้พัฒนาสามารถจัดสรรทรัพยากรคอมพิวต์เฉพาะเมื่อจำเป็นต้องใช้การให้เหตุผลเชิงลึก
  • การผสานเครื่องมือ (Tool Integrations): รองรับร่วมงานได้เต็มรูปแบบกับเครื่องมือเนทีฟของ Gemini 2.5 รวมถึง Grounding with Google Search, Code Execution, URL Context และ Function Calling เพื่อเวิร์กโฟลว์มัลติโหมดที่ลื่นไหล
  • Model Context Protocol (MCP): ใช้ประโยชน์จาก MCP ของ Google เพื่อดึงข้อมูลเว็บแบบเรียลไทม์ ให้คำตอบที่เป็นข้อมูล ล่าสุด และ สอดคล้องตามบริบท
  • ตัวเลือกการปรับใช้ (Deployment Options): พร้อมใช้งานผ่าน CometAPI, Gemini API, Vertex AI และ Google AI Studio โดยมีแทร็กพรีวิวสำหรับผู้ใช้งานกลุ่มแรกเพื่อทดลองและให้ข้อเสนอแนะ .

ประสิทธิภาพตามเกณฑ์มาตรฐานของ Gemini 2.5 Flash-Lite

  • เวลาแฝง (Latency): ให้เวลาแฝงมัธยฐานต่ำลงสูงสุด 50% เมื่อเทียบกับ Gemini 2.5 Flash โดยทั่วไปทำได้ ต่ำกว่า 100 ms ในชุดเกณฑ์มาตรฐานการจัดประเภทและการสรุปทั่วไป
  • Throughput: ปรับแต่งสำหรับปริมาณงานสูง รองรับคำขอหลายหมื่นครั้งต่อนาทีโดยไม่ทำให้ประสิทธิภาพลดลง
  • ความคุ้มค่าต่อราคา (Price-Performance): ลดต้นทุนต่อ 1,000 โทเค็น ลง 25% เมื่อเทียบกับรุ่น Flash ทำให้เป็นตัวเลือกที่ Pareto-optimal สำหรับการปรับใช้ที่คำนึงถึงต้นทุน
  • การยอมรับในอุตสาหกรรม (Industry Adoption): ผู้ใช้งานระยะแรกแจ้งว่าการผสานเข้ากับไปป์ไลน์การใช้งานจริงเป็นไปอย่างราบรื่น โดยตัวชี้วัดด้านประสิทธิภาพสอดคล้องหรือเหนือกว่าการคาดการณ์เบื้องต้น .

Gemini 2.5 Flash Lite


กรณีการใช้งานที่เหมาะสม

  • งานความถี่สูง ความซับซ้อนต่ำ: การติดแท็กอัตโนมัติ การวิเคราะห์อารมณ์ และการแปลแบบจำนวนมาก
  • ไปป์ไลน์ที่คำนึงถึงต้นทุน: การดึงข้อมูลจากคลังเอกสารขนาดใหญ่ การสรุปแบบเป็นรอบตามกำหนดเวลา
  • กรณีใช้งานที่ Edge และบนอุปกรณ์พกพา: เมื่อต้องการเวลาแฝงต่ำเป็นสำคัญแต่มีงบทรัพยากรจำกัด

ข้อจำกัดของ Gemini 2.5 Flash-Lite

  • สถานะพรีวิว: อาจมีการเปลี่ยนแปลง API ก่อน GA; การผสานระบบควรรองรับการเพิ่มเวอร์ชันที่อาจเกิดขึ้น
  • ไม่มีการปรับจูนแบบ On-the-Fly: ไม่สามารถอัปโหลด weights แบบกำหนดเอง; ต้องพึ่งพา prompt engineering และ system messages
  • ความคิดสร้างสรรค์ลดลง: ปรับจูนเพื่อความเป็นเชิงกำหนดและปริมาณงานสูง; ไม่เหมาะกับการสร้างเนื้อหาแบบปลายเปิดหรือการเขียนเชิง “creative”
  • ข้อจำกัดด้านทรัพยากร: สเกลแบบเชิงเส้นได้เพียงถึง ~16 vCPUs; เกินกว่านี้ การเพิ่มขึ้นของปริมาณงานจะลดลง
  • ข้อจำกัดด้านมัลติโหมด: รองรับอินพุตภาพ/เสียงแต่ความเที่ยงตรงจำกัด; ไม่เหมาะกับงานวิชั่นหนักหรือการถอดเสียงขนาดใหญ่
  • ข้อแลกเปลี่ยนของหน้าต่างบริบท : แม้ว่าจะรับได้สูงสุด 1 M โทเค็น แต่การอนุมานในการใช้งานจริงที่สเกลดังกล่าวอาจทำให้ปริมาณงานลดลง

คุณสมบัติสำหรับ Gemini 2.5 Flash Lite

สำรวจคุณสมบัติหลักของ Gemini 2.5 Flash Lite ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Gemini 2.5 Flash Lite

สำรวจราคาที่แข่งขันได้สำหรับ Gemini 2.5 Flash Lite ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Gemini 2.5 Flash Lite สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

โค้ดตัวอย่างและ API สำหรับ Gemini 2.5 Flash Lite

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ Gemini 2.5 Flash Lite เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ Gemini 2.5 Flash Lite ในโครงการของคุณ
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

รุ่นของ Gemini 2.5 Flash Lite

เหตุผลที่ Gemini 2.5 Flash Lite มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ
version
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite

โมเดลเพิ่มเติม

A

Claude Opus 4.6

อินพุต:$4/M
เอาต์พุต:$20/M
Claude Opus 4.6 เป็นโมเดลภาษาขนาดใหญ่ระดับ “Opus” ของ Anthropic เปิดตัวในเดือนกุมภาพันธ์ 2026. ถูกวางตำแหน่งให้เป็นกำลังหลักสำหรับงานเชิงความรู้และเวิร์กโฟลว์การวิจัย — ปรับปรุงการให้เหตุผลในบริบทยาว การวางแผนหลายขั้นตอน การใช้เครื่องมือ (รวมถึงเวิร์กโฟลว์ซอฟต์แวร์เชิงตัวแทน) และงานการใช้คอมพิวเตอร์ เช่น การสร้างสไลด์และสเปรดชีตอัตโนมัติ.
A

Claude Sonnet 4.6

อินพุต:$2.4/M
เอาต์พุต:$12/M
Claude Sonnet 4.6 เป็นโมเดล Sonnet ที่มีความสามารถมากที่สุดเท่าที่เคยมีมา เป็นการอัปเกรดเต็มรูปแบบของทักษะของโมเดล ครอบคลุมการเขียนโค้ด การใช้งานคอมพิวเตอร์ การให้เหตุผลในบริบทยาว การวางแผนของเอเจนต์ งานด้านความรู้ และการออกแบบ Sonnet 4.6 ยังมาพร้อมกับหน้าต่างบริบทขนาด 1M โทเค็นในเวอร์ชันเบต้า
O

GPT-5.4 nano

อินพุต:$0.16/M
เอาต์พุต:$1/M
GPT-5.4 nano ถูกออกแบบมาสำหรับงานที่ความเร็วและต้นทุนมีความสำคัญสูงสุด เช่น การจำแนกประเภท การสกัดข้อมูล การจัดอันดับ และเอเจนต์ย่อย.
O

GPT-5.4 mini

อินพุต:$0.6/M
เอาต์พุต:$3.6/M
GPT-5.4 mini นำจุดแข็งของ GPT-5.4 มาสู่โมเดลที่เร็วกว่าและมีประสิทธิภาพมากขึ้น ซึ่งออกแบบมาสำหรับภาระงานปริมาณมาก
A

Claude Mythos Preview

A

Claude Mythos Preview

เร็วๆ นี้
อินพุต:$60/M
เอาต์พุต:$240/M
Claude Mythos Preview เป็นโมเดลระดับแนวหน้าที่มีความสามารถสูงสุดของเราจนถึงปัจจุบัน และทำคะแนนก้าวกระโดดอย่างชัดเจน บนเบนช์มาร์กการประเมินหลายรายการ เมื่อเทียบกับโมเดลระดับแนวหน้ารุ่นก่อนของเรา Claude Opus 4.6.
X

mimo-v2-pro

อินพุต:$0.8/M
เอาต์พุต:$2.4/M
MiMo-V2-Pro คือโมเดลพื้นฐานเรือธงของ Xiaomi ที่มีพารามิเตอร์รวมมากกว่า 1T และความยาวคอนเท็กซ์ 1M โดยได้รับการปรับแต่งอย่างลึกซึ้งสำหรับสถานการณ์แบบเอเจนต์ มีความสามารถในการปรับใช้ได้สูงกับเฟรมเวิร์กเอเจนต์ทั่วไป เช่น OpenClaw โดยติดอันดับระดับแนวหน้าของโลกในการทดสอบมาตรฐาน PinchBench และ ClawBench และมีประสิทธิภาพที่รับรู้ได้ใกล้เคียงกับ Opus 4.6 MiMo-V2-Pro ได้รับการออกแบบมาเพื่อทำหน้าที่เป็นสมองของระบบเอเจนต์ ประสานการทำงานของเวิร์กโฟลว์ที่ซับซ้อน ขับเคลื่อนงานวิศวกรรมสำหรับการใช้งานจริง และส่งมอบผลลัพธ์ได้อย่างน่าเชื่อถือ

บล็อกที่เกี่ยวข้อง

API Gemini 2.5 Pro แบบฟรีเสียหรือ? การเปลี่ยนแปลงโควต้าฟรีในปี 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

API Gemini 2.5 Pro แบบฟรีเสียหรือ? การเปลี่ยนแปลงโควต้าฟรีในปี 2025

Google ได้เข้มงวดระดับใช้ฟรีสำหรับ Gemini API อย่างมาก: Gemini 2.5 Pro ถูกนำออกจากระดับใช้ฟรี และจำนวนคำขอฟรีรายวันของ Gemini 2.5 Flash ถูกลดลงอย่างมาก (รายงาน: ~250 → ~20/วัน). นั่นไม่ได้หมายความว่าโมเดลจะ “ตาย” อย่างถาวรสำหรับการทดลอง — แต่ก็หมายความว่าการเข้าถึงแบบฟรีถูกจำกัดอย่างหนักสำหรับกรณีใช้งานจริงจำนวนมาก.