ماڈلزقیمتانٹرپرائز
500+ AI ماڈل API، تمام ایک API میں۔ صرف CometAPI میں
ماڈلز API
ڈویلپر
فوری آغازدستاویزاتAPI ڈیش بورڈ
کمپنی
ہمارے بارے میںانٹرپرائز
وسائل
AI ماڈلزبلاگتبدیلیوں کا ریکارڈسپورٹ
خدمات کی شرائطرازداری کی پالیسی
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

ان پٹ:$0.08/M
آؤٹ پٹ:$0.32/M
سیاق و سباق:1M
زیادہ سے زیادہ آؤٹ پٹ:65K
اعلیٰ تھروپٹ اور انتہائی کفایتی کے لیے بہتر بنایا گیا Gemini 2.5 Flash ماڈل۔ سب سے چھوٹا، سب سے زیادہ کفایتی ماڈل، جو بڑے پیمانے پر استعمال کے لیے تیار کیا گیا ہے۔
نیا
تجارتی استعمال
Playground
خلاصہ
خصوصیات
قیمت
API
ورژن

فنی تفصیلات

  • Adaptive Reasoning: Gemini 2.5 Flash-Lite حسبِ ضرورت سوچ کی سہولت فراہم کرتا ہے، جس سے ڈویلپرز صرف اس وقت کمپیوٹ وسائل مختص کر سکتے ہیں جب زیادہ گہرے استدلال کی ضرورت ہو۔
  • Tool Integrations: Gemini 2.5 کے مقامی ٹولز کے ساتھ مکمل مطابقت، جن میں Grounding with Google Search، Code Execution، URL Context، اور Function Calling شامل ہیں، تاکہ ملٹی ماڈل ورک فلوز بے رکاوٹ رہیں۔
  • Model Context Protocol (MCP): حقیقی وقت کا ویب ڈیٹا حاصل کرنے کے لیے Google کے MCP سے استفادہ کرتا ہے، اس بات کو یقینی بناتے ہوئے کہ جوابات تازہ ترین اور سیاقی طور پر موزوں ہوں۔
  • Deployment Options: CometAPI، Gemini API، Vertex AI، اور Google AI Studio کے ذریعے دستیاب، جہاں ابتدائی صارفین کے لیے تجربہ کرنے اور رائے فراہم کرنے کی غرض سے ایک پریویو ٹریک بھی موجود ہے ۔

Gemini 2.5 Flash-Lite کی بینچ مارک کارکردگی

  • Latency: Gemini 2.5 Flash کے مقابلے میں میڈین رسپانس ٹائم میں زیادہ سے زیادہ 50% تک کمی حاصل کرتا ہے، جبکہ معیاری کلاسیفیکیشن اور سمریزیشن بینچ مارکس پر عموماً 100 ms سے کم لیٹنسی ملتی ہے۔
  • Throughput: زیادہ حجم والے ورک لوڈز کے لیے بہتر بنایا گیا ہے، فی منٹ دسیوں ہزار درخواستوں کو کارکردگی میں کمی کے بغیر برقرار رکھتا ہے۔
  • Price-Performance: اپنے Flash ہم منصب کے مقابلے میں فی 1,000 ٹوکن لاگت میں 25% کمی ظاہر کرتا ہے، جس سے یہ لاگت حساس تیناتیوں کے لیے پریٹو کے لحاظ سے مثالی انتخاب بن جاتا ہے۔
  • Industry Adoption: ابتدائی صارفین پروڈکشن پائپ لائنز میں بغیر رکاوٹ انضمام کی رپورٹ دیتے ہیں، جبکہ کارکردگی میٹرکس ابتدائی توقعات کے مطابق یا ان سے بڑھ کر ہیں ۔

Gemini 2.5 Flash Lite


مثالی استعمال کے کیسز

  • ہائی فریکوئنسی، کم پیچیدگی والے کام: خودکار ٹیگنگ، جذباتی تجزیہ، اور بڑے پیمانے پر ترجمہ
  • لاگت حساس پائپ لائنز: بڑے دستاویزاتی مجموعوں سے ڈیٹا اخراج، وقفہ وار بیچ خلاصہ سازی
  • ایج اور موبائل منظرنامے: جب لیٹنسی اہم ہو لیکن وسائل کے بجٹ محدود ہوں

Gemini 2.5 Flash-Lite کی حدود

  • Preview Status: GA سے پہلے API میں تبدیلیاں آ سکتی ہیں؛ انضمامات کو ممکنہ ورژن اپ گریڈز کو مدِنظر رکھنا چاہیے۔
  • No On-the-Fly Fine-Tuning: کسٹم ویٹس اپ لوڈ نہیں کیے جا سکتے؛ پرامپٹ انجینئرنگ اور سسٹم میسجز پر انحصار کریں۔
  • Reduced Creativity: فیصلہ کن، ہائی تھروپٹ کاموں کے لیے ٹیون کیا گیا ہے؛ کھلے آخر کی جنریشن یا “creative” تحریر کے لیے کم موزوں۔
  • Resource Ceiling: صرف ~16 vCPUs تک خطی انداز میں اسکیل کرتا ہے؛ اس سے آگے تھروپٹ میں اضافے گھٹ جاتے ہیں۔
  • Multimodal Constraints: امیج/آڈیو ان پٹس کی سپورٹ موجود ہے مگر محدود فیڈیلیٹی کے ساتھ؛ بھاری ویژن یا آڈیو ٹرانسکرپشن کاموں کے لیے موزوں نہیں۔
  • Context-Window Trade-Off: اگرچہ یہ 1 M ٹوکنز تک قبول کرتا ہے، اس پیمانے پر عملی انفیرنس میں تھروپٹ میں کمی دیکھنے کو مل سکتی ہے۔

Gemini 2.5 Flash Lite کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Gemini 2.5 Flash Lite کے لیے نمونہ کوڈ اور API

Gemini 2.5 Flash Lite کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Gemini 2.5 Flash Lite کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Gemini 2.5 Flash Lite کے ورژن

Gemini 2.5 Flash Lite کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔
version
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17-thinking