ماڈلزسپورٹانٹرپرائزبلاگ
500+ AI ماڈل API، تمام ایک API میں۔ صرف CometAPI میں
ماڈلز API
ڈویلپر
فوری آغازدستاویزاتAPI ڈیش بورڈ
وسائل
AI ماڈلزبلاگانٹرپرائزتبدیلیوں کا ریکارڈہمارے بارے میں
2025 CometAPI۔ تمام حقوق محفوظ ہیں۔رازداری کی پالیسیخدمات کی شرائط
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

ان پٹ:$0.08/M
آؤٹ پٹ:$0.32/M
سیاق و سباق:1M
زیادہ سے زیادہ آؤٹ پٹ:65K
اعلیٰ تھروپٹ اور انتہائی کفایتی کے لیے بہتر بنایا گیا Gemini 2.5 Flash ماڈل۔ سب سے چھوٹا، سب سے زیادہ کفایتی ماڈل، جو بڑے پیمانے پر استعمال کے لیے تیار کیا گیا ہے۔
نیا
تجارتی استعمال
Playground
خلاصہ
خصوصیات
قیمت
API
ورژن

فنی تفصیلات

  • Adaptive Reasoning: Gemini 2.5 Flash-Lite حسبِ ضرورت سوچ کی سہولت فراہم کرتا ہے، جس سے ڈویلپرز صرف اس وقت کمپیوٹ وسائل مختص کر سکتے ہیں جب زیادہ گہرے استدلال کی ضرورت ہو۔
  • Tool Integrations: Gemini 2.5 کے مقامی ٹولز کے ساتھ مکمل مطابقت، جن میں Grounding with Google Search، Code Execution، URL Context، اور Function Calling شامل ہیں، تاکہ ملٹی ماڈل ورک فلوز بے رکاوٹ رہیں۔
  • Model Context Protocol (MCP): حقیقی وقت کا ویب ڈیٹا حاصل کرنے کے لیے Google کے MCP سے استفادہ کرتا ہے، اس بات کو یقینی بناتے ہوئے کہ جوابات تازہ ترین اور سیاقی طور پر موزوں ہوں۔
  • Deployment Options: CometAPI، Gemini API، Vertex AI، اور Google AI Studio کے ذریعے دستیاب، جہاں ابتدائی صارفین کے لیے تجربہ کرنے اور رائے فراہم کرنے کی غرض سے ایک پریویو ٹریک بھی موجود ہے ۔

Gemini 2.5 Flash-Lite کی بینچ مارک کارکردگی

  • Latency: Gemini 2.5 Flash کے مقابلے میں میڈین رسپانس ٹائم میں زیادہ سے زیادہ 50% تک کمی حاصل کرتا ہے، جبکہ معیاری کلاسیفیکیشن اور سمریزیشن بینچ مارکس پر عموماً 100 ms سے کم لیٹنسی ملتی ہے۔
  • Throughput: زیادہ حجم والے ورک لوڈز کے لیے بہتر بنایا گیا ہے، فی منٹ دسیوں ہزار درخواستوں کو کارکردگی میں کمی کے بغیر برقرار رکھتا ہے۔
  • Price-Performance: اپنے Flash ہم منصب کے مقابلے میں فی 1,000 ٹوکن لاگت میں 25% کمی ظاہر کرتا ہے، جس سے یہ لاگت حساس تیناتیوں کے لیے پریٹو کے لحاظ سے مثالی انتخاب بن جاتا ہے۔
  • Industry Adoption: ابتدائی صارفین پروڈکشن پائپ لائنز میں بغیر رکاوٹ انضمام کی رپورٹ دیتے ہیں، جبکہ کارکردگی میٹرکس ابتدائی توقعات کے مطابق یا ان سے بڑھ کر ہیں ۔

Gemini 2.5 Flash Lite


مثالی استعمال کے کیسز

  • ہائی فریکوئنسی، کم پیچیدگی والے کام: خودکار ٹیگنگ، جذباتی تجزیہ، اور بڑے پیمانے پر ترجمہ
  • لاگت حساس پائپ لائنز: بڑے دستاویزاتی مجموعوں سے ڈیٹا اخراج، وقفہ وار بیچ خلاصہ سازی
  • ایج اور موبائل منظرنامے: جب لیٹنسی اہم ہو لیکن وسائل کے بجٹ محدود ہوں

Gemini 2.5 Flash-Lite کی حدود

  • Preview Status: GA سے پہلے API میں تبدیلیاں آ سکتی ہیں؛ انضمامات کو ممکنہ ورژن اپ گریڈز کو مدِنظر رکھنا چاہیے۔
  • No On-the-Fly Fine-Tuning: کسٹم ویٹس اپ لوڈ نہیں کیے جا سکتے؛ پرامپٹ انجینئرنگ اور سسٹم میسجز پر انحصار کریں۔
  • Reduced Creativity: فیصلہ کن، ہائی تھروپٹ کاموں کے لیے ٹیون کیا گیا ہے؛ کھلے آخر کی جنریشن یا “creative” تحریر کے لیے کم موزوں۔
  • Resource Ceiling: صرف ~16 vCPUs تک خطی انداز میں اسکیل کرتا ہے؛ اس سے آگے تھروپٹ میں اضافے گھٹ جاتے ہیں۔
  • Multimodal Constraints: امیج/آڈیو ان پٹس کی سپورٹ موجود ہے مگر محدود فیڈیلیٹی کے ساتھ؛ بھاری ویژن یا آڈیو ٹرانسکرپشن کاموں کے لیے موزوں نہیں۔
  • Context-Window Trade-Off: اگرچہ یہ 1 M ٹوکنز تک قبول کرتا ہے، اس پیمانے پر عملی انفیرنس میں تھروپٹ میں کمی دیکھنے کو مل سکتی ہے۔

Gemini 2.5 Flash Lite کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

Gemini 2.5 Flash Lite کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Gemini 2.5 Flash Lite کے لیے نمونہ کوڈ اور API

Gemini 2.5 Flash Lite کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Gemini 2.5 Flash Lite کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Gemini 2.5 Flash Lite کے ورژن

Gemini 2.5 Flash Lite کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking

مزید ماڈلز

A

Claude Opus 4.6

ان پٹ:$4/M
آؤٹ پٹ:$20/M
Claude Opus 4.6، Anthropic کے “Opus” کلاس کا بڑا لسانی ماڈل ہے، جو فروری 2026 میں جاری کیا گیا۔ اسے علمی کام اور تحقیقی ورک فلوز کے لیے ایک بھروسہ مند مرکزی حل کے طور پر پیش کیا گیا ہے — اور یہ طویل سیاق میں استدلال، کئی مرحلوں پر مشتمل منصوبہ بندی، ٹولز کے استعمال (جن میں ایجنٹ پر مبنی سافٹ ویئر ورک فلوز بھی شامل ہیں)، اور کمپیوٹر کے استعمال سے متعلق کام جیسے خودکار سلائیڈ اور اسپریڈشیٹ کی تیاری کو بہتر بناتا ہے۔
A

Claude Sonnet 4.6

ان پٹ:$2.4/M
آؤٹ پٹ:$12/M
Claude Sonnet 4.6 ہمارا اب تک کا سب سے زیادہ قابل Sonnet ماڈل ہے۔ یہ کوڈنگ، کمپیوٹر کے استعمال، طویل سیاقی استدلال، ایجنٹ منصوبہ بندی، دانش پر مبنی کام، اور ڈیزائن کے حوالے سے ماڈل کی صلاحیتوں کا مکمل اپ گریڈ ہے۔ Sonnet 4.6 میں بیٹا مرحلے میں 1M ٹوکن کانٹیکسٹ ونڈو کی خصوصیت بھی ہے۔
O

GPT-5.4 nano

ان پٹ:$0.16/M
آؤٹ پٹ:$1/M
GPT-5.4 nano اُن کاموں کے لیے تیار کیا گیا ہے جن میں رفتار اور لاگت سب سے زیادہ اہمیت رکھتی ہیں، مثلاً درجہ بندی، ڈیٹا استخراج، رینکنگ، اور ذیلی ایجنٹس۔
O

GPT-5.4 mini

ان پٹ:$0.6/M
آؤٹ پٹ:$3.6/M
GPT-5.4 mini، GPT-5.4 کی صلاحیتوں کو ایک تیز تر، زیادہ مؤثر ماڈل میں لے آتا ہے جو زیادہ حجم کے ورک لوڈز کے لیے ڈیزائن کیا گیا ہے۔
A

Claude Mythos Preview

A

Claude Mythos Preview

جلد آ رہا ہے
ان پٹ:$60/M
آؤٹ پٹ:$240/M
Claude Mythos Preview اب تک ہمارا سب سے طاقتور فرنٹیئر ماڈل ہے، اور کئی تشخیصی بینچ مارکس پر اسکورز میں ایک نمایاں چھلانگ دکھاتا ہے، ہمارے سابقہ فرنٹیئر ماڈل Claude Opus 4.6 کے مقابلے میں۔
X

mimo-v2-pro

ان پٹ:$0.8/M
آؤٹ پٹ:$2.4/M
MiMo-V2-Pro، Xiaomi کا فلیگ شپ فاؤنڈیشن ماڈل ہے، جس میں 1T سے زیادہ کل پیرا میٹرز اور 1M کی کانٹیکسٹ لمبائی ہے، اور اسے ایجنٹ پر مبنی منظرناموں کے لیے گہرائی سے بہتر بنایا گیا ہے۔ یہ OpenClaw جیسے عمومی ایجنٹ فریم ورکس کے ساتھ انتہائی مطابقت پذیر ہے۔ معیاری PinchBench اور ClawBench بنچ مارکس میں یہ عالمی سطح پر اعلیٰ ترین درجے میں شمار ہوتا ہے، اور اس کی محسوس شدہ کارکردگی Opus 4.6 کے قریب پہنچتی ہے۔ MiMo-V2-Pro کو ایجنٹ سسٹمز کے دماغ کے طور پر کام کرنے کے لیے بنایا گیا ہے، جو پیچیدہ ورک فلو کو ہم آہنگ و منظم کرتا ہے، پروڈکشن انجینئرنگ کے کاموں کو آگے بڑھاتا ہے، اور نتائج قابلِ اعتماد طور پر فراہم کرتا ہے۔

متعلقہ بلاگز

کیا مفت Gemini 2.5 Pro API کام نہیں کر رہی؟ 2025 میں مفت کوٹے میں تبدیلیاں
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

کیا مفت Gemini 2.5 Pro API کام نہیں کر رہی؟ 2025 میں مفت کوٹے میں تبدیلیاں

Google نے Gemini API کے لیے مفت درجے کو نمایاں طور پر سخت کر دیا ہے: Gemini 2.5 Pro کو مفت درجے سے ہٹا دیا گیا ہے اور Gemini 2.5 Flash کی روزانہ مفت درخواستوں میں ڈرامائی کمی کر دی گئی ہے (رپورٹس: ~250 → ~20/day). اس کا مطلب یہ نہیں کہ ماڈل تجربات کے لیے مستقل طور پر “dead” ہو گیا ہے — لیکن اس کا مطلب یہ ضرور ہے کہ بہت سے حقیقی دنیا کے استعمالات کے لیے مفت رسائی عملی طور پر بڑی حد تک ختم کر دی گئی ہے۔