Gemini 2.5 Flash-Lite API

CometAPI
AnnaJun 26, 2025
Gemini 2.5 Flash-Lite API

۔ Gemini 2.5 Flash-Lite API ہائبرڈ ریجننگ ماڈلز کے خاندان میں گوگل کی تازہ ترین پیشکش کی نمائندگی کرتا ہے، جو ڈیلیور کرنے کے لیے ڈیزائن کیا گیا ہے۔ بے مثال لاگت کی کارکردگی اور انتہائی کم تاخیر اعلی حجم، تاخیر سے متعلق حساس ایپلیکیشنز کے لیے۔


بنیادی معلومات اور خصوصیات

17 جون 2025 کو ایک پیش نظارہ ریلیز میں اعلان کیا گیا، فلیش-لائٹ نے جیمنی 2.5 لائن اپ — فلیش اور پرو کے ساتھ — ڈویلپرز کو ایک آپشن فراہم کرتے ہوئے تیار کیا تیزی, قیمت کی کارکردگی، اور انکولی سوچ صلاحیتوں

آپ اپنے کوڈ میں "gemini-2.5-flash-lite" کی وضاحت کر کے Gemini 2.5 Flash-Lite کا استعمال شروع کر سکتے ہیں۔ اگر آپ پیش نظارہ ورژن استعمال کر رہے ہیں، تو آپ "gemini-2.5-flash-lite" پر سوئچ کر سکتے ہیں، جو کہ پیش نظارہ ورژن جیسا ہی ہے۔ گوگل 25 اگست کو فلیش لائٹ کے لیے پیش نظارہ عرف کو ہٹانے کا ارادہ رکھتا ہے۔

استحکامماڈلتاریخ
مستحکم (GA)gemini-2.5-flash-liteجولائی 22، 2025
تجرباتی پیش نظارہgemini-2.5-flash-lite-06-17دستیابی ونڈو: جون 17 - اگست 25، 2025
تازہ ترین ورژنgemini-2.5-flash-lite-preview-09-202509-2025
  • سوچ کا کنٹرول: لاگو کرتا ہے a متحرک سوچ بجٹ ایک API پیرامیٹر کے ذریعے، سوچ کے ساتھ ڈیفالٹ کی طرف سے غیر فعال رفتار کو زیادہ سے زیادہ کرنے اور لاگت کو کم کرنے کے لیے۔
  • کم لطیسی: ایک کے لیے انجینئرڈ تیز وقت سے پہلے ٹوکن, Flash-Lite معیاری Google Cloud انفراسٹرکچر پر ذیلی 100 ms لیٹنسیز حاصل کرتے ہوئے سٹارٹ اپ اوور ہیڈ کو کم کرتا ہے۔
  • بھاری پیداوار: قابل ضابطہ کشائی کرنے والی پائپ لائنوں کے ساتھ، یہ برقرار رہتی ہے۔ سینکڑوں ٹوکن فی سیکنڈچیٹ بوٹس اور اسٹریمنگ ایپلی کیشنز میں ریئل ٹائم صارف کے تجربات کو غیر مقفل کرنا۔
  • ملٹی موڈل سپورٹ: اگرچہ بنیادی طور پر متن کے لیے موزوں ہے، فلیش لائٹ بھی قبول کرتا ہے۔ تصاویر, آڈیو، اور ویڈیو جیمنی API کے ذریعے ان پٹ، دستاویز کے خلاصے سے لے کر لائٹ ویژن کے کاموں تک ورسٹائل استعمال کے معاملات کو قابل بناتا ہے۔

تکنیکی تفصیلات

  • اڈاپٹیو ریزننگ: Gemini 2.5 Flash-Lite آن ڈیمانڈ کی حمایت کرتا ہے۔ سوچ, ڈویلپرز کو کمپیوٹ وسائل صرف اس صورت میں مختص کرنے کی اجازت دیتا ہے جب گہری استدلال کی ضرورت ہو۔
  • ٹول انٹیگریشنز: جیمنی 2.5 کے مقامی ٹولز کے ساتھ مکمل مطابقت، بشمول گوگل سرچ کے ساتھ گراؤنڈنگ, کوڈ پر عمل درآمد, URL سیاق و سباق، اور فنکشن کالنگ ہموار ملٹی موڈل ورک فلو کے لیے۔
  • ماڈل سیاق و سباق پروٹوکول (MCP): جوابات کو یقینی بناتے ہوئے ریئل ٹائم ویب ڈیٹا حاصل کرنے کے لیے Google کے MCP کا فائدہ اٹھاتا ہے۔ اپ ڈیٹ کرنے کے لئے اور سیاق و سباق سے متعلق.
  • تعیناتی کے اختیارات۔: کے ذریعے دستیاب ہے۔ CometAPI, Gemini API, ورٹیکس AI، اور گوگل اے آئی اسٹوڈیو, تجربہ کرنے اور تاثرات فراہم کرنے کے لیے ابتدائی اپنانے والوں کے لیے ایک پیش نظارہ ٹریک کے ساتھ۔

کی بینچ مارک کارکردگی Gemini 2.5 Flash-Lite

  • تاخیر: تک حاصل کرتا ہے۔ 50% کم درمیانی ردعمل کے اوقات جیمنی 2.5 فلیش کے مقابلے، عام کے ساتھ ذیلی 100 ms معیاری درجہ بندی اور خلاصہ بینچ مارکس پر تاخیر۔
  • انحصار: کے لیے موزوں ہے۔ اونچی اواز کام کا بوجھ، کارکردگی میں کمی کے بغیر دسیوں ہزار درخواستوں کو فی منٹ برقرار رکھنا۔
  • قیمت کارکردگی: دکھاتا ہے a فی 25 ٹوکن لاگت میں 1,000% کمی بمقابلہ اس کے فلیش ہم منصب، اسے بناتا ہے۔ پاریٹو بہترین لاگت کے لحاظ سے حساس تعیناتیوں کے لیے انتخاب۔
  • صنعت کو اپنانا: ابتدائی صارفین پروڈکشن پائپ لائنوں میں بغیر کسی رکاوٹ کے انضمام کی اطلاع دیتے ہیں، جس میں کارکردگی کی پیمائش ابتدائی تخمینوں کے ساتھ یا اس سے زیادہ ہوتی ہے۔

Gemini 2.5 Flash-Lite API


مثالی استعمال کے معاملات

  • اعلی تعدد، کم پیچیدگی کے کام: خودکار ٹیگنگ، جذبات کا تجزیہ، اور بلک ترجمہ
  • لاگت کے لحاظ سے حساس پائپ لائنز: بڑے دستاویز کارپورا سے ڈیٹا نکالنا، متواتر بیچ کا خلاصہ
  • ایج اور موبائل منظرنامے: جب تاخیر اہم ہے لیکن وسائل کے بجٹ محدود ہیں۔

کی حدود Gemini 2.5 Flash-Lite

  • پیش نظارہ کی حیثیت: GA سے پہلے API میں تبدیلیاں ہو سکتی ہیں۔ انضمام کو ممکنہ ورژن کے ٹکرانے کا حساب دینا چاہئے۔
  • کوئی آن دی فلائی فائن ٹیوننگ نہیں۔: حسب ضرورت وزن اپ لوڈ نہیں کر سکتے؛ فوری انجینئرنگ اور سسٹم کے پیغامات پر انحصار کریں۔
  • تخلیقی صلاحیتوں میں کمی: تعییناتی، اعلی تھرو پٹ کاموں کے لیے بنایا گیا؛ اوپن اینڈ جنریشن یا "تخلیقی" تحریر کے لیے کم موزوں۔
  • ریسورس سیلنگ: صرف ~ 16 vCPUs تک خطی پیمانے پر اس سے آگے، تھرو پٹ فائدہ کم ہوتا ہے۔
  • ملٹی موڈل پابندیاں: تصویر/آڈیو ان پٹ کو سپورٹ کرتا ہے لیکن محدود وفاداری کے ساتھ؛ بھاری وژن یا آڈیو ٹرانسکرپشن کے کاموں کے لیے مثالی نہیں ہے۔
  • سیاق و سباق ونڈو ٹریڈ آف : اگرچہ یہ 1 M ٹوکن تک قبول کرتا ہے، لیکن اس پیمانے پر عملی تخمینہ انحطاط پذیر نظر آتا ہے۔

کال کیسے کریں؟ Gemini 2.5 Flash-Lite CometAPI سے API

جیمنی 2.5 فلیش لائٹ CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:

  • ان پٹ ٹوکنز: $0.08/ M ٹوکن
  • آؤٹ پٹ ٹوکنز: $0.32/ M ٹوکن

مطلوبہ اقدامات

  • داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
  • انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
  • اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/

استعمال کے طریقے

  1. منتخب کریں “**gemini-2.5-flash-lite**API کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
  2. بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
  3. مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
  4. . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔

CometAPI مکمل طور پر ہم آہنگ REST API فراہم کرتا ہے — بغیر کسی رکاوٹ کے منتقلی کے لیے۔ کی اہم تفصیلات API دستاویز:

یہ بھی دیکھتے ہیں Gemini 2.5 Pro

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ