جیمنی 2.5 فلیش API

CometAPI
AnnaSep 30, 2025
جیمنی 2.5 فلیش API

Gemini 2.5 Flash API گوگل کا جدید ترین ملٹی موڈل AI ماڈل ہے، جسے قابل کنٹرول استدلال کی صلاحیتوں کے ساتھ تیز رفتار، لاگت سے موثر کاموں کے لیے ڈیزائن کیا گیا ہے، جس سے ڈویلپرز کو Gemini API کے ذریعے جدید "سوچ" خصوصیات کو آن یا آف کرنے کی اجازت دیتا ہے۔ تازہ ترین ماڈلز gemini-2.5-flash.

جیمنی 2.5 فلیش کا جائزہ

Gemini 2.5 Flash کو آؤٹ پٹ کے معیار پر سمجھوتہ کیے بغیر تیز رفتار ردعمل فراہم کرنے کے لیے انجنیئر کیا گیا ہے۔ یہ متن، تصاویر، آڈیو، اور ویڈیو سمیت ملٹی موڈل ان پٹ کو سپورٹ کرتا ہے، جو اسے متنوع ایپلی کیشنز کے لیے موزوں بناتا ہے۔ یہ ماڈل گوگل اے آئی اسٹوڈیو اور ورٹیکس اے آئی جیسے پلیٹ فارمز کے ذریعے قابل رسائی ہے، جو ڈویلپرز کو مختلف سسٹمز میں ہموار انضمام کے لیے ضروری ٹولز فراہم کرتا ہے۔


بنیادی معلومات (خصوصیات)

جیمنی 2.5 فلیش نے کئی اسٹینڈ آؤٹ متعارف کرائے ہیں۔ خصوصیات جو اسے Gemini 2.5 خاندان میں ممتاز کرتا ہے:

  • ہائبرڈ ریزننگ: ڈویلپر سیٹ کر سکتے ہیں a سوچ_بجٹ پیرامیٹر کو باریک کنٹرول کرنے کے لیے کہ ماڈل آؤٹ پٹ سے پہلے اندرونی استدلال کے لیے کتنے ٹوکن وقف کرتا ہے۔
  • پاریٹو فرنٹیئر: میں تعینات بہترین لاگت کی کارکردگی کا نقطہ، فلیش 2.5 ماڈلز کے درمیان بہترین قیمت سے ذہانت کا تناسب پیش کرتا ہے۔
  • ملٹی موڈل سپورٹ: عمل متن, تصاویر, ویڈیو، اور آڈیو مقامی طور پر، امیر بات چیت اور تجزیاتی صلاحیتوں کو فعال کرنا۔
  • 1 ملین ٹوکن سیاق و سباق: بے مثال سیاق و سباق کی لمبائی ایک ہی درخواست میں گہرے تجزیہ اور طویل دستاویز کو سمجھنے کی اجازت دیتی ہے۔

ماڈل ورژننگ

جیمنی 2.5 فلیش مندرجہ ذیل کلید کے ذریعے منتقل ہوا ہے۔ ورژن:

  • gemini-2.5-flash-lite-preview-09-2025: ٹول کی بہتر استعمال کی اہلیت: SWE-Bench کے تصدیق شدہ اسکورز میں 5% اضافے کے ساتھ پیچیدہ، کثیر قدمی کاموں پر بہتر کارکردگی (48.9% سے 54% تک)۔ بہتر کارکردگی: استدلال کو فعال کرتے وقت، کم ٹوکن کے ساتھ اعلیٰ معیار کی پیداوار حاصل کی جاتی ہے، تاخیر اور اخراجات کو کم کرتے ہیں۔
  • پیش نظارہ 04-17: "سوچنے" کی صلاحیت کے ساتھ ابتدائی رسائی کی ریلیز، بذریعہ دستیاب gemini-2.5-flash-preview-04-17.
  • مستحکم عام دستیابی (GA): 17 جون 2025 تک، مستحکم اختتامی نقطہ جیمنی 2.5-فلیش پیش نظارہ کی جگہ لے لیتا ہے، 20 مئی کے پیش نظارہ سے بغیر کسی API تبدیلیوں کے پیداواری درجے کی وشوسنییتا کو یقینی بناتا ہے۔
  • پیش نظارہ کی فرسودگی: پیش نظارہ اختتامی پوائنٹس 15 جولائی 2025 کو بند ہونے کے لیے طے کیے گئے تھے۔ صارفین کو اس تاریخ سے پہلے GA اینڈ پوائنٹ پر منتقل ہونا چاہیے۔

جولائی 2025 تک، جیمنی 2.5 فلیش اب عوامی طور پر دستیاب اور مستحکم ہے (اس سے کوئی تبدیلی نہیں  gemini-2.5-flash-preview-05-20 ).اگر آپ استعمال کر رہے ہیں۔ gemini-2.5-flash-preview-04-17، موجودہ پیش نظارہ قیمتوں کا تعین 15 جولائی 2025 کو ماڈل اینڈ پوائنٹ کی طے شدہ ریٹائرمنٹ تک جاری رہے گا، جب اسے بند کر دیا جائے گا۔ آپ عام طور پر دستیاب ماڈل پر منتقل کر سکتے ہیں "gemini-2.5-flash".

تیز، سستا، ہوشیار:

  • ڈیزائن کے مقاصد: کم تاخیر + اعلی تھرو پٹ + کم قیمت؛
  • استدلال، ملٹی موڈل پروسیسنگ، اور طویل متن کے کاموں میں مجموعی طور پر تیز رفتاری؛
  • ٹوکن کے استعمال میں 20-30% کی کمی واقع ہوئی ہے، جس سے استدلال کے اخراجات میں نمایاں کمی آئی ہے۔

تکنیکی خصوصیات

ان پٹ سیاق و سباق کی ونڈو: 1 ملین ٹوکنز تک، وسیع سیاق و سباق کو برقرار رکھنے کی اجازت دیتے ہیں۔

آؤٹ پٹ ٹوکن: فی جواب 8,192 ٹوکن پیدا کرنے کے قابل۔

تائید شدہ طریقوں: متن، تصاویر، آڈیو، اور ویڈیو۔

انٹیگریشن پلیٹ فارمز: گوگل اے آئی اسٹوڈیو اور ورٹیکس اے آئی کے ذریعے دستیاب ہے۔

قیمتوں کا تعین: مسابقتی ٹوکن کی بنیاد پر قیمتوں کا تعین کرنے والا ماڈل، لاگت سے موثر تعیناتی کی سہولت فراہم کرتا ہے۔


تکنیکی تفصیلات

ہڈ کے نیچے، جیمنی 2.5 فلیش ایک ہے۔ ٹرانسفارمر کی بنیاد پر ویب، کوڈ، تصویر، اور ویڈیو ڈیٹا کے مرکب پر تربیت یافتہ بڑی زبان کا ماڈل۔ چابی تکنیکی وضاحتیں شامل ہیں:

ملٹی موڈل ٹریننگ: متعدد طریقوں کو سیدھ میں لانے کے لیے تربیت یافتہ، فلیش بغیر کسی رکاوٹ کے متن کو ملا سکتی ہے۔ تصاویر, ویڈیو، یا آڈیو, ویڈیو خلاصہ یا آڈیو کیپشننگ جیسے کاموں کے لیے مفید ہے۔

متحرک سوچ کا عمل: ایک اندرونی استدلال لوپ کو نافذ کرتا ہے جہاں ماڈل کی منصوبہ بندی اور پیچیدہ اشارے کو توڑ دیتا ہے۔ حتمی پیداوار سے پہلے

قابل ترتیب سوچنے والے بجٹ: سوچ_بجٹ سے سیٹ کیا جا سکتا ہے۔ 0 (کوئی استدلال نہیں) تک 24,576 ٹوکن, تاخیر اور جواب کے معیار کے درمیان تجارت کی اجازت دیتا ہے۔

ٹول انٹیگریشن: کی حمایت کرتا ہے۔ گوگل سرچ کے ساتھ گراؤنڈنگ, کوڈ پر عمل درآمد, URL سیاق و سباق، اور فنکشن کالنگ، قدرتی زبان کے اشارے سے براہ راست حقیقی دنیا کے اعمال کو فعال کرنا۔


بینچ مارک کارکردگی

سخت تشخیصات میں، Gemini 2.5 Flash ظاہر کرتا ہے۔ صنعت کے معروف کارکردگی:

  • LMArena ہارڈ پرامپٹس: اسکور کیا۔ دوسرے نمبر پر صرف 2.5 پرو چیلنجنگ ہارڈ پرامپٹس بینچ مارک پر، مضبوط کثیر مرحلہ استدلال کی صلاحیتوں کو ظاہر کرتا ہے۔
  • MMLU اسکور 0.809: a کے ساتھ ماڈل کی اوسط کارکردگی سے زیادہ ہے۔ 0.809 MMLU درستگی، اس کے وسیع ڈومین علم اور استدلال کی صلاحیت کی عکاسی کرتی ہے۔
  • لیٹنسی اور تھرو پٹ: حاصل کرتا ہے۔ 271.4 ٹوکن/سیکنڈ ضابطہ کشائی کی رفتار a کے ساتھ 0.29 s ٹائم ٹو فرسٹ ٹوکن، اسے تاخیر سے حساس کام کے بوجھ کے لیے مثالی بناتا ہے۔
  • پرائس ٹو پرفارمنس لیڈر: پر $0.26/1 M ٹوکنز, فلیش بہت سے حریفوں کو اہم بینچ مارکس پر مماثل کرتے ہوئے یا پیچھے چھوڑ دیتا ہے۔

یہ نتائج استدلال، سائنسی تفہیم، ریاضی کے مسائل حل کرنے، کوڈنگ، بصری تشریح، اور کثیر لسانی صلاحیتوں میں جیمنی 2.5 فلیش کی مسابقتی برتری کی نشاندہی کرتے ہیں:

جیمنی 2.5 فلیش API


حدود

طاقتور ہونے کے باوجود، جیمنی 2.5 فلیش میں یقینی ہے۔ حدود:

  • حفاظتی خطرات: ماڈل ایک نمائش کر سکتے ہیں "تبلیغ" لہجہ اور قابل فہم آواز لیکن غلط یا متعصب نتائج (فریب) پیدا کر سکتے ہیں، خاص طور پر ایج کیس کے سوالات پر۔ سخت انسانی نگرانی ضروری ہے۔
  • شرح کی حدیں: API کا استعمال شرح کی حدود (10 RPM، 250,000 TPM، 250 RPD ڈیفالٹ ٹائرز پر) کی طرف سے محدود ہے، جو بیچ پروسیسنگ یا ہائی والیوم ایپلی کیشنز کو متاثر کر سکتا ہے۔
  • انٹیلی جنس فلور: جبکہ ایک کے لیے غیر معمولی طور پر قابل فلیش ماڈل، یہ اس سے کم درست رہتا ہے۔ 2.5 پرو جدید ترین کوڈنگ یا ملٹی ایجنٹ کوآرڈینیشن جیسے انتہائی ضروری ایجنٹی کاموں پر۔
  • لاگت کی تجارت: اگرچہ سب سے بہتر پیش کر رہے ہیں۔ قیمت کی کارکردگی، کا وسیع استعمال سوچ موڈ مجموعی طور پر ٹوکن کی کھپت کو بڑھاتا ہے، گہری استدلال کے اشارے کے لیے لاگت بڑھاتا ہے۔

یہ بھی دیکھتے ہیں Gemini 2.5 Pro API

نتیجہ

Gemini 2.5 Flash AI ٹیکنالوجیز کو آگے بڑھانے کے لیے Google کے عزم کے ثبوت کے طور پر کھڑا ہے۔ اپنی مضبوط کارکردگی، ملٹی موڈل صلاحیتوں، اور موثر وسائل کے انتظام کے ساتھ، یہ ڈویلپرز اور تنظیموں کے لیے ایک جامع حل پیش کرتا ہے جو اپنے کاموں میں مصنوعی ذہانت کی طاقت کو بروئے کار لانا چاہتے ہیں۔

کال کیسے کریں؟ Gemini 2.5 Flash CometAPI سے API

Gemini 2.5 Flash CometAPI میں API قیمتوں کا تعین، سرکاری قیمت میں 20% چھوٹ:

  • ان پٹ ٹوکنز: $0.24/M ٹوکن
  • آؤٹ پٹ ٹوکنز: $0.96/ M ٹوکن

مطلوبہ اقدامات

  • داخل ہوجاو cometapi.com. اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہ کرم پہلے رجسٹر کریں۔
  • انٹرفیس کی رسائی کی سند API کلید حاصل کریں۔ ذاتی مرکز میں API ٹوکن پر "ٹوکن شامل کریں" پر کلک کریں، ٹوکن کی حاصل کریں: sk-xxxxx اور جمع کرائیں۔
  • اس سائٹ کا یو آر ایل حاصل کریں: https://api.cometapi.com/

استعمال کے طریقے

  1. منتخب کریں “**gemini-2.5-flash**API کی درخواست بھیجنے اور درخواست کا باڈی سیٹ کرنے کے لیے اینڈ پوائنٹ۔ درخواست کا طریقہ اور درخواست کا باڈی ہماری ویب سائٹ API دستاویز سے حاصل کیا جاتا ہے۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔
  2. بدل دیں۔ آپ کے اکاؤنٹ سے اپنی اصل CometAPI کلید کے ساتھ۔
  3. مواد کے خانے میں اپنا سوال یا درخواست داخل کریں—یہ وہی ہے جس کا ماڈل جواب دے گا۔
  4. . تیار کردہ جواب حاصل کرنے کے لیے API جواب پر کارروائی کریں۔

Comet API میں ماڈل لنچ کی معلومات کے لیے براہ کرم دیکھیں https://api.cometapi.com/new-model.

Comet API میں ماڈل کی قیمت کی معلومات کے لیے براہ کرم دیکھیں https://api.cometapi.com/pricing.

API کے استعمال کی مثال

ڈویلپرز کے ساتھ بات چیت کر سکتے ہیں جیمنی 2.5-فلیش CometAPI کے API کے ذریعے، مختلف ایپلی کیشنز میں انضمام کو قابل بناتا ہے۔ ذیل میں ایک ازگر کی مثال ہے:

import os
from openai import OpenAI

client = OpenAI(
    base_url="
https://api.cometapi.com/v1/chat/completions",
    api_key="<YOUR_API_KEY>",    
)

response = openai.ChatCompletion.create(
    model="gemini-2.5-flash",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Explain the concept of quantum entanglement."}
    ]
)

print(response)

یہ اسکرپٹ کو ایک اشارہ بھیجتا ہے۔ Gemini 2.5 Flash تیار کردہ ردعمل کو ماڈل اور پرنٹ کرتا ہے، یہ ظاہر کرتا ہے کہ کس طرح استعمال کیا جائے۔ Gemini 2.5 Flash پیچیدہ وضاحتوں کے لیے۔

SHARE THIS BLOG

مزید پڑھیں

500+ ماڈلز ایک API میں

20% تک چھوٹ