Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
ان پٹ:$1.60/M
آؤٹ پٹ:$9.60/M
سیاق و سباق:200.0k
زیادہ سے زیادہ آؤٹ پٹ:200.0k
Gemini 3 Pro Preview، Gemini خاندان کا ایک عمومی مقصد کا ماڈل ہے، جو جانچ اور پروٹو ٹائپنگ کے لیے پریویو میں دستیاب ہے۔ یہ ہدایت کی پیروی، کثیر مرحلہ استدلال، اور کوڈ و ڈیٹا کے کاموں کی حمایت کرتا ہے، اور ورک فلو آٹومیشن کے لیے ساختہ نتائج اور ٹول/فنکشن کالنگ فراہم کرتا ہے۔ عام استعمالات میں چیٹ اسسٹنٹس، خلاصہ سازی اور دوبارہ تحریر، ریٹریول افزودہ سوال و جواب (QA)، ڈیٹا استخراج، اور ایپس و سروسز میں ہلکی نوعیت کی کوڈنگ مدد شامل ہیں۔ تکنیکی نمایاں خصوصیات میں API پر مبنی تعیناتی، اسٹریمنگ جوابات، حفاظتی کنٹرولز، اور انضمام کے لیے آمادگی شامل ہیں، جبکہ ملٹی موڈل صلاحیتیں پریویو کنفیگریشن پر منحصر ہیں۔
خلاصہ
Playground
خصوصیات
قیمت
API
ورژن

Gemini 3 Pro (Preview)، Gemini 3 فیملی میں Google/DeepMind کا نیا فلیگ شپ ملٹی موڈل استدلال ماڈل ہے۔ اسے اُن کا "اب تک کا سب سے ذہین ماڈل" قرار دیا جاتا ہے، جو گہرے استدلال، ایجنٹک ورک فلو، اعلیٰ درجے کی کوڈنگ، اور طویل سیاق والے ملٹی موڈل فہم (متن، تصاویر، آڈیو، ویڈیو، کوڈ اور ٹول انٹیگریشنز) کے لیے ڈیزائن کیا گیا ہے۔

اہم خصوصیات

  • مودالٹیز: متن، تصویر، ویڈیو، آڈیو، PDFs (اور ساختہ ٹول آؤٹ پٹس)۔
  • ایجنٹک/ٹوولنگ: بلٹ اِن فنکشن کالنگ، سرچ بطور ٹول، کوڈ ایکزیکیوشن، URL سیاق، اور کثیر مرحلہ ایجنٹس کی ہم آہنگی کی سپورٹ۔ تھوٹ-سگنیچر میکنزم کالز کے درمیان کثیر مرحلہ استدلال کو محفوظ رکھتا ہے۔
  • کوڈنگ اور "وائب کوڈنگ": فرنٹ اینڈ جنریشن، انٹریکٹو UI جنریشن، اور ایجنٹک کوڈنگ کے لیے بہتر بنایا گیا ہے (Google کے مطابق متعلقہ لیڈر بورڈز میں سرفہرست ہے)۔ اسے اب تک کا ان کا سب سے مضبوط "وائب کوڈنگ" ماڈل قرار دیا جا رہا ہے۔
  • نئے ڈویلپر کنٹرولز: thinking_level (low|high) لاگت/لیٹنسی بمقابلہ استدلال کی گہرائی کے درمیان توازن کے لیے، اور media_resolution ہر تصویر یا ویڈیو فریم کی ملٹی موڈل فیڈیلیٹی کنٹرول کرنے کے لیے۔ یہ کارکردگی، لیٹنسی اور لاگت میں توازن بنانے میں مدد دیتے ہیں۔

بینچ مارک کارکردگی

  • Gemini3Pro نے LMARE میں 1501 اسکور کے ساتھ پہلا مقام حاصل کیا، Grok-4.1-thinking کے 1484 پوائنٹس کو پیچھے چھوڑتے ہوئے، اور Claude Sonnet 4.5 اور Opus 4.1 پر بھی برتری حاصل کی۔
  • اس نے WebDevArena پروگرامنگ ارینا میں بھی 1487 اسکور کے ساتھ پہلا مقام حاصل کیا۔
  • Humanity’s Last Exam اکیڈمک ریزننگ میں اس نے 37.5% (بغیر ٹولز) حاصل کیا؛ GPQA Diamond سائنس میں 91.9%; اور MathArena Apex ریاضی مقابلے میں 23.4%، جو ایک نیا ریکارڈ ہے۔
  • ملٹی موڈل صلاحیتوں میں، MMMU-Pro پر 81%; اور Video-MMMU ویڈیو سمجھ میں 87.6% حاصل کیا۔

img

تکنیکی تفصیلات اور معماری

  • "Thinking level" پیرامیٹر: Gemini 3 ایک thinking_level کنٹرول فراہم کرتا ہے جو ڈویلپرز کو اندرونی استدلال کی گہرائی بمقابلہ لیٹنسی/لاگت میں توازن کرنے دیتا ہے۔ ماڈل thinking_level کو سخت ٹوکن ضمانت کے بجائے اندرونی کثیر مرحلہ استدلال کے لیے نسبتی الاونس کے طور پر برتتا ہے۔ Pro کے لیے ڈیفالٹ عموماً high ہے۔ یہ ڈویلپرز کے لیے ملٹی اسٹیپ پلاننگ اور چین-آف-تھوٹ کی گہرائی ٹن کرنے کا واضح نیا کنٹرول ہے۔
  • ساختہ آؤٹ پٹس اور ٹولز: ماڈل ساختہ JSON آؤٹ پٹس کی سپورٹ کرتا ہے اور بلٹ اِن ٹولز (Google Search grounding، URL سیاق، کوڈ ایکزیکیوشن وغیرہ) کے ساتھ استعمال کیا جا سکتا ہے۔ کچھ structured-output+tools فیچرز gemini-3-pro-preview کے لیے صرف پریویو میں دستیاب ہیں۔
  • ملٹی موڈل اور ایجنٹک انٹیگریشنز: Gemini 3 Pro کو واضح طور پر ایجنٹک ورک فلوز کے لیے بنایا گیا ہے (ٹوولنگ + کوڈ/ٹرمنلز/براؤزر پر متعدد ایجنٹس)۔

حدود اور معلوم احتیاطیں

  1. کامل حقیقت پسندی نہیں — ہیلوسینیشنز ممکن رہتی ہیں۔ Google کی جانب سے دعویٰ کردہ حقیقت پسندی میں مضبوط بہتریوں کے باوجود، حساس معاملات (قانونی، طبی، مالی) میں مصدقہ توثیق اور انسانی جانچ اب بھی ضروری ہے۔
  2. طویل سیاق کی کارکردگی کام کے لحاظ سے مختلف ہوتی ہے۔ 1M ان پٹ ونڈو کی سپورٹ بنیادی صلاحیت ہے، لیکن انتہائی لمبائی پر بعض بینچ مارکس میں عملی مؤثریت کم ہو سکتی ہے (کچھ طویل سیاق کے ٹیسٹس میں 1M پر نقطہ وار کمی دیکھی گئی)۔
  3. لاگت اور لیٹنسی کے تبادلوں۔ بڑے کانٹیکسٹس اور زیادہ thinking_level سیٹنگز کمپیوٹ، لیٹنسی اور لاگت بڑھاتی ہیں؛ قیمت کی سطحیں ٹوکن وولیومز کے مطابق لاگو ہوتی ہیں۔ لاگت کے نظم کے لیے thinking_level اور چنکنگ حکمت عملیاں استعمال کریں۔
  4. محفوظیت اور مواد کے فلٹرز۔ Google حفاظتی پالیسیاں اور ماڈریشن لیئرز جاری رکھتا ہے؛ کچھ مواد اور اعمال محدود رہیں گے یا انکار موڈز کو متحرک کریں گے۔

دیگر سرکردہ ماڈلز کے مقابلے میں Gemini 3 Pro Preview کیسا ہے

اعلی سطحی موازنہ (پریویو → کیفی):

Gemini 2.5 Pro کے مقابلے میں: استدلال، ایجنٹک ٹول استعمال، اور ملٹی موڈل انضمام میں نمایاں درجے کی بہتری؛ کہیں بڑا کانٹیکسٹ ہینڈلنگ اور طویل شکل کی بہتر سمجھ۔ DeepMind اکیڈمک استدلال، کوڈنگ اور ملٹی موڈل کاموں میں مسلسل بہتریاں دکھاتا ہے۔

GPT-5.1 اور Claude Sonnet 4.5 کے مقابلے میں (جیسا کہ رپورٹ کیا گیا): Google/DeepMind کے بینچ مارکس کے مجموعے میں Gemini 3 Pro کو متعدد ایجنٹک، ملٹی موڈل، اور طویل سیاق میٹرکس پر سرفہرست دکھایا گیا ہے (دیکھیے Terminal-Bench، MMMU-Pro، AIME)۔ تقابلی نتائج کام کے لحاظ سے مختلف ہوتے ہیں۔


عام اور اعلیٰ قدر کے استعمالات

  • بڑے دستاویز/کتاب کا خلاصہ اور سوال و جواب: طویل سیاق کی سپورٹ اسے قانونی، تحقیق، اور کمپلائنس ٹیموں کے لیے پُرکشش بناتی ہے۔
  • ریپو سطح پر کوڈ کی سمجھ اور تخلیق: کوڈنگ ٹول چینز کے انضمام اور بہتر استدلال بڑے کوڈ بیس کی ریفیکٹرنگ اور خودکار کوڈ ریویو ورک فلو میں مدد دیتا ہے۔
  • ملٹی موڈل پروڈکٹ اسسٹنٹس: تصویر + متن + آڈیو ورک فلوز (کسٹمر سپورٹ جو اسکرین شاٹس، کال اسنیپٹس اور دستاویزات کو لیتا/استعمال کرتا ہے)۔
  • میڈیا جنریشن اور ایڈیٹنگ (فوٹو → ویڈیو): Gemini فیملی کی پہلے کی خصوصیات میں اب Veo / Flow طرز کی photo→video صلاحیتیں شامل ہیں؛ پریویو پروٹوٹائپس اور میڈیا ورک فلو کے لیے مزید گہری ملٹی میڈیا جنریشن کی طرف اشارہ کرتا ہے۔

Gemini 3 Pro Preview کے لیے Playground

Gemini 3 Pro Preview کا Playground دریافت کریں — ماڈلز کو ٹیسٹ کرنے اور حقیقی وقت میں سوالات چلانے کے لیے ایک متحرک ماحول۔ پرامپٹس آزمائیں، پیرامیٹرز ایڈجسٹ کریں، اور فوری طور پر دہرائیں تاکہ ترقی کو تیز کریں اور استعمال کے معاملات کی تصدیق کریں۔

Gemini 3 Pro Preview کے لیے خصوصیات

* **ماڈل ID (پری ویو):** `gemini-3-pro-preview`۔ * **ان پٹ کی اقسام:** متن، تصویر، ویڈیو، آڈیو، PDF۔ آؤٹ پٹ: متن * **سیاق/ٹوکن کی حدود:** ان پٹ ≈ **1,048,576 ٹوکنز**؛ آؤٹ پٹ ≤ **65,536 ٹوکنز**۔ * **علم کی حد:** **جنوری 2025** (جدید معلومات کے لیے Search Grounding استعمال کرتا ہے)۔ * **صلاحیتیں (منتخب):** فنکشن کالنگ، کوڈ ایگزیکیوشن، فائل تلاش، ساختہ آؤٹ پٹس، سرچ گراؤنڈنگ۔ سپورٹ نہیں: آڈیو جنریشن، امیج جنریشن، لائیو API، امیج سیگمنٹیشن، Google Maps grounding (کچھ خصوصیات Gemini 2.5 سے مختلف ہیں)۔
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Gemini 3 Pro Preview کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)
ان پٹ:$1.60/M
آؤٹ پٹ:$9.60/M
ان پٹ:$2.00/M
آؤٹ پٹ:$12.00/M

Gemini 3 Pro Preview کے لیے نمونہ کوڈ اور API

Gemini 3 Pro، Gemini 3 فیملی میں Google/DeepMind کا نیا ترین فلیگ شپ ملٹی موڈل استدلالی ماڈل ہے۔ اسے ان کے "اب تک کے سب سے ذہین ماڈل" کے طور پر پیش کیا گیا ہے، جو گہری استدلال، ایجنٹ پر مبنی ورک فلو، اعلیٰ درجے کی کوڈنگ، اور طویل سیاق و سباق کے ساتھ ملٹی موڈل فہم (متن، تصاویر، آڈیو، ویڈیو، کوڈ اور ٹول انٹیگریشنز) کے لیے تیار کیا گیا ہے۔
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Pro Preview کے ورژن

Gemini 3 Pro Preview کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔