ماڈلزسپورٹانٹرپرائزبلاگ
500+ AI ماڈل API، تمام ایک API میں۔ صرف CometAPI میں
ماڈلز API
ڈویلپر
فوری آغازدستاویزاتAPI ڈیش بورڈ
وسائل
AI ماڈلزبلاگانٹرپرائزتبدیلیوں کا ریکارڈہمارے بارے میں
2025 CometAPI۔ تمام حقوق محفوظ ہیں۔رازداری کی پالیسیخدمات کی شرائط
Home/Models/OpenAI/gpt-realtime-1.5
O

gpt-realtime-1.5

ان پٹ:$3.2/M
آؤٹ پٹ:$12.8/M
سیاق و سباق:32,000
زیادہ سے زیادہ آؤٹ پٹ:4,096
آڈیو ان، آڈیو آؤٹ کے لیے بہترین وائس ماڈل۔
نیا
تجارتی استعمال
خلاصہ
خصوصیات
قیمت
API

gpt-realtime-1.5 کی تکنیکی خصوصیات

مدgpt-realtime-1.5 (عوامی پوزیشننگ)
Model familyGPT Realtime 1.5 (آواز کے لیے موزوں کردہ ورژن)
Primary modalityتقریر بہ تقریر (S2S)
Input typesآڈیو (اسٹریمنگ)، متن
Output typesآڈیو (اسٹریمنگ)، متن، ساختہ ٹول کالز
APIریئل ٹائم API (WebRTC / مستقل اسٹریمنگ سیشنز)
Latency profileکم لیٹنسی، براہِ راست مکالماتی تعامل کے لیے آپٹمائزڈ
Session modelاسٹیٹ فل اسٹریمنگ سیشنز
Tool useفنکشن کالنگ اور ٹول انٹیگریشن کی معاونت
Target use caseلائیو وائس ایجنٹس، اسسٹنٹس، انٹرایکٹو سسٹمز

نوٹ: درست ٹوکن حدود اور کانٹیکسٹ ونڈو کے سائز عوامی خلاصوں میں نمایاں طور پر دستاویزی نہیں ہیں؛ اس ماڈل کی پوزیشننگ انتہائی طویل کانٹیکسٹ سیشنز کے بجائے ریئل ٹائم ریسپانس پر مرکوز ہے۔


gpt-realtime-1.5 کیا ہے؟

gpt-realtime-1.5 ایک کم لیٹنسی، تقریر بہ تقریر کے لیے موزوں کردہ ماڈل ہے جو لائیو مکالماتی سسٹمز کے لیے بنایا گیا ہے۔ روایتی ریکویسٹ-رسپانس ماڈلز کے برعکس، یہ مستقل اسٹریمنگ سیشنز کے ذریعے چلتا ہے، جو قدرتی باری باری گفتگو، مداخلت سنبھالنے، اور ڈائنامک وائس انٹریکشن کو ممکن بناتا ہے۔

یہ اُن ایپلیکیشنز کے لیے بنایا گیا ہے جہاں مکالمے کے بہاؤ کی رفتار زیادہ اہم ہو، نہ کہ زیادہ سے زیادہ کانٹیکسٹ کی لمبائی۔


اہم خصوصیات

  1. حقیقی تقریر بہ تقریر تعامل — براہِ راست آڈیو ان پٹ قبول کرتا ہے اور ریئل ٹائم میں بولے گئے جوابات اسٹریم کرتا ہے۔
  2. کم لیٹنسی آرکیٹیکچر — وائس ایجنٹس میں سب-سیکنڈ مکالماتی ریسپانس کے لیے ڈیزائن کیا گیا۔
  3. اسٹریمنگ-فرسٹ ڈیزائن — مستقل سیشنز (WebRTC یا اسٹریمنگ پروٹوکولز) کے ذریعے کام کرتا ہے۔
  4. قدرتی باری گیری — مداخلت سنبھالنے اور ڈائنامک گفتگو کے بہاؤ کی حمایت کرتا ہے۔
  5. ٹول کالنگ کی معاونت — ریئل ٹائم سیشن کے دوران ساختہ فنکشن کالز ٹرگر کر سکتا ہے۔
  6. پروڈکشن کے لیے تیار وائس ایجنٹ کی بنیاد — خاص طور پر انٹرایکٹو اسسٹنٹس، کیوسکس، اور ایمبیڈڈ ڈیوائسز کے لیے بنایا گیا۔

بینچ مارک اور کارکردگی کی پوزیشننگ

OpenAI gpt-realtime-1.5 کو پہلے کے ریئل ٹائم ماڈلز کے ارتقاء کے طور پر پیش کرتا ہے، جس میں ہدایات پر عمل، طویل وائس سیشنز کے دوران استحکام، اور پہلے کے ریلیزز کے مقابلے میں زیادہ قدرتی ادائیگی شامل ہے۔

کوڈنگ پر مرکوز ماڈلز (مثلاً Codex ورژنز) کے برعکس، کارکردگی کی پیمائش زیادہ تر مکالماتی لیٹنسی، آواز کی قدرتی پن، اور سیشن کے استحکام پر ہوتی ہے، نہ کہ لیڈر بورڈ طرز کے بینچ مارکس پر۔


gpt-realtime-1.5 بمقابلہ متعلقہ ماڈلز

خصوصیتgpt-realtime-1.5gpt-audio-1.5
Primary goalبراہِ راست وائس تعاملآڈیو فعال چیٹ ورک فلو
Latencyکم سے کم تاخیر کے لیے آپٹمائزڈمعیار/رفتار میں متوازن
Session typeمستقل اسٹریمنگ سیشنمعیاری Chat Completions فلو
Context sizeریسپانس کے لیے آپٹمائزڈبڑے کانٹیکسٹ کی سپورٹ
Best use caseریئل ٹائم وائس ایجنٹسآڈیو کے ساتھ مکالماتی اسسٹنٹس

ہر ایک کو کب منتخب کریں

  • gpt-realtime-1.5 کا انتخاب کال سینٹرز، کیوسکس، AI ریسیپشنسٹس، یا لائیو ایمبیڈڈ اسسٹنٹس کے لیے کریں۔
  • gpt-audio-1.5 کا انتخاب اُن وائس فعال چیٹ ایپس کے لیے کریں جنہیں طویل گفتگو کی میموری یا ملٹی موڈل ورک فلو درکار ہو۔

نمایاں استعمال کے کیسز

  • AI کال سینٹر ایجنٹس
  • اسمارٹ ڈیوائس اسسٹنٹس
  • انٹرایکٹو کیوسکس
  • لائیو ٹیوٹورنگ سسٹمز
  • ریئل ٹائم زبان سیکھنے کی مشق کے ٹولز
  • وائس کنٹرولڈ ایپلیکیشنز
  • GPT realtime 1.5 API تک کیسے رسائی حاصل کریں

مرحلہ 1: API کلید کے لیے سائن اپ کریں

cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کی ایکسیس اسناد API key حاصل کریں۔ Personal Center میں API token پر “Add Token” پر کلک کریں، ٹوکن کلید حاصل کریں: sk-xxxxx اور جمع کریں۔

cometapi-key

مرحلہ 2: GPT realtime 1.5 API کو ریکویسٹ بھیجیں

“gpt-realtime-1.5” اینڈ پوائنٹ منتخب کریں تاکہ API ریکویسٹ بھیجی جا سکے اور ریکویسٹ باڈی سیٹ کریں۔ ریکویسٹ میتھڈ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API ڈاک سے حاصل کیے جا سکتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ کی اصل CometAPI key سے بدلیں۔ base url Chat Completions ہے۔

اپنا سوال یا درخواست content فیلڈ میں درج کریں—اسی پر ماڈل جواب دے گا۔ API ریسپانس کو پروسیس کریں تاکہ جنریٹ کیا گیا جواب حاصل ہو سکے۔

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

API ریسپانس کو پروسیس کریں تاکہ جنریٹ کیا گیا جواب حاصل ہو۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

اکثر پوچھے جانے والے سوالات

What is gpt-realtime-1.5 used for in the Realtime API?

gpt-realtime-1.5 کو Realtime API میں مستقل اسٹریمنگ سیشنز کے ذریعے کم تاخیر والی اسپیچ ٹو اسپیچ تعاملات کے لیے ڈیزائن کیا گیا ہے، جس کی وجہ سے یہ لائیو وائس ایجنٹس اور انٹرایکٹو اسسٹنٹس کے لیے مثالی ہے۔

How is gpt-realtime-1.5 different from gpt-audio-1.5 API?

gpt-realtime-1.5 کم سے کم تاخیر کے ساتھ حقیقی وقت کی اسٹریمنگ وائس گفتگو پر توجہ دیتا ہے، جبکہ gpt-audio-1.5 زیادہ وسیع سیاق و سباق والے آڈیو فعال چیٹ ورک فلو کے لیے بہتر بنایا گیا ہے۔

Does gpt-realtime-1.5 API support function calling during live sessions?

جی ہاں، gpt-realtime-1.5 فعال ریئل ٹائم سیشن کے اندر اسٹرکچرڈ ٹول کالز کی معاونت کرتا ہے، جس سے بیرونی سسٹمز کے ساتھ انضمام ممکن ہوتا ہے۔

Is gpt-realtime-1.5 suitable for customer support voice bots?

جی ہاں، یہ خاص طور پر انٹرایکٹو، کم تاخیر والے مکالماتی نظاموں جیسے کال سینٹر ایجنٹس اور ورچوئل ریسپشنسٹس کے لیے بہتر بنایا گیا ہے۔

Can gpt-realtime-1.5 handle interruptions during conversation?

جی ہاں، یہ ماڈل قدرتی باری باری گفتگو کے لیے ڈیزائن کیا گیا ہے اور اسٹریمنگ وائس سیشن کے دوران مداخلتوں کو سنبھال سکتا ہے۔

Does gpt-realtime-1.5 prioritize latency or long context memory?

gpt-realtime-1.5 انتہائی بڑے کانٹیکسٹ ونڈوز کے بجائے مکالماتی ردعمل کی رفتار اور کم تاخیر کو ترجیح دیتا ہے۔

What infrastructure is required to integrate gpt-realtime-1.5 API?

gpt-realtime-1.5 API کے انضمام کے وقت ڈویلپرز عموماً مستقل آڈیو سیشنز برقرار رکھنے کے لیے WebRTC یا اسٹریمنگ پر مبنی کنیکشنز استعمال کرتے ہیں۔

gpt-realtime-1.5 کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

gpt-realtime-1.5 کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)رعایت
ان پٹ:$3.2/M
آؤٹ پٹ:$12.8/M
ان پٹ:$4/M
آؤٹ پٹ:$16/M
-20%

gpt-realtime-1.5 کے لیے نمونہ کوڈ اور API

gpt-realtime-1.5 کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں gpt-realtime-1.5 کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔

مزید ماڈلز

O

gpt-audio-1.5

ان پٹ:$2/M
آؤٹ پٹ:$8/M
Chat Completions کے ساتھ آڈیو اِن، آڈیو آؤٹ کے لیے بہترین وائس ماڈل۔
O

Whisper-1

ان پٹ:$24/M
آؤٹ پٹ:$24/M
تقریر کو متن میں تبدیل کرنا، ترجمے تیار کرنا
O

TTS

ان پٹ:$12/M
آؤٹ پٹ:$12/M
OpenAI متن سے گفتار
K

Kling TTS

فی درخواست:$0.006608
[اسپیچ سنتھیسِس] نیا آغاز: متن سے نشریاتی آڈیو آن لائن، پیش نظارہ کی خصوصیت کے ساتھ ● بیک وقت audio_id بھی تیار کر سکتا ہے، جسے کسی بھی Keling API کے ساتھ استعمال کیا جا سکتا ہے۔
K

Kling video-to-audio

K

Kling video-to-audio

فی درخواست:$0.03304
Kling ویڈیو کو آڈیو میں
K

Kling text-to-audio

K

Kling text-to-audio

فی درخواست:$0.03304
Kling ٹیکسٹ-ٹو-آڈیو