O

gpt-audio-1.5

ان پٹ:$2/M
آؤٹ پٹ:$8/M
Chat Completions کے ساتھ آڈیو اِن، آڈیو آؤٹ کے لیے بہترین وائس ماڈل۔
نیا
تجارتی استعمال

gpt-audio-1.5 کی تکنیکی وضاحتیں

آئٹمgpt-audio-1.5 (عوامی وضاحتیں)
ماڈل فیملیGPT Audio فیملی (آڈیو-فرسٹ ویریئنٹ)
ان پٹ کی اقساممتن، آڈیو (اسپیچ اِن)
آؤٹ پٹ کی اقساممتن، آڈیو (اسپیچ آؤٹ)، ساختہ آؤٹ پٹس (فنکشن کالز کی حمایت)
کانٹیکسٹ ونڈو128,000 ٹوکنز۔
زیادہ سے زیادہ آؤٹ پٹ ٹوکنز16,384 (متعلقہ gpt-audio لسٹنگ میں دستاویزی)۔
کارکردگی کا درجہزیادہ ذہانت؛ درمیانی رفتار (متوازن).
لیٹنسی پروفائلوائس تعاملات کے لیے بہتر بنایا گیا (اینڈ پوائنٹ کے مطابق درمیانی/کم لیٹنسی).
دستیابیChat Completions API (آڈیو اِن/آؤٹ) اور پلیٹ فارم پلی گراؤنڈز؛ ریئل ٹائم/وائس سرفیسز میں مربوط۔
حفاظتی/استعمال نوٹسوائس مواد کے لیے حفاظتی گائیڈ ریلز؛ پروڈکشن وائس ایجنٹس کے لیے ماڈل آؤٹ پٹس کو معمول کی حفاظت اور توثیق کے ساتھ برتیں۔

نوٹ: gpt-realtime-1.5 ایک قریبی متعلقہ ریئل ٹائم آڈیو/وائس-فرسٹ ویریئنٹ ہے جو کم لیٹنسی اور ریئل ٹائم سیشنز کے لیے بہتر بنایا گیا ہے؛ ذیل میں موازنہ دیکھیں۔


gpt-audio-1.5 کیا ہے؟

gpt-audio-1.5 ایک آڈیو-قادر GPT ماڈل ہے جو Chat Completions اور متعلقہ آڈیو-قادر APIs کے ذریعے اسپیچ اِن اور اسپیچ آؤٹ دونوں کی حمایت کرتا ہے۔ یہ آواز پر مبنی ایجنٹس اور اسپیچ-فرسٹ تجربات بنانے کے لیے بنیادی طور پر دستیاب آڈیو ماڈل کے طور پر پوزیشنڈ ہے، جو معیار اور رفتار کے درمیان توازن رکھتا ہے۔


اہم خصوصیات

  1. اسپیچ اِن/اسپیچ آؤٹ سپورٹ: بولی گئی ان پٹ کو ہینڈل کریں اور قدرتی وائس فلو کے لیے بولی یا متنی جوابات واپس کریں۔
  2. آڈیو ورک فلوز کے لیے بڑا کانٹیکسٹ: انتہائی بڑا کانٹیکسٹ (دستاویزی 128k ٹوکنز) کی حمایت، جس سے ملٹی ٹرن، طویل گفتگو کی ہسٹری یا بڑے ملٹی موڈل سیشنز ممکن ہوتے ہیں۔
  3. اسٹریمنگ اور Chat Completions مطابقت: Chat Completions کے اندر اسٹریمنگ آڈیو جوابات اور فنکشن-کال ساختہ آؤٹ پٹس کے ساتھ کام کرتا ہے۔
  4. کارکردگی/لیٹنسی میں توازن: اعلیٰ معیار کے آڈیو جوابات فراہم کرنے کے لیے ٹیون کیا گیا ہے جبکہ تھروپٹ درمیانی رکھتا ہے—چیٹ بوٹس اور وائس اسسٹنٹس کے لیے موزوں جہاں معیار اہم ہو۔
  5. ایکوسسٹم اور انٹیگریشنز: پلیٹ فارم کے پلی گراؤنڈز میں سپورٹڈ اور آفیشل ریئل ٹائم/وائس اینڈ پوائنٹس اور پارٹنر انٹیگریشنز میں دستیاب (Azure/Microsoft Foundry نوٹس ملتے جلتے آڈیو ماڈلز کا حوالہ دیتے ہیں)۔

gpt-audio-1.5 بمقابلہ متعلقہ آڈیو ماڈلز

خصوصیتgpt-audio-1.5gpt-realtime-1.5
بنیادی فوکسChat Completions اور گفتگوئی فلو کے لیے اعلیٰ معیار کی آڈیو اِن/آؤٹ۔ریئل ٹائم S2S (speech-to-speech) کم لیٹنسی کے ساتھ لائیو وائس ایجنٹس اور اسٹریمنگ منظرناموں کے لیے۔
کانٹیکسٹ ونڈو128k ٹوکنز۔32k ٹوکنز (ریئل ٹائم ویریئنٹ دستاویزی).
زیادہ سے زیادہ آؤٹ پٹ ٹوکنز16,384 (دستاویزی).عموماً مختصر ریئل ٹائم جوابات کے لیے تشکیل؛ (دستاویزات میں زیادہ سے زیادہ ٹوکنز کم بتائے گئے ہیں).
بہترین استعمالچیٹ بوٹس، وائس-اینیبلڈ اسسٹنٹس جہاں مکمل چیٹ سیمنٹکس + آڈیو درکار ہو۔لائیو وائس ایجنٹس، کیوسکس، اور کم لیٹنسی گفتگوئی انٹرفیسز۔

نمائندہ استعمال کے کیسز

  • کسٹمر سپورٹ اور اندرونی ہیلپ ڈیسکس کے لیے گفتگوئی وائس ایجنٹس۔
  • ایپس، ڈیوائسز اور کیوسکس میں ایمبیڈیڈ وائس-اینیبلڈ اسسٹنٹس۔
  • ہینڈز-فری ورک فلوز (ڈی کے ٹیشن، وائس سرچ، ایکسیسبلٹی)۔
  • ملٹی موڈل تجربات جو Chat Completions کے ذریعے آڈیو کو متن/تصاویر کے ساتھ ملاتے ہیں۔

حدود اور عملی غور و فکر

  • انسانی QA کا فوری متبادل نہیں: پروڈکشن فلو میں اسپیچ آؤٹ پٹس اور ڈاؤن اسٹریم اقدامات کو ہمیشہ انسانی جائزے کے ساتھ توثیق کریں۔
  • وسائل کی منصوبہ بندی: بڑا کانٹیکسٹ اور آڈیو I/O کمپیوٹ اور لیٹنسی بڑھا سکتے ہیں—طویل سیشنز کے لیے اسٹریمنگ/سیگمنٹیشن حکمتِ عملیاں ڈیزائن کریں۔
  • حفاظت اور پالیسی پابندیاں: وائس آؤٹ پٹس اثر انگیز ہو سکتی ہیں؛ بڑے پیمانے پر ڈپلائمنٹ کے وقت پلیٹ فارم حفاظتی رہنما اصولوں اور گائیڈ ریلز کی پیروی کریں۔
  • GPT Audio 1.5 API تک کیسے رسائی حاصل کریں

مرحلہ 1: API Key کے لیے سائن اپ کریں

cometapi.com پر لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں، تو براہِ کرم پہلے رجسٹر کریں۔ اپنے CometAPI console میں سائن ان کریں۔ انٹرفیس کے لیے رسائی اسناد API Key حاصل کریں۔ ذاتی سینٹر میں API token پر “Add Token” پر کلک کریں، ٹوکن key: sk-xxxxx حاصل کریں اور جمع کرائیں۔

cometapi-key

مرحلہ 2: GPT Audio 1.5 API کو درخواست بھیجیں

gpt-audio-1.5” اینڈ پوائنٹ منتخب کریں تاکہ API ریکوئسٹ بھیجی جا سکے اور درخواست کی باڈی سیٹ کریں۔ ریکوئسٹ میتھڈ اور ریکوئسٹ باڈی ہماری ویب سائٹ کی API دستاویز سے حاصل کیے جاتے ہیں۔ ہماری ویب سائٹ آپ کی سہولت کے لیے Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ کے اصل CometAPI key سے تبدیل کریں۔ base url Chat Completions ہے۔

اپنا سوال یا درخواست content فیلڈ میں داخل کریں—اسی پر ماڈل جواب دے گا۔ API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو۔

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

API ریسپانس کو پروسیس کریں تاکہ جنریٹڈ جواب حاصل ہو۔ پروسیسنگ کے بعد، API ٹاسک اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

اکثر پوچھے جانے والے سوالات

مزید ماڈلز