المواصفات التقنية لـ `gpt-4o-mini-audio-preview`

المواصفات	التفاصيل
معرّف النموذج	`gpt-4o-mini-audio-preview`
نوع النموذج	نموذج متعدد الوسائط مضغوط بمعاينة الصوت
الوسائط الأساسية	إدخال/إخراج نصي، إدخال صوتي، إخراج صوتي
نمط الواجهة الأساسي	تفاعلات قائمة على الدردشة بمحتوى رسائل متعدد الوسائط
قدرات الصوت	التعرّف على الكلام، توليد الكلام، محادثات تجمع بين النص والصوت
دعم البث	نعم، مناسب لتدفّقات المحادثة في الوقت الفعلي
استدعاء الأدوات / الدوال	مدعوم للإجراءات المهيكلة ودمج سير العمل
أفضل استخدامات	المساعدات الصوتية، النسخ المتدفق، IVR، سير عمل روبوتات المكالمات، مساعدات صوتية داخل التطبيقات
أسلوب التفاعل	نموذج محادثة يلتزم بالتعليمات مع جولات متعددة الوسائط
نمط التكامل	وصول قائم على واجهة برمجة التطبيقات عبر CometAPI باستخدام معرّف النموذج `gpt-4o-mini-audio-preview`

ما هو `gpt-4o-mini-audio-preview`؟

gpt-4o-mini-audio-preview هو نموذج متعدد الوسائط مضغوط مُصمَّم للمطورين الذين يريدون بناء تجارب صوتية محادثية. يدعم كلًا من إدخال الصوت وإخراج الصوت بالإضافة إلى التفاعلات النصية القياسية، مما يجعله مناسبًا للتطبيقات التي يتحدث فيها المستخدمون بشكل طبيعي ويتوقعون ردودًا منطوقة أو نصية.

يكون هذا النموذج مفيدًا بشكل خاص عندما يحتاج المنتج إلى دمج التعرف الآلي على الكلام وفهم اللغة الطبيعية وتوليد الكلام ضمن حلقة محادثة واحدة. وبدلًا من التعامل مع النسخ، والاستدلال، وتوليد الردود كعناصر منفصلة، يتيح gpt-4o-mini-audio-preview سير عمل موحّدًا للمحادثات الممزوجة بين النص والصوت.

نظرًا لأنه يدعم أيضًا استدعاء الأدوات والدوال، يمكن للنموذج القيام بأكثر من مجرد المحادثة. إذ يمكنه تنفيذ إجراءات مهيكلة مثل البحث عن معلومات الحساب، توجيه طلب دعم العملاء، تحديث السجلات، أو استدعاء منطق الأعمال داخل تطبيق أكبر. وهذا يجعله ملائمًا بقوة لأنظمة الصوت الإنتاجية مثل المساعدات الافتراضية، وكلاء دعم الهاتف، وأنظمة الاستجابة الصوتية التفاعلية، وخطوط النسخ مع التلخيص، ومساعدات المنتجات المُمكّنة بالصوت.

الميزات الرئيسية لـ `gpt-4o-mini-audio-preview`

دعم إدخال الصوت: يستقبل تفاعلات المستخدم المعتمدة على الصوت بحيث تتمكن التطبيقات من معالجة الطلبات المنطوقة بشكل طبيعي.
توليد إخراج صوتي: ينتج ردودًا صوتية للمساعدات، وأتمتة المكالمات، وتجارب الإرشاد المنطوق.
محادثات تجمع بين النص والصوت: يدعم سير عمل تكون بعض جولاته منطوقة وأخرى نصية، وهو أمر مفيد للواجهات الهجينة.
تصميم متعدد الوسائط مضغوط: يوفر قدرات ممكّنة بالصوت ضمن بصمة نموذج أخف مناسبة للتطبيقات السريعة الاستجابة.
استجابات متدفقة: يساعد في تقديم تجارب منخفضة زمن الاستجابة وفي الوقت الفعلي مثل المساعدات الحية وأنظمة النسخ المتدفق.
استدعاء الأدوات/الدوال: يمكّن النموذج من استدعاء أدوات مهيكلة أو وظائف أعمال لمهام تتجاوز المحادثة المفتوحة.
اتباع التعليمات: يلتزم بتوجيهات على مستوى التطبيق للحفاظ على اتساق الردود مع سلوك المنتج ومتطلبات سير العمل.
سير عمل النسخ والتلخيص: مفيد لتحويل التفاعلات المنطوقة إلى مخرجات نصية مهيكلة، وملخّصات، أو إجراءات لاحقة.
جاهزية IVR وروبوتات المكالمات: يلائم سيناريوهات دعم العملاء والاتصالات حيث يكون التفاعل المنطوق وتوجيه المهام محوريين.
مساعدة صوتية داخل التطبيق: يمكن تضمينه في منتجات برمجية تحتاج إلى مساعدة مُمكّنة بالصوت، أو إرشاد البدء، أو إجراءات موجهة.

كيفية الوصول ودمج `gpt-4o-mini-audio-preview`

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

لبدء استخدام gpt-4o-mini-audio-preview، أنشئ حسابًا أولًا على CometAPI وولّد مفتاح واجهة برمجة التطبيقات الخاص بك من لوحة التحكم. يُستخدم هذا المفتاح لمصادقة كل طلب وربط تطبيقك بالنموذج بأمان.

الخطوة 2: إرسال الطلبات إلى واجهة `gpt-4o-mini-audio-preview`

استخدم نقطة النهاية المتوافقة مع OpenAI الخاصة بـ CometAPI مع دعم إدخال/إخراج الصوت.

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini-audio-preview",
    "modalities": ["text", "audio"],
    "audio": {
      "voice": "alloy",
      "format": "wav"
    },
    "messages": [
      {
        "role": "user",
        "content": "Tell me a short joke."
      }
    ]
  }'

الخطوة 3: استرجاع النتائج والتحقق منها

تعيد الواجهة استجابة إكمال محادثة قياسية مع حقل إضافي audio يحتوي على إخراج صوتي مُشفّر بصيغة base64. قم بفك ترميز البيانات الصوتية وتحقق من الجودة قبل الاستخدام في الإنتاج.

المواصفات التقنية لـ `gpt-4o-mini-audio-preview`

المواصفات	التفاصيل
معرّف النموذج	`gpt-4o-mini-audio-preview`
نوع النموذج	نموذج متعدد الوسائط مضغوط بمعاينة الصوت
الوسائط الأساسية	إدخال/إخراج نصي، إدخال صوتي، إخراج صوتي
نمط الواجهة الأساسي	تفاعلات قائمة على الدردشة بمحتوى رسائل متعدد الوسائط
قدرات الصوت	التعرّف على الكلام، توليد الكلام، محادثات تجمع بين النص والصوت
دعم البث	نعم، مناسب لتدفّقات المحادثة في الوقت الفعلي
استدعاء الأدوات / الدوال	مدعوم للإجراءات المهيكلة ودمج سير العمل
أفضل استخدامات	المساعدات الصوتية، النسخ المتدفق، IVR، سير عمل روبوتات المكالمات، مساعدات صوتية داخل التطبيقات
أسلوب التفاعل	نموذج محادثة يلتزم بالتعليمات مع جولات متعددة الوسائط
نمط التكامل	وصول قائم على واجهة برمجة التطبيقات عبر CometAPI باستخدام معرّف النموذج `gpt-4o-mini-audio-preview`

ما هو `gpt-4o-mini-audio-preview`؟

الميزات الرئيسية لـ `gpt-4o-mini-audio-preview`

دعم إدخال الصوت: يستقبل تفاعلات المستخدم المعتمدة على الصوت بحيث تتمكن التطبيقات من معالجة الطلبات المنطوقة بشكل طبيعي.
توليد إخراج صوتي: ينتج ردودًا صوتية للمساعدات، وأتمتة المكالمات، وتجارب الإرشاد المنطوق.
محادثات تجمع بين النص والصوت: يدعم سير عمل تكون بعض جولاته منطوقة وأخرى نصية، وهو أمر مفيد للواجهات الهجينة.
تصميم متعدد الوسائط مضغوط: يوفر قدرات ممكّنة بالصوت ضمن بصمة نموذج أخف مناسبة للتطبيقات السريعة الاستجابة.
استجابات متدفقة: يساعد في تقديم تجارب منخفضة زمن الاستجابة وفي الوقت الفعلي مثل المساعدات الحية وأنظمة النسخ المتدفق.
استدعاء الأدوات/الدوال: يمكّن النموذج من استدعاء أدوات مهيكلة أو وظائف أعمال لمهام تتجاوز المحادثة المفتوحة.
اتباع التعليمات: يلتزم بتوجيهات على مستوى التطبيق للحفاظ على اتساق الردود مع سلوك المنتج ومتطلبات سير العمل.
سير عمل النسخ والتلخيص: مفيد لتحويل التفاعلات المنطوقة إلى مخرجات نصية مهيكلة، وملخّصات، أو إجراءات لاحقة.
جاهزية IVR وروبوتات المكالمات: يلائم سيناريوهات دعم العملاء والاتصالات حيث يكون التفاعل المنطوق وتوجيه المهام محوريين.
مساعدة صوتية داخل التطبيق: يمكن تضمينه في منتجات برمجية تحتاج إلى مساعدة مُمكّنة بالصوت، أو إرشاد البدء، أو إجراءات موجهة.

كيفية الوصول ودمج `gpt-4o-mini-audio-preview`

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

الخطوة 2: إرسال الطلبات إلى واجهة `gpt-4o-mini-audio-preview`

استخدم نقطة النهاية المتوافقة مع OpenAI الخاصة بـ CometAPI مع دعم إدخال/إخراج الصوت.

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -d '{
    "model": "gpt-4o-mini-audio-preview",
    "modalities": ["text", "audio"],
    "audio": {
      "voice": "alloy",
      "format": "wav"
    },
    "messages": [
      {
        "role": "user",
        "content": "Tell me a short joke."
      }
    ]
  }'

GPT-4o mini Audio Preview

المواصفات التقنية لـ `gpt-4o-mini-audio-preview`

ما هو `gpt-4o-mini-audio-preview`؟

الميزات الرئيسية لـ `gpt-4o-mini-audio-preview`

كيفية الوصول ودمج `gpt-4o-mini-audio-preview`

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

الخطوة 2: إرسال الطلبات إلى واجهة `gpt-4o-mini-audio-preview`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ GPT-4o mini Audio Preview

نموذج الكود وواجهة برمجة التطبيقات لـ GPT-4o mini Audio Preview

إصدارات GPT-4o mini Audio Preview

GPT-4o mini Audio Preview

المواصفات التقنية لـ `gpt-4o-mini-audio-preview`

ما هو `gpt-4o-mini-audio-preview`؟

الميزات الرئيسية لـ `gpt-4o-mini-audio-preview`

كيفية الوصول ودمج `gpt-4o-mini-audio-preview`

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

الخطوة 2: إرسال الطلبات إلى واجهة `gpt-4o-mini-audio-preview`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ GPT-4o mini Audio Preview

نموذج الكود وواجهة برمجة التطبيقات لـ GPT-4o mini Audio Preview

إصدارات GPT-4o mini Audio Preview

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17

version
gpt-4o-mini-audio-preview
gpt-4o-mini-audio-preview-2024-12-17

GPT-4o mini Audio Preview

المواصفات التقنية لـ gpt-4o-mini-audio-preview

ما هو gpt-4o-mini-audio-preview؟

الميزات الرئيسية لـ gpt-4o-mini-audio-preview

كيفية الوصول ودمج gpt-4o-mini-audio-preview

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

الخطوة 2: إرسال الطلبات إلى واجهة gpt-4o-mini-audio-preview

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ GPT-4o mini Audio Preview

نموذج الكود وواجهة برمجة التطبيقات لـ GPT-4o mini Audio Preview

إصدارات GPT-4o mini Audio Preview

GPT-4o mini Audio Preview

المواصفات التقنية لـ gpt-4o-mini-audio-preview

ما هو gpt-4o-mini-audio-preview؟

الميزات الرئيسية لـ gpt-4o-mini-audio-preview

كيفية الوصول ودمج gpt-4o-mini-audio-preview

الخطوة 1: التسجيل للحصول على مفتاح واجهة برمجة التطبيقات

الخطوة 2: إرسال الطلبات إلى واجهة gpt-4o-mini-audio-preview

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ GPT-4o mini Audio Preview

نموذج الكود وواجهة برمجة التطبيقات لـ GPT-4o mini Audio Preview

إصدارات GPT-4o mini Audio Preview

المواصفات التقنية لـ `gpt-4o-mini-audio-preview`

ما هو `gpt-4o-mini-audio-preview`؟

الميزات الرئيسية لـ `gpt-4o-mini-audio-preview`

كيفية الوصول ودمج `gpt-4o-mini-audio-preview`

الخطوة 2: إرسال الطلبات إلى واجهة `gpt-4o-mini-audio-preview`

المواصفات التقنية لـ `gpt-4o-mini-audio-preview`

ما هو `gpt-4o-mini-audio-preview`؟

الميزات الرئيسية لـ `gpt-4o-mini-audio-preview`

كيفية الوصول ودمج `gpt-4o-mini-audio-preview`

الخطوة 2: إرسال الطلبات إلى واجهة `gpt-4o-mini-audio-preview`