المواصفات التقنية لـ `tts-1-1106`

السمة	التفاصيل
معرّف النموذج	`tts-1-1106`
عائلة المزوّد	عائلة نماذج التحويل من النص إلى كلام من OpenAI
القدرة الأساسية	يحوّل مدخلات النص إلى صوت منطوق طبيعي
نقطة النهاية النموذجية	`/v1/audio/speech`
تركيز التحسين	توليد كلام بزمن انتقال منخفض وموجّه للاستخدام الفوري
نمط الإدخال	نص
نمط الإخراج	صوت
صيغ الإخراج المدعومة	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`
دعم الأصوات	متوافق مع أصوات TTS المدمجة من OpenAI؛ تدعم عائلة `tts-1` / `tts-1-hd` مجموعة أصغر تشمل `alloy`، `ash`، `coral`، `echo`، `fable`، `nova`، `onyx`، `sage`، و`shimmer`
الحد الأقصى لطول الإدخال	4096 حرفًا لكل طلب
مرجع التسعير	تُدرج OpenAI تسعير توليد الكلام لفئة TTS عند $15.00 لكل 1M حرف
ملاحظة الامتثال	يجب إبلاغ المستخدمين النهائيين بوضوح عندما يكون الصوت الذي يسمعونه مولّدًا بالذكاء الاصطناعي

ما هو `tts-1-1106`؟

tts-1-1106 هو معرّف منصة لدى CometAPI لنموذج تحويل النص إلى كلام من OpenAI ضمن عائلة tts-1، مصمم لتحويل النص المكتوب إلى صوت منطوق. توثّق OpenAI نموذج tts-1 بوصفه محسّنًا للسرعة ولحالات الاستخدام الفورية، ما يجعله مناسبًا للتطبيقات التفاعلية التي تحتاج إلى توليد كلام سريع بدلًا من الحد الأقصى لجودة التصيير دون اتصال.

عمليًا، تُستخدم هذه الفئة من النماذج في سيناريوهات مثل السرد الصوتي، ومساعدات الصوت، وميزات إمكانية الوصول، وواجهات المحادثة، وتشغيل الصوت المؤتمت. يتم الوصول إليه عبر مسار توليد الكلام ضمن واجهة Audio API، حيث يزوّد المطورون النص، ويختارون صوتًا مدعومًا، ويتلقّون الصوت بالصّيغة المطلوبة.

نظرًا لأن اللاحقة الدقيقة -1106 تبدو معرّفًا على جانب المنصة وليس لقبًا عامًا لنموذج من OpenAI، فإن التفسير الأكثر أمانًا هو أن tts-1-1106 يُطابق سلوك ونمط التكامل لعائلة توليد tts-1 من OpenAI. وهذا يعني أن على المطورين توقّع نموذج TTS سريعًا يركّز على توليف سريع الاستجابة، واستخدام نقطة النهاية القياسية للكلام، وخيارات أصوات مدمجة.

الميزات الرئيسية لـ `tts-1-1106`

توليد كلام موجه للاستخدام الفوري: العائلة الأساسية tts-1 محسّنة للسرعة، ما يجعلها ملائمة للتطبيقات الحية والمساعدات وتجارب الصوت الحساسة للكمون.
تحويل النص إلى صوت طبيعي: يحوّل النص العادي إلى مخرجات منطوقة واقعية للتشغيل والسرد وميزات الصوت في المنتجات.
صيغ إخراج متعددة: يمكن للمطورين طلب الصوت بصيغ mp3، opus، aac، flac، wav، أو pcm الخام، ما يدعم كلًا من التشغيل الاستهلاكي والتكامل الأقل كمونًا.
خيارات أصوات مدمجة: تدعم العائلة مجموعة من الأصوات المسبقة، ما يتيح اختيار أسلوب الإلقاء الملائم لطابع المنتج دون تدريب نموذج متحدث مخصص.
تكامل بسيط عبر واجهة البرمجة: صُمّم النموذج للعمل عبر نقطة النهاية القياسية للكلام، ما يقلل تعقيد التنفيذ للفرق التي تستخدم واجهات صوت متوافقة مع OpenAI.
مرونة لغوية: تشير OpenAI إلى أن تكديس TTS لديها يتبع عمومًا دعم اللغات في Whisper، ما يمكّن توليد الكلام بلغات عديدة رغم أن الأصوات مُحسّنة أساسًا للإنجليزية.
ملائم للبث: تدعم واجهة الكلام لدى OpenAI تسليم الصوت المتدفق، ما يسمح ببدء التشغيل قبل اكتمال الملف في التطبيقات المناسبة.
عملي لبيئات الإنتاج: مع حدود معدلات موثقة، وسلوك موحّد لنقاط النهاية، وإرشادات استخدام حول الإفصاح عن الصوت المولّد بالذكاء الاصطناعي، فإن العائلة مناسبة للنشر في التطبيقات الحقيقية.

كيفية الوصول إلى ودمج `tts-1-1106`

الخطوة 1: التسجيل للحصول على مفتاح API

سجّل في CometAPI وأنشئ مفتاح API من لوحة التحكم. خزّن المفتاح بأمان واضبطه كمتغيّر بيئي في تطبيقك حتى تتمكّن الواجهة الخلفية من مصادقة الطلبات إلى واجهة tts-1-1106.

الخطوة 2: إرسال الطلبات إلى واجهة `tts-1-1106`

أرسل طلب POST إلى نقطة نهاية الكلام المتوافقة مع OpenAI عبر CometAPI، مع تعيين model إلى tts-1-1106 وإرفاق نص الإدخال وأي خيارات مدعومة مثل voice وresponse_format.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-1-1106",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

الخطوة 3: استرجاع النتائج والتحقق منها

احفظ ملف الصوت المُعاد أو قم ببث الاستجابة مباشرة داخل تطبيقك، ثم تحقّق من أن محتوى الكلام، والصوت المختار، والصيغة، وجودة التشغيل تتوافق مع المخرجات المتوقعة لـ tts-1-1106.

المواصفات التقنية لـ `tts-1-1106`

السمة	التفاصيل
معرّف النموذج	`tts-1-1106`
عائلة المزوّد	عائلة نماذج التحويل من النص إلى كلام من OpenAI
القدرة الأساسية	يحوّل مدخلات النص إلى صوت منطوق طبيعي
نقطة النهاية النموذجية	`/v1/audio/speech`
تركيز التحسين	توليد كلام بزمن انتقال منخفض وموجّه للاستخدام الفوري
نمط الإدخال	نص
نمط الإخراج	صوت
صيغ الإخراج المدعومة	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`
دعم الأصوات	متوافق مع أصوات TTS المدمجة من OpenAI؛ تدعم عائلة `tts-1` / `tts-1-hd` مجموعة أصغر تشمل `alloy`، `ash`، `coral`، `echo`، `fable`، `nova`، `onyx`، `sage`، و`shimmer`
الحد الأقصى لطول الإدخال	4096 حرفًا لكل طلب
مرجع التسعير	تُدرج OpenAI تسعير توليد الكلام لفئة TTS عند $15.00 لكل 1M حرف
ملاحظة الامتثال	يجب إبلاغ المستخدمين النهائيين بوضوح عندما يكون الصوت الذي يسمعونه مولّدًا بالذكاء الاصطناعي

ما هو `tts-1-1106`؟

الميزات الرئيسية لـ `tts-1-1106`

توليد كلام موجه للاستخدام الفوري: العائلة الأساسية tts-1 محسّنة للسرعة، ما يجعلها ملائمة للتطبيقات الحية والمساعدات وتجارب الصوت الحساسة للكمون.
تحويل النص إلى صوت طبيعي: يحوّل النص العادي إلى مخرجات منطوقة واقعية للتشغيل والسرد وميزات الصوت في المنتجات.
صيغ إخراج متعددة: يمكن للمطورين طلب الصوت بصيغ mp3، opus، aac، flac، wav، أو pcm الخام، ما يدعم كلًا من التشغيل الاستهلاكي والتكامل الأقل كمونًا.
خيارات أصوات مدمجة: تدعم العائلة مجموعة من الأصوات المسبقة، ما يتيح اختيار أسلوب الإلقاء الملائم لطابع المنتج دون تدريب نموذج متحدث مخصص.
تكامل بسيط عبر واجهة البرمجة: صُمّم النموذج للعمل عبر نقطة النهاية القياسية للكلام، ما يقلل تعقيد التنفيذ للفرق التي تستخدم واجهات صوت متوافقة مع OpenAI.
مرونة لغوية: تشير OpenAI إلى أن تكديس TTS لديها يتبع عمومًا دعم اللغات في Whisper، ما يمكّن توليد الكلام بلغات عديدة رغم أن الأصوات مُحسّنة أساسًا للإنجليزية.
ملائم للبث: تدعم واجهة الكلام لدى OpenAI تسليم الصوت المتدفق، ما يسمح ببدء التشغيل قبل اكتمال الملف في التطبيقات المناسبة.
عملي لبيئات الإنتاج: مع حدود معدلات موثقة، وسلوك موحّد لنقاط النهاية، وإرشادات استخدام حول الإفصاح عن الصوت المولّد بالذكاء الاصطناعي، فإن العائلة مناسبة للنشر في التطبيقات الحقيقية.

كيفية الوصول إلى ودمج `tts-1-1106`

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة `tts-1-1106`

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-1-1106",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1-1106

المواصفات التقنية لـ `tts-1-1106`

ما هو `tts-1-1106`؟

الميزات الرئيسية لـ `tts-1-1106`

كيفية الوصول إلى ودمج `tts-1-1106`

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة `tts-1-1106`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1-1106

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1-1106

tts-1-1106

المواصفات التقنية لـ `tts-1-1106`

ما هو `tts-1-1106`؟

الميزات الرئيسية لـ `tts-1-1106`

كيفية الوصول إلى ودمج `tts-1-1106`

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة `tts-1-1106`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1-1106

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1-1106

tts-1-1106

المواصفات التقنية لـ tts-1-1106

ما هو tts-1-1106؟

الميزات الرئيسية لـ tts-1-1106

كيفية الوصول إلى ودمج tts-1-1106

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة tts-1-1106

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1-1106

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1-1106

tts-1-1106

المواصفات التقنية لـ tts-1-1106

ما هو tts-1-1106؟

الميزات الرئيسية لـ tts-1-1106

كيفية الوصول إلى ودمج tts-1-1106

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال الطلبات إلى واجهة tts-1-1106

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1-1106

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1-1106

المواصفات التقنية لـ `tts-1-1106`

ما هو `tts-1-1106`؟

الميزات الرئيسية لـ `tts-1-1106`

كيفية الوصول إلى ودمج `tts-1-1106`

الخطوة 2: إرسال الطلبات إلى واجهة `tts-1-1106`

المواصفات التقنية لـ `tts-1-1106`

ما هو `tts-1-1106`؟

الميزات الرئيسية لـ `tts-1-1106`

كيفية الوصول إلى ودمج `tts-1-1106`

الخطوة 2: إرسال الطلبات إلى واجهة `tts-1-1106`