المواصفات التقنية لـ `tts-1`

المواصفات	التفاصيل
معرف النموذج	`tts-1`
المزوّد	OpenAI
نوع النموذج	نموذج تحويل النص إلى كلام (TTS) لتحويل إدخال النص إلى صوت منطوق.
التحسين الأساسي	محسّن للسرعة وزمن الاستجابة المنخفض، خصوصاً لإخراج الكلام في الزمن الحقيقي أو شبه الحقيقي.
ملف تعريف الجودة	زمن استجابة أقل من `tts-1-hd`، ولكن بجودة صوت أدنى من إصدار HD.
طريقة الإدخال	نص فقط.
طريقة الإخراج	صوت فقط.
نقطة نهاية واجهة برمجة التطبيقات (API)	نقطة نهاية إنشاء الكلام في واجهة برمجة تطبيقات الصوت من OpenAI: `/v1/audio/speech`.
الحد الأقصى لطول الإدخال	حتى 4096 حرفاً لكل طلب.
صيغ الاستجابة المدعومة	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
التحكم في السرعة	مدعوم من `0.25` إلى `4.0`، مع `1.0` كقيمة افتراضية.
خيارات الأصوات لـ `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
دعم البث	تدعم واجهة برمجة تطبيقات الكلام بث الإخراج الصوتي، لكن بث SSE والتحكم الصوتي المعتمد على التعليمات غير مدعومين لـ `tts-1`.
التسعير	تسعّر OpenAI نموذج `tts-1` بسعر $15 لكل 1M tokens لتوليد الكلام.

ما هو `tts-1`؟

يُعد tts-1 نموذج تحويل النص إلى كلام من OpenAI، صُمّم لتحويل النص المكتوب إلى صوت منطوق طبيعي. ويتموضع كخيار أسرع وأقل زمناً للاستجابة بين نماذج TTS الكلاسيكية من OpenAI، ما يجعله مناسباً للتطبيقات التي تحتاج إلى تركيب كلام سريع أكثر من حاجتها إلى أعلى مستويات الدقة الصوتية.

عادةً ما يستخدم المطوّرون tts-1 عبر نقطة إنشاء الكلام في واجهة برمجة تطبيقات الصوت عند رغبتهم في تحويل نصوص التطبيقات، والمطالبات، والإشعارات، والسرد، أو ردود المساعد إلى ملفات صوتية قابلة للتشغيل. وتصف مستندات OpenAI النموذج بأنه مُحسّن لحالات استخدام تحويل النص إلى كلام في الزمن الحقيقي.

عملياً، يُعد tts-1 مناسباً للتجارب الصوتية الخفيفة، وأنظمة الاستجابة السريعة، والنماذج الأولية التفاعلية، والمنتجات التي تُقدّم سرعة الاستجابة على جودة الصوت الفائقة. وإذا كانت الجودة القصوى هي الأولوية، توجّه OpenAI المستخدمين إلى tts-1-hd، في حين قد تلائم النماذج الأحدث من TTS حالات الاستخدام التعبيرية الأحدث.

الميزات الرئيسية لـ `tts-1`

ذو توليد كلام بزمن استجابة منخفض: تم تحسين tts-1 تحديداً للسرعة، ما يجعله مفيداً للتطبيقات التي تحتاج إلى إخراج صوتي سريع.
تحويل النص إلى كلام طبيعي: يحوّل النموذج النص العادي إلى صوت منطوق مناسب للسرد، وردود المساعد، وواجهات الصوت.
عدة أصوات مدمجة: يدعم tts-1 مجموعة من الأصوات المدمجة بما في ذلك alloy، ash، coral، echo، fable، onyx، nova، sage، وshimmer.
صيغ إخراج صوتية مرنة: يمكن للمطورين طلب الصوت المُولّد بصيغ شائعة مثل MP3، WAV، FLAC، AAC، Opus، وPCM بحسب احتياجات التشغيل أو المعالجة.
سرعة تشغيل قابلة للضبط: تتيح الواجهة التحكم بالسرعة من 0.25x إلى 4.0x، مما يمكّن من سرد أبطأ أو تشغيل أسرع عند الحاجة.
تكامل بسيط قائم على API: يتوفر tts-1 عبر واجهة إنشاء الكلام القياسية، ما يجعل دمجه في تطبيقات الويب، والهواتف المحمولة، أو الخوادم الخلفية أمراً مباشراً.
ملائم للتطبيقات الموجهة للزمن الحقيقي: تصف OpenAI صراحةً tts-1 كنموذج لحالات تحويل النص إلى كلام في الزمن الحقيقي، مما يجعله عملياً للمساعدات، والإشعارات، والأنظمة التفاعلية السريعة.
خيار يوازن بين زمن الاستجابة والجودة: بالمقارنة مع tts-1-hd، يفضّل هذا النموذج سرعة التوليد على الجودة الأعلى، ما يمنح المطورين خياراً واضحاً بين زمن الاستجابة والجودة.

كيفية الوصول إلى `tts-1` ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

للوصول إلى واجهة tts-1، سجّل أولاً في CometAPI وأنشئ مفتاح API من لوحة التحكم. بعد تسجيل الدخول، أنشئ مفتاحاً جديداً، وانسخه بشكل آمن، وخزّنه في متغيرات بيئة تطبيقك. ستستخدم هذا المفتاح لمصادقة جميع الطلبات إلى واجهة tts-1.

الخطوة 2: إرسال طلبات إلى واجهة `tts-1`

بعد حصولك على مفتاح API، أرسل طلب POST إلى نقطة CometAPI الخاصة بـ tts-1 مع حمولة الإدخال. ضمّن مفتاح API في ترويسة Authorization وعيّن tts-1 كالنموذج. يتضمن الطلب النموذجي نص الإدخال إضافةً إلى معلمات TTS مثل الصوت وصيغة الاستجابة.

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

الخطوة 3: استرجاع النتائج والتحقق منها

بعد إرسال طلبك، تُرجِع واجهة tts-1 المحتوى الصوتي المُولَّد إذا نجحت العملية. احفظ الملف المُعاد أو تياره، وتحقّق من أن الصوت يعمل بشكل صحيح، وأكّد أن الصوت المختار والسرعة والصيغة تتطابق مع متطلبات تطبيقك. عند الحاجة، أعد المحاولة مع ضبط المعلمات لتحسين المخرجات النهائية.

المواصفات التقنية لـ `tts-1`

المواصفات	التفاصيل
معرف النموذج	`tts-1`
المزوّد	OpenAI
نوع النموذج	نموذج تحويل النص إلى كلام (TTS) لتحويل إدخال النص إلى صوت منطوق.
التحسين الأساسي	محسّن للسرعة وزمن الاستجابة المنخفض، خصوصاً لإخراج الكلام في الزمن الحقيقي أو شبه الحقيقي.
ملف تعريف الجودة	زمن استجابة أقل من `tts-1-hd`، ولكن بجودة صوت أدنى من إصدار HD.
طريقة الإدخال	نص فقط.
طريقة الإخراج	صوت فقط.
نقطة نهاية واجهة برمجة التطبيقات (API)	نقطة نهاية إنشاء الكلام في واجهة برمجة تطبيقات الصوت من OpenAI: `/v1/audio/speech`.
الحد الأقصى لطول الإدخال	حتى 4096 حرفاً لكل طلب.
صيغ الاستجابة المدعومة	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`.
التحكم في السرعة	مدعوم من `0.25` إلى `4.0`، مع `1.0` كقيمة افتراضية.
خيارات الأصوات لـ `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`.
دعم البث	تدعم واجهة برمجة تطبيقات الكلام بث الإخراج الصوتي، لكن بث SSE والتحكم الصوتي المعتمد على التعليمات غير مدعومين لـ `tts-1`.
التسعير	تسعّر OpenAI نموذج `tts-1` بسعر $15 لكل 1M tokens لتوليد الكلام.

ما هو `tts-1`؟

الميزات الرئيسية لـ `tts-1`

ذو توليد كلام بزمن استجابة منخفض: تم تحسين tts-1 تحديداً للسرعة، ما يجعله مفيداً للتطبيقات التي تحتاج إلى إخراج صوتي سريع.
تحويل النص إلى كلام طبيعي: يحوّل النموذج النص العادي إلى صوت منطوق مناسب للسرد، وردود المساعد، وواجهات الصوت.
عدة أصوات مدمجة: يدعم tts-1 مجموعة من الأصوات المدمجة بما في ذلك alloy، ash، coral، echo، fable، onyx، nova، sage، وshimmer.
صيغ إخراج صوتية مرنة: يمكن للمطورين طلب الصوت المُولّد بصيغ شائعة مثل MP3، WAV، FLAC، AAC، Opus، وPCM بحسب احتياجات التشغيل أو المعالجة.
سرعة تشغيل قابلة للضبط: تتيح الواجهة التحكم بالسرعة من 0.25x إلى 4.0x، مما يمكّن من سرد أبطأ أو تشغيل أسرع عند الحاجة.
تكامل بسيط قائم على API: يتوفر tts-1 عبر واجهة إنشاء الكلام القياسية، ما يجعل دمجه في تطبيقات الويب، والهواتف المحمولة، أو الخوادم الخلفية أمراً مباشراً.
ملائم للتطبيقات الموجهة للزمن الحقيقي: تصف OpenAI صراحةً tts-1 كنموذج لحالات تحويل النص إلى كلام في الزمن الحقيقي، مما يجعله عملياً للمساعدات، والإشعارات، والأنظمة التفاعلية السريعة.
خيار يوازن بين زمن الاستجابة والجودة: بالمقارنة مع tts-1-hd، يفضّل هذا النموذج سرعة التوليد على الجودة الأعلى، ما يمنح المطورين خياراً واضحاً بين زمن الاستجابة والجودة.

كيفية الوصول إلى `tts-1` ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال طلبات إلى واجهة `tts-1`

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

المواصفات التقنية لـ `tts-1`

ما هو `tts-1`؟

الميزات الرئيسية لـ `tts-1`

كيفية الوصول إلى `tts-1` ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال طلبات إلى واجهة `tts-1`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1

tts-1

المواصفات التقنية لـ `tts-1`

ما هو `tts-1`؟

الميزات الرئيسية لـ `tts-1`

كيفية الوصول إلى `tts-1` ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال طلبات إلى واجهة `tts-1`

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1

tts-1

المواصفات التقنية لـ tts-1

ما هو tts-1؟

الميزات الرئيسية لـ tts-1

كيفية الوصول إلى tts-1 ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال طلبات إلى واجهة tts-1

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1

tts-1

المواصفات التقنية لـ tts-1

ما هو tts-1؟

الميزات الرئيسية لـ tts-1

كيفية الوصول إلى tts-1 ودمجه

الخطوة 1: التسجيل للحصول على مفتاح API

الخطوة 2: إرسال طلبات إلى واجهة tts-1

الخطوة 3: استرجاع النتائج والتحقق منها

التسعير لـ tts-1

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1

المواصفات التقنية لـ `tts-1`

ما هو `tts-1`؟

الميزات الرئيسية لـ `tts-1`

كيفية الوصول إلى `tts-1` ودمجه

الخطوة 2: إرسال طلبات إلى واجهة `tts-1`

المواصفات التقنية لـ `tts-1`

ما هو `tts-1`؟

الميزات الرئيسية لـ `tts-1`

كيفية الوصول إلى `tts-1` ودمجه

الخطوة 2: إرسال طلبات إلى واجهة `tts-1`