النماذجالدعمالمؤسسةمدونة
أكثر من 500 واجهة برمجة تطبيقات لنماذج الذكاء الاصطناعي، الكل في واجهة واحدة. فقط في CometAPI
واجهة برمجة التطبيقات للنماذج
مطور
البدء السريعالتوثيقلوحة تحكم API
الموارد
نماذج الذكاء الاصطناعيمدونةالمؤسسةالسجل التاريخي للتغييراتحول
2025 CometAPI. جميع الحقوق محفوظة.سياسة الخصوصيةشروط الخدمة
Home/Models/OpenAI/tts-1-1106
O

tts-1-1106

مدخل:$12/M
الإخراج:$12/M
الاستخدام التجاري
نظرة عامة
الميزات
التسعير
API

Technical Specifications of tts-1-1106

AttributeDetails
Model IDtts-1-1106
Provider familyOpenAI text-to-speech model family
Primary capabilityConverts text input into natural-sounding spoken audio
Typical endpoint/v1/audio/speech
Optimization focusLow-latency, realtime-oriented speech generation
Input modalityText
Output modalityAudio
Supported output formatsmp3, opus, aac, flac, wav, pcm
Voice supportCompatible with OpenAI’s built-in TTS voices; the tts-1 / tts-1-hd family supports a smaller subset including alloy, ash, coral, echo, fable, nova, onyx, sage, and shimmer
Max input length4096 characters per request
Pricing referenceOpenAI lists TTS speech generation pricing at $15.00 per 1M characters for the TTS category
Compliance noteEnd users should be clearly informed when the voice they hear is AI-generated

What is tts-1-1106?

tts-1-1106 is CometAPI’s platform identifier for an OpenAI text-to-speech model in the tts-1 family, designed to transform written text into spoken audio. OpenAI documents tts-1 as a model optimized for speed and realtime use cases, making it suitable for interactive applications that need fast speech generation rather than maximum offline rendering quality.

In practice, this model class is used for scenarios such as narration, voice assistants, accessibility features, conversational interfaces, and automated audio playback. It is accessed through the speech-generation workflow of the Audio API, where developers provide text, select a supported voice, and receive audio in a chosen output format.

Because the exact -1106 suffix appears to be a platform-side identifier rather than the public OpenAI model alias, the safest interpretation is that tts-1-1106 maps to the behavior and integration pattern of OpenAI’s tts-1 generation family. That means developers should expect a fast TTS model focused on responsive synthesis, standard speech endpoint usage, and built-in voice selection.

Main features of tts-1-1106

  • Realtime-oriented speech generation: The underlying tts-1 family is optimized for speed, which makes it well suited for live applications, assistants, and other latency-sensitive audio experiences.
  • Natural-sounding text-to-audio conversion: It converts plain text into lifelike spoken output for playback, narration, and voice-enabled product features.
  • Multiple output formats: Developers can request audio in mp3, opus, aac, flac, wav, or raw pcm, which supports both consumer playback and lower-latency system integration.
  • Built-in voice options: The model family supports a set of preset voices, letting teams choose a delivery style that fits their product tone without training a custom speaker model.
  • Straightforward API integration: The model is designed to work through the standard speech endpoint, reducing implementation complexity for teams already using OpenAI-compatible audio APIs.
  • Language flexibility: OpenAI states its TTS stack generally follows Whisper language support, enabling speech generation across many languages even though voices are primarily optimized for English.
  • Streaming-friendly usage: OpenAI’s speech API supports streamed audio delivery, allowing playback to begin before the full file is finished in suitable implementations.
  • Practical for production apps: With documented rate limits, standardized endpoint behavior, and usage-policy guidance around AI voice disclosure, the model family is suitable for real application deployment.

How to access and integrate tts-1-1106

Step 1: Sign Up for API Key

Sign up on CometAPI and generate your API key from the dashboard. Store the key securely and configure it as an environment variable in your application so your backend can authenticate requests to the tts-1-1106 API.

Step 2: Send Requests to tts-1-1106 API

Send a POST request to the OpenAI-compatible audio speech endpoint through CometAPI, setting model to tts-1-1106 and including the input text plus any supported options such as voice and response_format.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-1-1106",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Step 3: Retrieve and Verify Results

Save the returned audio file or stream the response directly in your application, then verify that the speech content, selected voice, format, and playback quality match your expected output for tts-1-1106.

الميزات لـ tts-1-1106

استكشف الميزات الرئيسية لـ tts-1-1106، المصممة لتعزيز الأداء وسهولة الاستخدام. اكتشف كيف يمكن لهذه القدرات أن تفيد مشاريعك وتحسن تجربة المستخدم.

التسعير لـ tts-1-1106

استكشف الأسعار التنافسية لـ tts-1-1106، المصمم ليناسب الميزانيات المختلفة واحتياجات الاستخدام المتنوعة. تضمن خططنا المرنة أن تدفع فقط مقابل ما تستخدمه، مما يجعل من السهل التوسع مع نمو متطلباتك. اكتشف كيف يمكن لـ tts-1-1106 تحسين مشاريعك مع الحفاظ على التكاليف قابلة للإدارة.
سعر كوميت (USD / M Tokens)السعر الرسمي (USD / M Tokens)خصم
مدخل:$12/M
الإخراج:$12/M
مدخل:$15/M
الإخراج:$15/M
-20%

نموذج الكود وواجهة برمجة التطبيقات لـ tts-1-1106

احصل على أكواد نماذجية شاملة وموارد API لـ tts-1-1106 لتبسيط عملية التكامل الخاصة بك. توفر وثائقنا التفصيلية إرشادات خطوة بخطوة، مما يساعدك على الاستفادة من الإمكانات الكاملة لـ tts-1-1106 في مشاريعك.

المزيد من النماذج

G

Nano Banana 2

مدخل:$0.4/M
الإخراج:$2.4/M
نظرة عامة على القدرات الأساسية: الدقة: حتى 4K (4096×4096)، على قدم المساواة مع Pro. اتساق الصور المرجعية: حتى 14 صورة مرجعية (10 عناصر + 4 شخصيات)، مع الحفاظ على اتساق الأسلوب/الشخصيات. نسب أبعاد قصوى: تمت إضافة نسب جديدة 1:4، 4:1، 1:8، 8:1، مناسبة للصور الطويلة والملصقات واللافتات. عرض النصوص: توليد نص متقدم، مناسب للرسوم المعلوماتية وتخطيطات الملصقات التسويقية. تعزيز البحث: تكامل Google Search + Image Search. الاستدلال: عملية تفكير مدمجة؛ تُعالَج المطالبات المعقدة بالاستدلال قبل التوليد.
A

Claude Opus 4.6

مدخل:$4/M
الإخراج:$20/M
Claude Opus 4.6 هو نموذج لغة كبير من فئة “Opus” تابع لـ Anthropic، صدر في فبراير 2026. ويُطرح كأداة عمل أساسية لأعمال المعرفة وسير عمل البحث — مع تحسين الاستدلال ضمن سياقات طويلة، والتخطيط متعدد الخطوات، واستخدام الأدوات (بما في ذلك أطر عمل برمجية قائمة على الوكلاء)، ومهام استخدام الحاسوب مثل إنشاء الشرائح وجداول البيانات تلقائيًا.
A

Claude Sonnet 4.6

مدخل:$2.4/M
الإخراج:$12/M
Claude Sonnet 4.6 هو أكثر نماذج Sonnet لدينا كفاءةً حتى الآن. إنه ترقية شاملة لقدرات النموذج في مجالات البرمجة، واستخدام الحاسوب، والاستدلال بسياقات طويلة، وتخطيط الوكلاء، والعمل المعرفي، والتصميم. كما يتميز Sonnet 4.6 بنافذة سياق بسعة 1M رمز في الإصدار التجريبي.
O

GPT-5.4 nano

مدخل:$0.16/M
الإخراج:$1/M
GPT-5.4 nano مصمم للمهام التي تكتسب فيها السرعة والتكلفة أهمية قصوى، مثل التصنيف، واستخراج البيانات، والترتيب، والوكلاء الفرعيين.
O

GPT-5.4 mini

مدخل:$0.6/M
الإخراج:$3.6/M
يقدّم GPT-5.4 mini قدرات GPT-5.4 ضمن نموذج أسرع وأكثر كفاءة مصمم لأحمال عمل كبيرة الحجم.
A

Claude Mythos Preview

A

Claude Mythos Preview

قريبًا
مدخل:$60/M
الإخراج:$240/M
Claude Mythos Preview هو أكثر نماذجنا الحدودية قدرة حتى الآن، ويُظهر قفزة لافتة في النتائج على العديد من معايير التقييم مقارنةً بنموذجنا الحدودي السابق، Claude Opus 4.6.