โมเดลสนับสนุนองค์กรบล็อก
500+ AI Model API ทั้งหมดในหนึ่ง API เพียงแค่ใน CometAPI
API โมเดล
นักพัฒนา
เริ่มต้นอย่างรวดเร็วเอกสารประกอบแดชบอร์ด API
ทรัพยากร
โมเดล AIบล็อกองค์กรบันทึกการเปลี่ยนแปลงเกี่ยวกับ
2025 CometAPI สงวนลิขสิทธิ์ทั้งหมดนโยบายความเป็นส่วนตัวข้อกำหนดการให้บริการ
Home/Models/OpenAI/tts-1-1106
O

tts-1-1106

อินพุต:$12/M
เอาต์พุต:$12/M
ใช้งานเชิงพาณิชย์
ภาพรวม
คุณสมบัติ
ราคา
API

Technical Specifications of tts-1-1106

AttributeDetails
Model IDtts-1-1106
Provider familyOpenAI text-to-speech model family
Primary capabilityConverts text input into natural-sounding spoken audio
Typical endpoint/v1/audio/speech
Optimization focusLow-latency, realtime-oriented speech generation
Input modalityText
Output modalityAudio
Supported output formatsmp3, opus, aac, flac, wav, pcm
Voice supportCompatible with OpenAI’s built-in TTS voices; the tts-1 / tts-1-hd family supports a smaller subset including alloy, ash, coral, echo, fable, nova, onyx, sage, and shimmer
Max input length4096 characters per request
Pricing referenceOpenAI lists TTS speech generation pricing at $15.00 per 1M characters for the TTS category
Compliance noteEnd users should be clearly informed when the voice they hear is AI-generated

What is tts-1-1106?

tts-1-1106 is CometAPI’s platform identifier for an OpenAI text-to-speech model in the tts-1 family, designed to transform written text into spoken audio. OpenAI documents tts-1 as a model optimized for speed and realtime use cases, making it suitable for interactive applications that need fast speech generation rather than maximum offline rendering quality.

In practice, this model class is used for scenarios such as narration, voice assistants, accessibility features, conversational interfaces, and automated audio playback. It is accessed through the speech-generation workflow of the Audio API, where developers provide text, select a supported voice, and receive audio in a chosen output format.

Because the exact -1106 suffix appears to be a platform-side identifier rather than the public OpenAI model alias, the safest interpretation is that tts-1-1106 maps to the behavior and integration pattern of OpenAI’s tts-1 generation family. That means developers should expect a fast TTS model focused on responsive synthesis, standard speech endpoint usage, and built-in voice selection.

Main features of tts-1-1106

  • Realtime-oriented speech generation: The underlying tts-1 family is optimized for speed, which makes it well suited for live applications, assistants, and other latency-sensitive audio experiences.
  • Natural-sounding text-to-audio conversion: It converts plain text into lifelike spoken output for playback, narration, and voice-enabled product features.
  • Multiple output formats: Developers can request audio in mp3, opus, aac, flac, wav, or raw pcm, which supports both consumer playback and lower-latency system integration.
  • Built-in voice options: The model family supports a set of preset voices, letting teams choose a delivery style that fits their product tone without training a custom speaker model.
  • Straightforward API integration: The model is designed to work through the standard speech endpoint, reducing implementation complexity for teams already using OpenAI-compatible audio APIs.
  • Language flexibility: OpenAI states its TTS stack generally follows Whisper language support, enabling speech generation across many languages even though voices are primarily optimized for English.
  • Streaming-friendly usage: OpenAI’s speech API supports streamed audio delivery, allowing playback to begin before the full file is finished in suitable implementations.
  • Practical for production apps: With documented rate limits, standardized endpoint behavior, and usage-policy guidance around AI voice disclosure, the model family is suitable for real application deployment.

How to access and integrate tts-1-1106

Step 1: Sign Up for API Key

Sign up on CometAPI and generate your API key from the dashboard. Store the key securely and configure it as an environment variable in your application so your backend can authenticate requests to the tts-1-1106 API.

Step 2: Send Requests to tts-1-1106 API

Send a POST request to the OpenAI-compatible audio speech endpoint through CometAPI, setting model to tts-1-1106 and including the input text plus any supported options such as voice and response_format.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-1-1106",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Step 3: Retrieve and Verify Results

Save the returned audio file or stream the response directly in your application, then verify that the speech content, selected voice, format, and playback quality match your expected output for tts-1-1106.

คุณสมบัติสำหรับ tts-1-1106

สำรวจคุณสมบัติหลักของ tts-1-1106 ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ tts-1-1106

สำรวจราคาที่แข่งขันได้สำหรับ tts-1-1106 ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า tts-1-1106 สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$12/M
เอาต์พุต:$12/M
อินพุต:$15/M
เอาต์พุต:$15/M
-20%

โค้ดตัวอย่างและ API สำหรับ tts-1-1106

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ tts-1-1106 เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ tts-1-1106 ในโครงการของคุณ

โมเดลเพิ่มเติม

G

Nano Banana 2

อินพุต:$0.4/M
เอาต์พุต:$2.4/M
ภาพรวมความสามารถหลัก: ความละเอียด: สูงสุด 4K (4096×4096) เทียบเท่า Pro. ความสม่ำเสมอของภาพอ้างอิง: รองรับภาพอ้างอิงได้สูงสุด 14 ภาพ (วัตถุ 10 รายการ + ตัวละคร 4 ตัว), รักษาความสม่ำเสมอของสไตล์/ตัวละคร. อัตราส่วนภาพแบบสุดโต่ง: เพิ่มอัตราส่วนใหม่ 1:4, 4:1, 1:8, 8:1 เหมาะสำหรับภาพแนวยาว, โปสเตอร์ และแบนเนอร์. การเรนเดอร์ข้อความ: การสร้างข้อความขั้นสูง เหมาะสำหรับอินโฟกราฟิกและเลย์เอาต์โปสเตอร์สำหรับการตลาด. การปรับปรุงการค้นหา: ผสาน Google Search + การค้นหาด้วยภาพ. การยึดโยง: มีกระบวนการคิดในตัว; ทำการให้เหตุผลกับพรอมป์ตที่ซับซ้อนก่อนการสร้าง.
A

Claude Opus 4.6

อินพุต:$4/M
เอาต์พุต:$20/M
Claude Opus 4.6 เป็นโมเดลภาษาขนาดใหญ่ระดับ “Opus” ของ Anthropic เปิดตัวในเดือนกุมภาพันธ์ 2026. ถูกวางตำแหน่งให้เป็นกำลังหลักสำหรับงานเชิงความรู้และเวิร์กโฟลว์การวิจัย — ปรับปรุงการให้เหตุผลในบริบทยาว การวางแผนหลายขั้นตอน การใช้เครื่องมือ (รวมถึงเวิร์กโฟลว์ซอฟต์แวร์เชิงตัวแทน) และงานการใช้คอมพิวเตอร์ เช่น การสร้างสไลด์และสเปรดชีตอัตโนมัติ.
A

Claude Sonnet 4.6

อินพุต:$2.4/M
เอาต์พุต:$12/M
Claude Sonnet 4.6 เป็นโมเดล Sonnet ที่มีความสามารถมากที่สุดเท่าที่เคยมีมา เป็นการอัปเกรดเต็มรูปแบบของทักษะของโมเดล ครอบคลุมการเขียนโค้ด การใช้งานคอมพิวเตอร์ การให้เหตุผลในบริบทยาว การวางแผนของเอเจนต์ งานด้านความรู้ และการออกแบบ Sonnet 4.6 ยังมาพร้อมกับหน้าต่างบริบทขนาด 1M โทเค็นในเวอร์ชันเบต้า
O

GPT-5.4 nano

อินพุต:$0.16/M
เอาต์พุต:$1/M
GPT-5.4 nano ถูกออกแบบมาสำหรับงานที่ความเร็วและต้นทุนมีความสำคัญสูงสุด เช่น การจำแนกประเภท การสกัดข้อมูล การจัดอันดับ และเอเจนต์ย่อย.
O

GPT-5.4 mini

อินพุต:$0.6/M
เอาต์พุต:$3.6/M
GPT-5.4 mini นำจุดแข็งของ GPT-5.4 มาสู่โมเดลที่เร็วกว่าและมีประสิทธิภาพมากขึ้น ซึ่งออกแบบมาสำหรับภาระงานปริมาณมาก
A

Claude Mythos Preview

A

Claude Mythos Preview

เร็วๆ นี้
อินพุต:$60/M
เอาต์พุต:$240/M
Claude Mythos Preview เป็นโมเดลระดับแนวหน้าที่มีความสามารถสูงสุดของเราจนถึงปัจจุบัน และทำคะแนนก้าวกระโดดอย่างชัดเจน บนเบนช์มาร์กการประเมินหลายรายการ เมื่อเทียบกับโมเดลระดับแนวหน้ารุ่นก่อนของเรา Claude Opus 4.6.