โมเดลสนับสนุนองค์กรบล็อก
500+ AI Model API ทั้งหมดในหนึ่ง API เพียงแค่ใน CometAPI
API โมเดล
นักพัฒนา
เริ่มต้นอย่างรวดเร็วเอกสารประกอบแดชบอร์ด API
ทรัพยากร
โมเดล AIบล็อกองค์กรบันทึกการเปลี่ยนแปลงเกี่ยวกับ
2025 CometAPI สงวนลิขสิทธิ์ทั้งหมดนโยบายความเป็นส่วนตัวข้อกำหนดการให้บริการ
Home/Models/OpenAI/TTS
O

TTS

อินพุต:$12/M
เอาต์พุต:$12/M
OpenAI การแปลงข้อความเป็นคำพูด
ใหม่
ใช้งานเชิงพาณิชย์
ภาพรวม
คุณสมบัติ
ราคา
API
เวอร์ชัน

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

คุณสมบัติสำหรับ TTS

สำรวจคุณสมบัติหลักของ TTS ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ TTS

สำรวจราคาที่แข่งขันได้สำหรับ TTS ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า TTS สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$12/M
เอาต์พุต:$12/M
อินพุต:$15/M
เอาต์พุต:$15/M
-20%

โค้ดตัวอย่างและ API สำหรับ TTS

เข้าถึงโค้ดตัวอย่างที่ครอบคลุมและทรัพยากร API สำหรับ TTS เพื่อปรับปรุงกระบวนการผสานรวมของคุณ เอกสารประกอบที่มีรายละเอียดของเราให้คำแนะนำทีละขั้นตอน ช่วยให้คุณใช้ประโยชน์จากศักยภาพเต็มรูปแบบของ TTS ในโครงการของคุณ

รุ่นของ TTS

เหตุผลที่ TTS มีสแนปช็อตหลายตัวอาจรวมถึงปัจจัยที่อาจเกิดขึ้น เช่น ความแปรผันของผลลัพธ์หลังการอัปเดตที่ต้องการสแนปช็อตรุ่นเก่าสำหรับความสม่ำเสมอ การให้ช่วงเวลาเปลี่ยนผ่านสำหรับนักพัฒนาเพื่อการปรับตัวและการย้ายข้อมูล และสแนปช็อตที่แตกต่างกันซึ่งสอดคล้องกับเอนด์พอยต์ระดับโลกหรือระดับภูมิภาคเพื่อเพิ่มประสิทธิภาพประสบการณ์ผู้ใช้ สำหรับความแตกต่างโดยละเอียดระหว่างเวอร์ชัน โปรดอ้างอิงเอกสารทางการ
version
qwen3-tts-flash-2025-11-27
qwen3-tts-flash-realtime-2025-11-27
gpt-4o-mini-tts
tts-1-1106
qwen3-tts-vc-realtime-2026-01-15
qwen3-tts-vd-realtime-2025-12-16
kling_tts
tts-1
tts-1-hd
tts-1-hd-1106
qwen-tts-realtime

โมเดลเพิ่มเติม

O

gpt-realtime-1.5

อินพุต:$3.2/M
เอาต์พุต:$12.8/M
โมเดลเสียงที่ดีที่สุดสำหรับเสียงเข้า, เสียงออก.
O

gpt-audio-1.5

อินพุต:$2/M
เอาต์พุต:$8/M
โมเดลเสียงที่ดีที่สุดสำหรับอินพุตเสียงและเอาต์พุตเสียงด้วย Chat Completions.
O

Whisper-1

อินพุต:$24/M
เอาต์พุต:$24/M
แปลงคำพูดเป็นข้อความ, สร้างคำแปล
K

Kling TTS

ต่อคำขอ:$0.006608
[สังเคราะห์เสียงพูด] เปิดตัวใหม่: แปลงข้อความเป็นเสียงสำหรับออกอากาศแบบออนไลน์ พร้อมฟังก์ชันพรีวิว ● สามารถสร้าง audio_id ได้พร้อมกัน เพื่อใช้กับ Keling API ใดก็ได้.
K

Kling video-to-audio

K

Kling video-to-audio

ต่อคำขอ:$0.03304
Kling แปลงวิดีโอเป็นเสียง
K

Kling text-to-audio

K

Kling text-to-audio

ต่อคำขอ:$0.03304
Kling แปลงข้อความเป็นเสียง

บล็อกที่เกี่ยวข้อง

ChatGPT สามารถแปลงข้อความเป็นเสียงได้หรือไม่? คู่มือปี 2026 ล่าสุดเกี่ยวกับเสียงและโมเดล TTS
Apr 2, 2026

ChatGPT สามารถแปลงข้อความเป็นเสียงได้หรือไม่? คู่มือปี 2026 ล่าสุดเกี่ยวกับเสียงและโมเดล TTS

ChatGPT สามารถแปลงข้อความเป็นคำพูดได้ แต่คำตอบขึ้นอยู่กับว่าคุณหมายถึงอะไร ในแอป ChatGPT ฟีเจอร์ Voice ทำให้ ChatGPT พูดออกเสียงได้ และเพิ่งได้รับการอัปเดตให้ทำตามคำสั่งได้ดีขึ้นและใช้เครื่องมืออย่างการค้นหาบนเว็บได้อย่างมีประสิทธิภาพมากขึ้น สำหรับนักพัฒนา OpenAI ยังมี API สำหรับ Text-to-Speech โดยเฉพาะผ่าน endpoint audio/speech โดยมีโมเดล เช่น gpt-4o-mini-tts, tts-1 และ tts-1-hd OpenAI ระบุว่า TTS snapshot รุ่นล่าสุดของตนให้ค่า word error rate ต่ำลงประมาณ 35% บน Common Voice และ FLEURS เมื่อเทียบกับรุ่นก่อนหน้า