Mô hìnhHỗ trợDoanh nghiệpBlog
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Tài nguyên
Mô hình AIBlogDoanh nghiệpNhật ký thay đổiGiới thiệu
2025 CometAPI. Bảo lưu mọi quyền.Chính sách Bảo mậtĐiều khoản Dịch vụ
Home/Models/OpenAI/TTS
O

TTS

Đầu vào:$12/M
Đầu ra:$12/M
OpenAI Text-to-Speech
Mới
Sử dụng thương mại
Tổng quan
Tính năng
Giá cả
API
Phiên bản

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

Tính năng cho TTS

Khám phá các tính năng chính của TTS, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho TTS

Khám phá mức giá cạnh tranh cho TTS, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách TTS có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Đầu vào:$12/M
Đầu ra:$12/M
Đầu vào:$15/M
Đầu ra:$15/M
-20%

Mã mẫu và API cho TTS

Truy cập mã mẫu toàn diện và tài nguyên API cho TTS để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của TTS trong các dự án của mình.

Các phiên bản của TTS

Lý do TTS có nhiều snapshot có thể bao gồm các yếu tố tiềm năng như: sự thay đổi đầu ra sau các bản cập nhật cần các snapshot cũ để đảm bảo tính nhất quán, cung cấp cho nhà phát triển thời gian chuyển tiếp để thích ứng và di chuyển, cũng như các snapshot khác nhau tương ứng với các endpoint toàn cầu hoặc khu vực nhằm tối ưu hóa trải nghiệm người dùng. Để biết chi tiết về sự khác biệt giữa các phiên bản, vui lòng tham khảo tài liệu chính thức.
version
kling_tts
tts-1-1106
tts-1-hd-1106
qwen-tts-realtime
qwen3-tts-flash-realtime-2025-11-27
qwen3-tts-vc-realtime-2026-01-15
qwen3-tts-vd-realtime-2025-12-16
tts-1
tts-1-hd
qwen3-tts-flash-2025-11-27
gpt-4o-mini-tts

Thêm mô hình

O

gpt-realtime-1.5

Đầu vào:$3.2/M
Đầu ra:$12.8/M
Mô hình giọng nói tốt nhất cho đầu vào âm thanh, đầu ra âm thanh.
O

gpt-audio-1.5

Đầu vào:$2/M
Đầu ra:$8/M
Mô hình giọng nói tốt nhất cho đầu vào âm thanh, đầu ra âm thanh với Chat Completions.
O

Whisper-1

Đầu vào:$24/M
Đầu ra:$24/M
Chuyển giọng nói thành văn bản, tạo bản dịch
K

Kling TTS

Theo Yêu cầu:$0.006608
[Tổng hợp giọng nói] Mới ra mắt: chuyển văn bản thành âm thanh phát sóng trực tuyến, có chức năng xem trước ● Có thể đồng thời tạo audio_id, dùng được với bất kỳ Keling API nào.
K

Kling video-to-audio

K

Kling video-to-audio

Theo Yêu cầu:$0.03304
Kling chuyển đổi video sang âm thanh
K

Kling text-to-audio

K

Kling text-to-audio

Theo Yêu cầu:$0.03304
Kling chuyển văn bản thành âm thanh

Blog liên quan

ChatGPT có thể chuyển văn bản thành giọng nói không? Hướng dẫn mới nhất năm 2026 về giọng nói và các mô hình TTS
Apr 2, 2026

ChatGPT có thể chuyển văn bản thành giọng nói không? Hướng dẫn mới nhất năm 2026 về giọng nói và các mô hình TTS

ChatGPT có thể chuyển văn bản thành giọng nói, nhưng câu trả lời còn phụ thuộc vào bạn muốn nói cụ thể điều gì. Trong ứng dụng ChatGPT, Voice cho phép ChatGPT nói ra thành tiếng và gần đây đã được cập nhật để làm theo chỉ dẫn tốt hơn và sử dụng các công cụ như tìm kiếm web hiệu quả hơn. Đối với nhà phát triển, OpenAI cũng cung cấp một API chuyên dụng cho chuyển văn bản thành giọng nói thông qua endpoint audio/speech, với các mô hình gồm gpt-4o-mini-tts, tts-1 và tts-1-hd. OpenAI cho biết bản snapshot TTS mới nhất của họ mang lại tỷ lệ lỗi từ thấp hơn khoảng 35% trên Common Voice và FLEURS so với thế hệ trước.