ModelosSoporteEmpresaBlog
500+ API de Modelos de IA, Todo en Una API. Solo en CometAPI
API de Modelos
Desarrollador
Inicio RápidoDocumentaciónPanel de API
Recursos
Modelos de IABlogEmpresaRegistro de cambiosAcerca de
2025 CometAPI. Todos los derechos reservados.Política de PrivacidadTérminos de Servicio
Home/Models/OpenAI/TTS
O

TTS

Entrada:$12/M
Salida:$12/M
Texto a voz de OpenAI
Nuevo
Uso comercial
Resumen
Características
Precios
API
Versiones

Technical Specifications of tts

AttributeDetails
Model Nametts
ProviderOpenAI
CategoryText-to-Speech
InputText
OutputAudio
Context WindowN/A
Typical Use CasesVoice generation, narration, accessibility, audio content creation
PricingRefer to CometAPI pricing for tts

What is tts?

tts is CometAPI’s platform identifier for OpenAI Text-to-Speech. It enables developers to convert written text into natural-sounding audio for applications such as assistants, audiobooks, customer support tools, accessibility features, and media workflows.

Through CometAPI, tts can be accessed using a unified API format, making it easier to integrate speech synthesis into products without managing multiple provider-specific interfaces. It is suited for teams that want reliable text-to-audio generation in a straightforward API workflow.

Main features of tts

  • Natural speech generation: Converts input text into clear, human-like spoken audio suitable for many application scenarios.
  • Unified API access: Available through CometAPI’s standardized interface, simplifying integration and provider management.
  • Developer-friendly workflow: Designed for quick implementation in apps, services, and backend pipelines that need speech output.
  • Broad application fit: Useful for accessibility tools, virtual assistants, content narration, training materials, and interactive experiences.
  • Scalable deployment: Can be used in prototypes as well as production systems that require consistent text-to-speech generation.

How to access and integrate tts

Step 1: Sign Up for API Key

First, sign up for a CometAPI account and obtain your API key. After logging into the dashboard, create or copy your API key and store it securely. This key will be used to authenticate all requests to the tts API.

Step 2: Send Requests to tts API

Use CometAPI’s standard API endpoint and specify the model as tts. Then send your input text in the request body together with any required parameters.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts",
    "input": "Hello! This is a text-to-speech request using CometAPI."
  }'

Step 3: Retrieve and Verify Results

After submitting the request, CometAPI will return the generated audio result or a response containing the audio output details, depending on your integration method. Verify that the response is successful, confirm the audio content matches the input text, and handle any API errors or retries as needed in your application.

Características para TTS

Explora las características clave de TTS, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para TTS

Explora precios competitivos para TTS, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo TTS puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)Precio Oficial (USD / M Tokens)Descuento
Entrada:$12/M
Salida:$12/M
Entrada:$15/M
Salida:$15/M
-20%

Código de ejemplo y API para TTS

Accede a código de muestra completo y recursos de API para TTS para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de TTS en tus proyectos.

Versiones de TTS

La razón por la cual TTS tiene múltiples instantáneas puede incluir factores potenciales como variaciones en la salida tras actualizaciones que requieren instantáneas anteriores para mantener la coherencia, ofrecer a los desarrolladores un período de transición para adaptación y migración, y diferentes instantáneas que corresponden a endpoints globales o regionales para optimizar la experiencia del usuario. Para conocer las diferencias detalladas entre versiones, consulte la documentación oficial.
version
tts-1
qwen-tts-realtime
qwen3-tts-vc-realtime-2026-01-15
qwen3-tts-vd-realtime-2025-12-16
gpt-4o-mini-tts
tts-1-1106
tts-1-hd
tts-1-hd-1106
qwen3-tts-flash-2025-11-27
qwen3-tts-flash-realtime-2025-11-27
kling_tts

Más modelos

O

gpt-realtime-1.5

Entrada:$3.2/M
Salida:$12.8/M
El mejor modelo de voz para audio de entrada y de salida.
O

gpt-audio-1.5

Entrada:$2/M
Salida:$8/M
El mejor modelo de voz para entrada y salida de audio con Chat Completions.
O

Whisper-1

Entrada:$24/M
Salida:$24/M
Transcripción de voz a texto, creación de traducciones
K

Kling TTS

Por Solicitud:$0.006608
[Síntesis de voz] Recién lanzado: texto a voz de calidad de emisión en línea, con función de vista previa ● Puede generar simultáneamente audio_id, utilizable con cualquier Keling API.
K

Kling video-to-audio

K

Kling video-to-audio

Por Solicitud:$0.03304
Kling video-a-audio
K

Kling text-to-audio

K

Kling text-to-audio

Por Solicitud:$0.03304
Kling texto a audio

Blog relacionado

¿Puede ChatGPT convertir texto a voz? La guía más reciente de 2026 sobre voz y modelos de TTS
Apr 2, 2026

¿Puede ChatGPT convertir texto a voz? La guía más reciente de 2026 sobre voz y modelos de TTS

ChatGPT puede convertir texto a voz, pero la respuesta depende de a qué te refieras. En la aplicación de ChatGPT, Voice permite que ChatGPT hable en voz alta y se ha actualizado recientemente para seguir mejor las instrucciones y usar herramientas como la búsqueda web de forma más eficaz. Para desarrolladores, OpenAI también ofrece una API dedicada de texto a voz a través del endpoint audio/speech, con modelos como gpt-4o-mini-tts, tts-1 y tts-1-hd. OpenAI afirma que su instantánea TTS más reciente registró una tasa de error de palabras aproximadamente un 35% menor en Common Voice y FLEURS en comparación con la generación anterior.