Especificaciones técnicas de `tts-1-1106`

Atributo	Detalles
ID del modelo	`tts-1-1106`
Familia del proveedor	Familia de modelos de texto a voz de OpenAI
Capacidad principal	Convierte la entrada de texto en audio hablado de sonido natural
Endpoint típico	`/v1/audio/speech`
Enfoque de optimización	Generación de voz de baja latencia orientada al tiempo real
Modalidad de entrada	Texto
Modalidad de salida	Audio
Formatos de salida admitidos	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`
Compatibilidad con voces	Compatible con las voces TTS integradas de OpenAI; la familia `tts-1` / `tts-1-hd` admite un subconjunto más reducido que incluye `alloy`, `ash`, `coral`, `echo`, `fable`, `nova`, `onyx`, `sage` y `shimmer`
Longitud máxima de entrada	4096 caracteres por solicitud
Referencia de precios	OpenAI indica un precio de $15.00 por 1M de caracteres para la generación de voz TTS
Nota de cumplimiento	Se debe informar claramente a los usuarios finales cuando la voz que escuchan es generada por IA

¿Qué es `tts-1-1106`?

tts-1-1106 es el identificador de plataforma de CometAPI para un modelo de texto a voz de OpenAI de la familia tts-1, diseñado para transformar texto escrito en audio hablado. OpenAI documenta tts-1 como un modelo optimizado para la velocidad y los casos de uso en tiempo real, lo que lo hace adecuado para aplicaciones interactivas que necesitan una generación de voz rápida en lugar de la máxima calidad de renderizado sin conexión.

En la práctica, esta clase de modelo se utiliza en escenarios como narración, asistentes de voz, funciones de accesibilidad, interfaces conversacionales y reproducción de audio automatizada. Se accede a través del flujo de generación de voz de la API de Audio, donde los desarrolladores proporcionan texto, seleccionan una voz compatible y reciben audio en el formato de salida elegido.

Dado que el sufijo exacto -1106 parece ser un identificador del lado de la plataforma y no un alias público de modelo de OpenAI, la interpretación más segura es que tts-1-1106 se corresponde con el comportamiento y el patrón de integración de la familia de generación tts-1 de OpenAI. Esto significa que los desarrolladores deben esperar un modelo TTS rápido centrado en una síntesis receptiva, el uso del endpoint estándar de voz y la selección de voces integradas.

Características principales de `tts-1-1106`

Generación de voz orientada al tiempo real: La familia subyacente tts-1 está optimizada para la velocidad, lo que la hace muy adecuada para aplicaciones en vivo, asistentes y otras experiencias de audio sensibles a la latencia.
Conversión de texto a audio de sonido natural: Convierte texto plano en una salida hablada realista para reproducción, narración y funcionalidades con voz en productos.
Múltiples formatos de salida: Los desarrolladores pueden solicitar audio en mp3, opus, aac, flac, wav o pcm sin procesar, lo que admite tanto la reproducción de consumo como la integración de sistemas de menor latencia.
Opciones de voces integradas: La familia de modelos admite un conjunto de voces preestablecidas, lo que permite a los equipos elegir un estilo de locución que se ajuste al tono de su producto sin entrenar un modelo de locutor personalizado.
Integración de API sencilla: El modelo está diseñado para funcionar a través del endpoint estándar de voz, lo que reduce la complejidad de implementación para equipos que ya usan API de audio compatibles con OpenAI.
Flexibilidad de idiomas: OpenAI indica que su pila TTS generalmente sigue la compatibilidad de idiomas de Whisper, lo que posibilita la generación de voz en muchos idiomas, aunque las voces están optimizadas principalmente para el inglés.
Uso apto para streaming: La API de voz de OpenAI admite la entrega de audio en streaming, lo que permite iniciar la reproducción antes de que se complete el archivo en implementaciones adecuadas.
Práctico para aplicaciones en producción: Con límites de tasa documentados, comportamiento estandarizado del endpoint y directrices de uso sobre la divulgación de voces de IA, la familia de modelos es adecuada para despliegues reales de aplicaciones.

Cómo acceder e integrar `tts-1-1106`

Paso 1: Regístrese para obtener una clave de API

Regístrese en CometAPI y genere su clave de API desde el panel. Almacene la clave de forma segura y configúrela como una variable de entorno en su aplicación para que su backend pueda autenticar solicitudes a la API de tts-1-1106.

Paso 2: Envíe solicitudes a la API de `tts-1-1106`

Envíe una solicitud POST al endpoint de voz compatible con OpenAI a través de CometAPI, configurando model como tts-1-1106 e incluyendo el texto de entrada y cualquier opción admitida como voice y response_format.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-1-1106",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

Paso 3: Recupere y verifique los resultados

Guarde el archivo de audio devuelto o transmita la respuesta directamente en su aplicación, luego verifique que el contenido de la locución, la voz seleccionada, el formato y la calidad de reproducción coincidan con el resultado esperado para tts-1-1106.

Especificaciones técnicas de `tts-1-1106`

Atributo	Detalles
ID del modelo	`tts-1-1106`
Familia del proveedor	Familia de modelos de texto a voz de OpenAI
Capacidad principal	Convierte la entrada de texto en audio hablado de sonido natural
Endpoint típico	`/v1/audio/speech`
Enfoque de optimización	Generación de voz de baja latencia orientada al tiempo real
Modalidad de entrada	Texto
Modalidad de salida	Audio
Formatos de salida admitidos	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`
Compatibilidad con voces	Compatible con las voces TTS integradas de OpenAI; la familia `tts-1` / `tts-1-hd` admite un subconjunto más reducido que incluye `alloy`, `ash`, `coral`, `echo`, `fable`, `nova`, `onyx`, `sage` y `shimmer`
Longitud máxima de entrada	4096 caracteres por solicitud
Referencia de precios	OpenAI indica un precio de $15.00 por 1M de caracteres para la generación de voz TTS
Nota de cumplimiento	Se debe informar claramente a los usuarios finales cuando la voz que escuchan es generada por IA

¿Qué es `tts-1-1106`?

Características principales de `tts-1-1106`

Generación de voz orientada al tiempo real: La familia subyacente tts-1 está optimizada para la velocidad, lo que la hace muy adecuada para aplicaciones en vivo, asistentes y otras experiencias de audio sensibles a la latencia.
Conversión de texto a audio de sonido natural: Convierte texto plano en una salida hablada realista para reproducción, narración y funcionalidades con voz en productos.
Múltiples formatos de salida: Los desarrolladores pueden solicitar audio en mp3, opus, aac, flac, wav o pcm sin procesar, lo que admite tanto la reproducción de consumo como la integración de sistemas de menor latencia.
Opciones de voces integradas: La familia de modelos admite un conjunto de voces preestablecidas, lo que permite a los equipos elegir un estilo de locución que se ajuste al tono de su producto sin entrenar un modelo de locutor personalizado.
Integración de API sencilla: El modelo está diseñado para funcionar a través del endpoint estándar de voz, lo que reduce la complejidad de implementación para equipos que ya usan API de audio compatibles con OpenAI.
Flexibilidad de idiomas: OpenAI indica que su pila TTS generalmente sigue la compatibilidad de idiomas de Whisper, lo que posibilita la generación de voz en muchos idiomas, aunque las voces están optimizadas principalmente para el inglés.
Uso apto para streaming: La API de voz de OpenAI admite la entrega de audio en streaming, lo que permite iniciar la reproducción antes de que se complete el archivo en implementaciones adecuadas.
Práctico para aplicaciones en producción: Con límites de tasa documentados, comportamiento estandarizado del endpoint y directrices de uso sobre la divulgación de voces de IA, la familia de modelos es adecuada para despliegues reales de aplicaciones.

Cómo acceder e integrar `tts-1-1106`

Paso 1: Regístrese para obtener una clave de API

Paso 2: Envíe solicitudes a la API de `tts-1-1106`

curl --request POST \
  --url https://api.cometapi.com/v1/audio/speech \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "tts-1-1106",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1-1106

Especificaciones técnicas de `tts-1-1106`

¿Qué es `tts-1-1106`?

Características principales de `tts-1-1106`

Cómo acceder e integrar `tts-1-1106`

Paso 1: Regístrese para obtener una clave de API

Paso 2: Envíe solicitudes a la API de `tts-1-1106`

Paso 3: Recupere y verifique los resultados

Precios para tts-1-1106

Código de ejemplo y API para tts-1-1106

tts-1-1106

Especificaciones técnicas de `tts-1-1106`

¿Qué es `tts-1-1106`?

Características principales de `tts-1-1106`

Cómo acceder e integrar `tts-1-1106`

Paso 1: Regístrese para obtener una clave de API

Paso 2: Envíe solicitudes a la API de `tts-1-1106`

Paso 3: Recupere y verifique los resultados

Precios para tts-1-1106

Código de ejemplo y API para tts-1-1106

tts-1-1106

Especificaciones técnicas de tts-1-1106

¿Qué es tts-1-1106?

Características principales de tts-1-1106

Cómo acceder e integrar tts-1-1106

Paso 1: Regístrese para obtener una clave de API

Paso 2: Envíe solicitudes a la API de tts-1-1106

Paso 3: Recupere y verifique los resultados

Precios para tts-1-1106

Código de ejemplo y API para tts-1-1106

tts-1-1106

Especificaciones técnicas de tts-1-1106

¿Qué es tts-1-1106?

Características principales de tts-1-1106

Cómo acceder e integrar tts-1-1106

Paso 1: Regístrese para obtener una clave de API

Paso 2: Envíe solicitudes a la API de tts-1-1106

Paso 3: Recupere y verifique los resultados

Precios para tts-1-1106

Código de ejemplo y API para tts-1-1106

Especificaciones técnicas de `tts-1-1106`

¿Qué es `tts-1-1106`?

Características principales de `tts-1-1106`

Cómo acceder e integrar `tts-1-1106`

Paso 2: Envíe solicitudes a la API de `tts-1-1106`

Especificaciones técnicas de `tts-1-1106`

¿Qué es `tts-1-1106`?

Características principales de `tts-1-1106`

Cómo acceder e integrar `tts-1-1106`

Paso 2: Envíe solicitudes a la API de `tts-1-1106`