Especificaciones técnicas de `whisper-1`

Especificación	Detalles
ID del modelo	`whisper-1`
Tipo de modelo	Voz a texto y traducción del habla
Casos de uso principales	Transcripción de audio, reconocimiento de voz multilingüe, traducción del habla al inglés
Modalidad de entrada	Audio
Modalidad de salida	Texto
Endpoints admitidos	`/v1/audio/transcriptions`, `/v1/audio/translations`
Compatibilidad con streaming	No admitido para `whisper-1`
Compatibilidad con prompts	Sí, con control de prompt limitado para el formato, la puntuación y el estilo
Capacidades de idioma	Reconocimiento de voz multilingüe e identificación de idioma
Formato de integración típico	Carga de archivos mediante datos de formulario multiparte
Formatos de audio comunes	`m4a`, `mp3`, `mp4`, `mpeg`, `mpga`, `wav`, `webm`
Ideal para	Convertir contenido hablado en texto legible o traducciones al inglés

¿Qué es `whisper-1`?

whisper-1 es un modelo de reconocimiento de voz disponible a través de CometAPI para convertir audio en texto y crear traducciones del audio hablado al inglés. Está diseñado para desarrolladores que necesitan transcripciones fiables de voz grabada, entrevistas, reuniones, notas de voz, subtítulos y flujos de trabajo de audio multilingües.

El modelo es adecuado para aplicaciones que requieren reconocimiento automático del habla en varios idiomas. Puede transcribir audio en el idioma original o traducir el contenido hablado al inglés, lo que lo hace útil para productos globales, canalizaciones de procesamiento de medios, herramientas de soporte y soluciones de accesibilidad.

Dado que whisper-1 trabaja con archivos de audio cargados y devuelve salida de texto, encaja de forma natural en la automatización de backend, la indexación de contenido, la generación de subtítulos, el enriquecimiento de búsqueda y las canalizaciones de análisis.

Funciones principales de `whisper-1`

Transcripción de voz a texto: Convierte audio hablado en texto escrito para documentos, subtítulos, archivos y flujos de trabajo de aplicaciones.
Traducción del habla: Crea traducciones al inglés en texto a partir de audio hablado en otros idiomas, lo que simplifica el procesamiento de contenido multilingüe.
Reconocimiento multilingüe: Admite reconocimiento en muchos idiomas, lo que lo hace práctico para implementaciones internacionales y entre regiones.
Formateo asistido por prompts: Acepta prompts que pueden ayudar a guiar la puntuación, las mayúsculas, la terminología y el estilo de la transcripción.
Flujo de trabajo de API basado en archivos: Funciona bien con archivos de audio cargados, lo que facilita la integración en trabajos por lotes, sistemas de medios y servicios de backend.
Compatibilidad con identificación de idioma: Puede utilizarse en flujos de trabajo donde es importante detectar o manejar varios idiomas hablados.
Gran encaje para operaciones de contenido: Útil para la generación de subtítulos, creación de transcripciones buscables, registro de llamadas de clientes, procesamiento de entrevistas y conversión de notas de voz.

Cómo acceder e integrar `whisper-1`

Paso 1: Regístrate para obtener una clave de API

Para empezar a usar whisper-1, primero crea una cuenta en CometAPI y genera tu clave de API desde el panel. Tras iniciar sesión, ve a la sección de gestión de API, crea una nueva clave y guárdala de forma segura. Esta clave será necesaria para autenticar cada solicitud que envíes a la API de whisper-1.

Paso 2: Envía solicitudes a la API de `whisper-1`

Una vez que tengas tu clave de API, puedes enviar solicitudes al endpoint de CometAPI usando el ID de modelo whisper-1. Incluye tu clave de API en el encabezado Authorization y especifica whisper-1 como el modelo de destino. Para flujos de voz, envía un archivo de audio al endpoint de transcripción o traducción correspondiente.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/transcriptions \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Para los flujos de traducción, usa el endpoint de traducción con el mismo ID de modelo:

curl --request POST \
  --url https://api.cometapi.com/v1/audio/translations \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Paso 3: Recupera y verifica los resultados

Una vez procesada la solicitud, CometAPI devolverá el texto generado para tu trabajo de whisper-1. Revisa la respuesta para confirmar la calidad de la transcripción, el manejo del idioma, la puntuación y la integridad. Si es necesario, perfecciona tu preprocesamiento de audio o tu enfoque de prompts y vuelve a enviar la solicitud para mejorar la consistencia de los resultados en tu caso de uso en producción.

Especificaciones técnicas de `whisper-1`

Especificación	Detalles
ID del modelo	`whisper-1`
Tipo de modelo	Voz a texto y traducción del habla
Casos de uso principales	Transcripción de audio, reconocimiento de voz multilingüe, traducción del habla al inglés
Modalidad de entrada	Audio
Modalidad de salida	Texto
Endpoints admitidos	`/v1/audio/transcriptions`, `/v1/audio/translations`
Compatibilidad con streaming	No admitido para `whisper-1`
Compatibilidad con prompts	Sí, con control de prompt limitado para el formato, la puntuación y el estilo
Capacidades de idioma	Reconocimiento de voz multilingüe e identificación de idioma
Formato de integración típico	Carga de archivos mediante datos de formulario multiparte
Formatos de audio comunes	`m4a`, `mp3`, `mp4`, `mpeg`, `mpga`, `wav`, `webm`
Ideal para	Convertir contenido hablado en texto legible o traducciones al inglés

¿Qué es `whisper-1`?

Funciones principales de `whisper-1`

Transcripción de voz a texto: Convierte audio hablado en texto escrito para documentos, subtítulos, archivos y flujos de trabajo de aplicaciones.
Traducción del habla: Crea traducciones al inglés en texto a partir de audio hablado en otros idiomas, lo que simplifica el procesamiento de contenido multilingüe.
Reconocimiento multilingüe: Admite reconocimiento en muchos idiomas, lo que lo hace práctico para implementaciones internacionales y entre regiones.
Formateo asistido por prompts: Acepta prompts que pueden ayudar a guiar la puntuación, las mayúsculas, la terminología y el estilo de la transcripción.
Flujo de trabajo de API basado en archivos: Funciona bien con archivos de audio cargados, lo que facilita la integración en trabajos por lotes, sistemas de medios y servicios de backend.
Compatibilidad con identificación de idioma: Puede utilizarse en flujos de trabajo donde es importante detectar o manejar varios idiomas hablados.
Gran encaje para operaciones de contenido: Útil para la generación de subtítulos, creación de transcripciones buscables, registro de llamadas de clientes, procesamiento de entrevistas y conversión de notas de voz.

Cómo acceder e integrar `whisper-1`

Paso 1: Regístrate para obtener una clave de API

Paso 2: Envía solicitudes a la API de `whisper-1`

curl --request POST \
  --url https://api.cometapi.com/v1/audio/transcriptions \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Para los flujos de traducción, usa el endpoint de traducción con el mismo ID de modelo:

curl --request POST \
  --url https://api.cometapi.com/v1/audio/translations \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Whisper-1

Especificaciones técnicas de `whisper-1`

¿Qué es `whisper-1`?

Funciones principales de `whisper-1`

Cómo acceder e integrar `whisper-1`

Paso 1: Regístrate para obtener una clave de API

Paso 2: Envía solicitudes a la API de `whisper-1`

Paso 3: Recupera y verifica los resultados

Precios para Whisper-1

Código de ejemplo y API para Whisper-1

Whisper-1

Especificaciones técnicas de `whisper-1`

¿Qué es `whisper-1`?

Funciones principales de `whisper-1`

Cómo acceder e integrar `whisper-1`

Paso 1: Regístrate para obtener una clave de API

Paso 2: Envía solicitudes a la API de `whisper-1`

Paso 3: Recupera y verifica los resultados

Precios para Whisper-1

Código de ejemplo y API para Whisper-1

Whisper-1

Especificaciones técnicas de whisper-1

¿Qué es whisper-1?

Funciones principales de whisper-1

Cómo acceder e integrar whisper-1

Paso 1: Regístrate para obtener una clave de API

Paso 2: Envía solicitudes a la API de whisper-1

Paso 3: Recupera y verifica los resultados

Precios para Whisper-1

Código de ejemplo y API para Whisper-1

Whisper-1

Especificaciones técnicas de whisper-1

¿Qué es whisper-1?

Funciones principales de whisper-1

Cómo acceder e integrar whisper-1

Paso 1: Regístrate para obtener una clave de API

Paso 2: Envía solicitudes a la API de whisper-1

Paso 3: Recupera y verifica los resultados

Precios para Whisper-1

Código de ejemplo y API para Whisper-1

Especificaciones técnicas de `whisper-1`

¿Qué es `whisper-1`?

Funciones principales de `whisper-1`

Cómo acceder e integrar `whisper-1`

Paso 2: Envía solicitudes a la API de `whisper-1`

Especificaciones técnicas de `whisper-1`

¿Qué es `whisper-1`?

Funciones principales de `whisper-1`

Cómo acceder e integrar `whisper-1`

Paso 2: Envía solicitudes a la API de `whisper-1`