Especificações Técnicas do `whisper-1`

Especificação	Detalhes
ID do modelo	`whisper-1`
Tipo de modelo	Reconhecimento de fala para texto e tradução de fala
Casos de uso principais	Transcrição de áudio, reconhecimento de fala multilíngue, tradução de fala para o inglês
Modalidade de entrada	Áudio
Modalidade de saída	Texto
Endpoints compatíveis	`/v1/audio/transcriptions`, `/v1/audio/translations`
Suporte a streaming	Não suportado para `whisper-1`
Suporte a prompts	Sim, com controle de prompt limitado para formatação, pontuação e estilo
Capacidade de idioma	Reconhecimento de fala multilíngue e identificação de idioma
Formato de integração típico	Upload de arquivo via multipart/form-data
Formatos de áudio comuns	`m4a`, `mp3`, `mp4`, `mpeg`, `mpga`, `wav`, `webm`
Mais adequado para	Converter conteúdo falado em texto legível ou traduções em inglês

O que é o `whisper-1`?

O whisper-1 é um modelo de reconhecimento de fala disponível por meio da CometAPI para transformar áudio em texto e criar traduções de áudio falado para o inglês. Ele foi projetado para desenvolvedores que precisam de transcrição confiável para fala gravada, entrevistas, reuniões, notas de voz, legendas e fluxos de trabalho de áudio multilíngue.

O modelo é bem adequado para aplicativos que necessitam de reconhecimento automático de fala em vários idiomas. Ele pode transcrever áudio no idioma original ou traduzir conteúdo falado para o inglês, tornando-o útil para produtos globais, pipelines de processamento de mídia, ferramentas de suporte e soluções de acessibilidade.

Como o whisper-1 funciona com arquivos de áudio enviados e retorna texto como saída, ele se encaixa naturalmente em automação de backend, indexação de conteúdo, geração de legendas, enriquecimento de busca e pipelines de análise.

Principais recursos do `whisper-1`

Transcrição de fala para texto: Converte áudio falado em texto escrito para documentos, legendas, arquivamento e fluxos de trabalho de aplicativos.
Tradução de fala: Cria traduções em inglês a partir de áudio falado em outros idiomas, simplificando o processamento de conteúdo multilíngue.
Reconhecimento multilíngue: Suporta reconhecimento em muitos idiomas, tornando-o prático para implantações internacionais e entre regiões.
Formatação assistida por prompt: Aceita prompts que podem ajudar a orientar pontuação, capitalização, terminologia e estilo da transcrição.
Fluxo de trabalho de API baseado em arquivos: Funciona bem com arquivos de áudio enviados, facilitando a integração em jobs em lote, sistemas de mídia e serviços de backend.
Suporte à identificação de idioma: Pode ser usado em fluxos de trabalho nos quais detectar ou lidar com vários idiomas falados é importante.
Muito adequado para operações de conteúdo: Útil para geração de legendas, criação de transcrições pesquisáveis, registro de chamadas de clientes, processamento de entrevistas e conversão de notas de voz.

Como acessar e integrar o `whisper-1`

Etapa 1: Cadastre-se para obter uma chave de API

Para começar a usar o whisper-1, primeiro crie uma conta na CometAPI e gere sua chave de API no painel. Após fazer login, vá para a seção de gerenciamento de API, crie uma nova chave e armazene-a com segurança. Essa chave será necessária para autenticar cada solicitação enviada à API do whisper-1.

Etapa 2: Envie solicitações para a API do `whisper-1`

Depois de ter sua chave de API, você pode enviar solicitações ao endpoint da CometAPI usando o ID do modelo whisper-1. Inclua sua chave de API no cabeçalho "Authorization" e especifique whisper-1 como o modelo de destino. Para fluxos de fala, envie um arquivo de áudio para o endpoint apropriado de transcrição ou tradução.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/transcriptions \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Para fluxos de tradução, use o endpoint de tradução com o mesmo ID do modelo:

curl --request POST \
  --url https://api.cometapi.com/v1/audio/translations \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Etapa 3: Recupere e verifique os resultados

Depois que a solicitação for processada, a CometAPI retornará o resultado de texto gerado para sua tarefa do whisper-1. Revise a resposta para confirmar a qualidade da transcrição, o tratamento de idiomas, a pontuação e a completude. Se necessário, refine seu pré-processamento de áudio ou a abordagem de prompts e reenvie a solicitação para melhorar a consistência da saída no seu caso de uso em produção.

Especificações Técnicas do `whisper-1`

Especificação	Detalhes
ID do modelo	`whisper-1`
Tipo de modelo	Reconhecimento de fala para texto e tradução de fala
Casos de uso principais	Transcrição de áudio, reconhecimento de fala multilíngue, tradução de fala para o inglês
Modalidade de entrada	Áudio
Modalidade de saída	Texto
Endpoints compatíveis	`/v1/audio/transcriptions`, `/v1/audio/translations`
Suporte a streaming	Não suportado para `whisper-1`
Suporte a prompts	Sim, com controle de prompt limitado para formatação, pontuação e estilo
Capacidade de idioma	Reconhecimento de fala multilíngue e identificação de idioma
Formato de integração típico	Upload de arquivo via multipart/form-data
Formatos de áudio comuns	`m4a`, `mp3`, `mp4`, `mpeg`, `mpga`, `wav`, `webm`
Mais adequado para	Converter conteúdo falado em texto legível ou traduções em inglês

O que é o `whisper-1`?

Principais recursos do `whisper-1`

Transcrição de fala para texto: Converte áudio falado em texto escrito para documentos, legendas, arquivamento e fluxos de trabalho de aplicativos.
Tradução de fala: Cria traduções em inglês a partir de áudio falado em outros idiomas, simplificando o processamento de conteúdo multilíngue.
Reconhecimento multilíngue: Suporta reconhecimento em muitos idiomas, tornando-o prático para implantações internacionais e entre regiões.
Formatação assistida por prompt: Aceita prompts que podem ajudar a orientar pontuação, capitalização, terminologia e estilo da transcrição.
Fluxo de trabalho de API baseado em arquivos: Funciona bem com arquivos de áudio enviados, facilitando a integração em jobs em lote, sistemas de mídia e serviços de backend.
Suporte à identificação de idioma: Pode ser usado em fluxos de trabalho nos quais detectar ou lidar com vários idiomas falados é importante.
Muito adequado para operações de conteúdo: Útil para geração de legendas, criação de transcrições pesquisáveis, registro de chamadas de clientes, processamento de entrevistas e conversão de notas de voz.

Como acessar e integrar o `whisper-1`

Etapa 1: Cadastre-se para obter uma chave de API

Etapa 2: Envie solicitações para a API do `whisper-1`

curl --request POST \
  --url https://api.cometapi.com/v1/audio/transcriptions \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Para fluxos de tradução, use o endpoint de tradução com o mesmo ID do modelo:

curl --request POST \
  --url https://api.cometapi.com/v1/audio/translations \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Whisper-1

Especificações Técnicas do `whisper-1`

O que é o `whisper-1`?

Principais recursos do `whisper-1`

Como acessar e integrar o `whisper-1`

Etapa 1: Cadastre-se para obter uma chave de API

Etapa 2: Envie solicitações para a API do `whisper-1`

Etapa 3: Recupere e verifique os resultados

Preços para Whisper-1

Código de exemplo e API para Whisper-1

Whisper-1

Especificações Técnicas do `whisper-1`

O que é o `whisper-1`?

Principais recursos do `whisper-1`

Como acessar e integrar o `whisper-1`

Etapa 1: Cadastre-se para obter uma chave de API

Etapa 2: Envie solicitações para a API do `whisper-1`

Etapa 3: Recupere e verifique os resultados

Preços para Whisper-1

Código de exemplo e API para Whisper-1

Whisper-1

Especificações Técnicas do whisper-1

O que é o whisper-1?

Principais recursos do whisper-1

Como acessar e integrar o whisper-1

Etapa 1: Cadastre-se para obter uma chave de API

Etapa 2: Envie solicitações para a API do whisper-1

Etapa 3: Recupere e verifique os resultados

Preços para Whisper-1

Código de exemplo e API para Whisper-1

Whisper-1

Especificações Técnicas do whisper-1

O que é o whisper-1?

Principais recursos do whisper-1

Como acessar e integrar o whisper-1

Etapa 1: Cadastre-se para obter uma chave de API

Etapa 2: Envie solicitações para a API do whisper-1

Etapa 3: Recupere e verifique os resultados

Preços para Whisper-1

Código de exemplo e API para Whisper-1

Especificações Técnicas do `whisper-1`

O que é o `whisper-1`?

Principais recursos do `whisper-1`

Como acessar e integrar o `whisper-1`

Etapa 2: Envie solicitações para a API do `whisper-1`

Especificações Técnicas do `whisper-1`

O que é o `whisper-1`?

Principais recursos do `whisper-1`

Como acessar e integrar o `whisper-1`

Etapa 2: Envie solicitações para a API do `whisper-1`