Spécifications techniques de `whisper-1`

Spécification	Détails
ID du modèle	`whisper-1`
Type de modèle	Transcription automatique et traduction de la parole
Cas d’utilisation principaux	Transcription audio, reconnaissance vocale multilingue, traduction de la parole vers l’anglais
Modalité d’entrée	Audio
Modalité de sortie	Texte
Points de terminaison pris en charge	`/v1/audio/transcriptions`, `/v1/audio/translations`
Prise en charge du streaming	Non pris en charge pour `whisper-1`
Prise en charge des invites	Oui, avec un contrôle limité via l’invite pour le formatage, la ponctuation et le style
Capacités linguistiques	Reconnaissance vocale multilingue et identification de la langue
Format d’intégration typique	Téléversement de fichier via des données de formulaire multipart
Formats audio courants	`m4a`, `mp3`, `mp4`, `mpeg`, `mpga`, `wav`, `webm`
Idéal pour	Convertir un contenu parlé en texte lisible ou en traductions anglaises

Qu’est-ce que `whisper-1` ?

whisper-1 est un modèle de reconnaissance vocale disponible via CometAPI pour convertir l’audio en texte et créer des traductions de contenu audio parlé vers l’anglais. Il est conçu pour les développeurs qui ont besoin d’une transcription fiable pour la parole enregistrée, les interviews, les réunions, les notes vocales, les sous-titres et les flux audio multilingues.

Le modèle convient bien aux applications qui nécessitent une reconnaissance automatique de la parole dans plusieurs langues. Il peut transcrire l’audio dans la langue d’origine ou traduire le contenu parlé en anglais, ce qui le rend utile pour des produits globaux, des pipelines de traitement média, des outils de support et des solutions d’accessibilité.

Comme whisper-1 fonctionne sur des fichiers audio téléversés et renvoie une sortie textuelle, il s’intègre naturellement dans l’automatisation backend, l’indexation de contenu, la génération de sous-titres, l’enrichissement pour la recherche et les pipelines d’analytique.

Fonctionnalités principales de `whisper-1`

Transcription de la parole en texte : Convertit l’audio parlé en texte pour les documents, les sous-titres, les archives et les flux applicatifs.
Traduction de la parole : Crée des traductions en anglais à partir d’audio non anglais, simplifiant le traitement multilingue.
Reconnaissance multilingue : Prend en charge la reconnaissance dans de nombreuses langues, pratique pour des déploiements internationaux et interrégionaux.
Formatage assisté par invite : Accepte des invites qui aident à guider la ponctuation, la capitalisation, la terminologie et le style de transcription.
Flux API basé sur des fichiers : Fonctionne avec des fichiers audio téléversés, facile à intégrer dans des traitements par lots, des systèmes médias et des services backend.
Prise en charge de l’identification de la langue : Utile dans des flux où la détection ou la gestion de plusieurs langues parlées est importante.
Particulièrement adapté aux opérations sur le contenu : Pratique pour la génération de sous-titres, la création de transcriptions recherchables, la consignation d’appels clients, le traitement d’interviews et la conversion de notes vocales.

Comment accéder à `whisper-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Pour commencer à utiliser whisper-1, créez d’abord un compte sur CometAPI et générez votre clé API depuis le tableau de bord. Après connexion, accédez à la section de gestion des API, créez une nouvelle clé et stockez-la en toute sécurité. Cette clé sera requise pour authentifier chaque requête envoyée à l’API de whisper-1.

Étape 2 : Envoyez des requêtes à l’API de `whisper-1`

Une fois votre clé API obtenue, vous pouvez envoyer des requêtes vers le point de terminaison CometAPI en utilisant l’ID de modèle whisper-1. Incluez votre clé API dans l’en-tête Authorization et spécifiez whisper-1 comme modèle cible. Pour les flux de parole, envoyez un fichier audio vers le point de terminaison de transcription ou de traduction approprié.

curl --request POST \
  --url https://api.cometapi.com/v1/audio/transcriptions \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Pour les flux de traduction, utilisez le point de terminaison de traduction avec le même ID de modèle :

curl --request POST \
  --url https://api.cometapi.com/v1/audio/translations \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Étape 3 : Récupérez et vérifiez les résultats

Une fois la requête traitée, CometAPI renverra le texte généré pour votre tâche whisper-1. Examinez la réponse pour confirmer la qualité de la transcription, la gestion de la langue, la ponctuation et l’exhaustivité. Si nécessaire, affinez votre prétraitement audio ou votre approche d’invite, puis renvoyez la requête afin d’améliorer la cohérence du résultat pour votre cas d’usage en production.

Spécifications techniques de `whisper-1`

Spécification	Détails
ID du modèle	`whisper-1`
Type de modèle	Transcription automatique et traduction de la parole
Cas d’utilisation principaux	Transcription audio, reconnaissance vocale multilingue, traduction de la parole vers l’anglais
Modalité d’entrée	Audio
Modalité de sortie	Texte
Points de terminaison pris en charge	`/v1/audio/transcriptions`, `/v1/audio/translations`
Prise en charge du streaming	Non pris en charge pour `whisper-1`
Prise en charge des invites	Oui, avec un contrôle limité via l’invite pour le formatage, la ponctuation et le style
Capacités linguistiques	Reconnaissance vocale multilingue et identification de la langue
Format d’intégration typique	Téléversement de fichier via des données de formulaire multipart
Formats audio courants	`m4a`, `mp3`, `mp4`, `mpeg`, `mpga`, `wav`, `webm`
Idéal pour	Convertir un contenu parlé en texte lisible ou en traductions anglaises

Qu’est-ce que `whisper-1` ?

Fonctionnalités principales de `whisper-1`

Transcription de la parole en texte : Convertit l’audio parlé en texte pour les documents, les sous-titres, les archives et les flux applicatifs.
Traduction de la parole : Crée des traductions en anglais à partir d’audio non anglais, simplifiant le traitement multilingue.
Reconnaissance multilingue : Prend en charge la reconnaissance dans de nombreuses langues, pratique pour des déploiements internationaux et interrégionaux.
Formatage assisté par invite : Accepte des invites qui aident à guider la ponctuation, la capitalisation, la terminologie et le style de transcription.
Flux API basé sur des fichiers : Fonctionne avec des fichiers audio téléversés, facile à intégrer dans des traitements par lots, des systèmes médias et des services backend.
Prise en charge de l’identification de la langue : Utile dans des flux où la détection ou la gestion de plusieurs langues parlées est importante.
Particulièrement adapté aux opérations sur le contenu : Pratique pour la génération de sous-titres, la création de transcriptions recherchables, la consignation d’appels clients, le traitement d’interviews et la conversion de notes vocales.

Comment accéder à `whisper-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyez des requêtes à l’API de `whisper-1`

curl --request POST \
  --url https://api.cometapi.com/v1/audio/transcriptions \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Pour les flux de traduction, utilisez le point de terminaison de traduction avec le même ID de modèle :

curl --request POST \
  --url https://api.cometapi.com/v1/audio/translations \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: multipart/form-data" \
  --form "model=whisper-1" \
  --form "file=@/path/to/audio.mp3"

Whisper-1

Spécifications techniques de `whisper-1`

Qu’est-ce que `whisper-1` ?

Fonctionnalités principales de `whisper-1`

Comment accéder à `whisper-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyez des requêtes à l’API de `whisper-1`

Étape 3 : Récupérez et vérifiez les résultats

Tarification pour Whisper-1

Exemple de code et API pour Whisper-1

Whisper-1

Spécifications techniques de `whisper-1`

Qu’est-ce que `whisper-1` ?

Fonctionnalités principales de `whisper-1`

Comment accéder à `whisper-1` et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyez des requêtes à l’API de `whisper-1`

Étape 3 : Récupérez et vérifiez les résultats

Tarification pour Whisper-1

Exemple de code et API pour Whisper-1

Whisper-1

Spécifications techniques de whisper-1

Qu’est-ce que whisper-1 ?

Fonctionnalités principales de whisper-1

Comment accéder à whisper-1 et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyez des requêtes à l’API de whisper-1

Étape 3 : Récupérez et vérifiez les résultats

Tarification pour Whisper-1

Exemple de code et API pour Whisper-1

Whisper-1

Spécifications techniques de whisper-1

Qu’est-ce que whisper-1 ?

Fonctionnalités principales de whisper-1

Comment accéder à whisper-1 et l’intégrer

Étape 1 : Inscrivez-vous pour obtenir une clé API

Étape 2 : Envoyez des requêtes à l’API de whisper-1

Étape 3 : Récupérez et vérifiez les résultats

Tarification pour Whisper-1

Exemple de code et API pour Whisper-1

Spécifications techniques de `whisper-1`

Qu’est-ce que `whisper-1` ?

Fonctionnalités principales de `whisper-1`

Comment accéder à `whisper-1` et l’intégrer

Étape 2 : Envoyez des requêtes à l’API de `whisper-1`

Spécifications techniques de `whisper-1`

Qu’est-ce que `whisper-1` ?

Fonctionnalités principales de `whisper-1`

Comment accéder à `whisper-1` et l’intégrer

Étape 2 : Envoyez des requêtes à l’API de `whisper-1`