ModèlesTarificationEntreprise
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Entreprise
À proposEntreprise
Ressources
Modèles d'IABlogJournal des modificationsSupport
Conditions d'utilisationPolitique de confidentialité
© 2026 CometAPI · All rights reserved
Home/Models/xAI/Grok 4 Fast
X

Grok 4 Fast

Entrée:$0.16/M
Sortie:$0.4/M
Contexte:2M
Sortie maximale:30K
Grok 4 Fast est un nouveau modèle d’intelligence artificielle lancé par xAI, intégrant des capacités d’inférence et de non-inférence dans une architecture unique. Ce modèle dispose d’une fenêtre de contexte de 2 millions de jetons et est conçu pour des applications à haut débit telles que la recherche et le codage. Le modèle propose deux versions : Grok-4-Fast-Reasoning et Grok-4-Fast-Non-Reasoning, optimisées pour différentes tâches.
Nouveau
Usage commercial
Playground
Aperçu
Fonctionnalités
Tarification
API
Versions

Fonctionnalités clés (liste rapide)

  • Deux variantes de modèle : grok-4-fast-reasoning et grok-4-fast-non-reasoning (réglables pour privilégier la profondeur ou la vitesse).
  • Très grande fenêtre de contexte : jusqu’à 2 000 000 tokens, permettant de traiter des documents extrêmement longs / des transcriptions de plusieurs heures / des flux de travail multi-documents.
  • Efficacité en tokens / accent sur les coûts : xAI indique environ 40 % de tokens de réflexion en moins en moyenne par rapport à Grok-4, ainsi qu’une réduction d’environ 98 % du coût pour atteindre les mêmes performances de benchmark (selon les métriques communiquées par xAI).
  • Intégration native des outils / de la navigation : entraîné de bout en bout avec un RL d’utilisation d’outils pour la navigation web/X, l’exécution de code et les comportements de recherche agentique.
  • Multimodal & appel de fonctions : prend en charge les images et les sorties structurées ; l’appel de fonctions et les formats de réponse structurés sont pris en charge dans l’API.

Détails techniques

Architecture de raisonnement unifiée : Grok-4-Fast utilise une base de poids de modèle unique qui peut être orientée vers un comportement de raisonnement (longue chaîne de pensée) ou de non-raisonnement (réponses rapides) via des prompts système ou la sélection de variante, au lieu de proposer deux modèles dorsaux entièrement distincts. Cela réduit la latence de basculement et le coût en tokens pour les charges de travail mixtes.

Apprentissage par renforcement pour la densité d’intelligence : xAI indique utiliser un apprentissage par renforcement à grande échelle axé sur la densité d’intelligence (maximiser les performances par token), ce qui constitue la base des gains annoncés en efficacité de tokens.

Conditionnement aux outils et recherche agentique : Grok-4-Fast a été entraîné et évalué sur des tâches nécessitant l’invocation d’outils (navigation web, recherche X, exécution de code). Le modèle est présenté comme compétent pour choisir quand appeler des outils et comment intégrer les éléments issus de la navigation dans les réponses.

Performances de benchmark

Améliorations dans BrowseComp (44,9 % pass\@1 contre 43,0 % pour Grok-4), SimpleQA (95,0 % contre 94,0 %), ainsi que d’importants gains dans certains domaines chinois de navigation/recherche. xAI signale également une première place dans la Search Arena de LMArena pour une variante grok-4-fast-search.

Cas d’usage typiques et recommandés

  • Recherche et récupération à haut débit — agents de recherche nécessitant un raisonnement web multi-sauts rapide.
  • Assistants et bots agentiques — agents qui combinent navigation, exécution de code et appels d’outils asynchrones (lorsque cela est autorisé).
  • Déploiements de production sensibles aux coûts — services nécessitant de nombreux appels et souhaitant une meilleure efficacité entre tokens consommés et utilité qu’avec un modèle de base plus lourd.
  • Expérimentation pour développeurs — prototypage de flux multimodaux ou enrichis par le web reposant sur des requêtes rapides et répétées.
  • Comment accéder à l’API Grok 4 fast

Étape 1 : S’inscrire pour obtenir une clé API

Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre console CometAPI. Obtenez la clé API d’accès à l’interface. Cliquez sur « Add Token » dans la section API token du centre personnel, obtenez la clé de jeton : sk-xxxxx et validez.

Étape 2 : Envoyer des requêtes à l’API Grok 4 fast

Sélectionnez le point de terminaison « \grok-4-fast-reasoning/ grok-4-fast-non-reasoning\ » pour envoyer la requête API et définissez le corps de la requête. La méthode de requête et le corps de requête sont disponibles dans la documentation API de notre site web. Notre site web fournit également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre clé CometAPI réelle issue de votre compte. L’URL de base est au format Chat(https://api.cometapi.com/v1/chat/completions).

Insérez votre question ou votre demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse API pour obtenir la réponse générée.

Étape 3 : Récupérer et vérifier les résultats

Traitez la réponse API pour obtenir la réponse générée. Après traitement, l’API renvoie le statut de la tâche et les données de sortie.

Fonctionnalités pour Grok 4 Fast

Découvrez les fonctionnalités clés de Grok 4 Fast, conçues pour améliorer les performances et la facilité d'utilisation. Explorez comment ces capacités peuvent bénéficier à vos projets et améliorer l'expérience utilisateur.

Tarification pour Grok 4 Fast

Découvrez des tarifs compétitifs pour Grok 4 Fast, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Grok 4 Fast peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)Prix officiel (USD / M Tokens)Remise
Entrée:$0.16/M
Sortie:$0.4/M
Entrée:$0.2/M
Sortie:$0.5/M
-20%

Exemple de code et API pour Grok 4 Fast

Accédez à des exemples de code complets et aux ressources API pour Grok 4 Fast afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Grok 4 Fast dans vos projets.
POST
/v1/chat/completions

Versions de Grok 4 Fast

La raison pour laquelle Grok 4 Fast dispose de plusieurs instantanés peut inclure des facteurs potentiels tels que des variations de sortie après des mises à jour nécessitant des instantanés plus anciens pour la cohérence, offrant aux développeurs une période de transition pour l'adaptation et la migration, et différents instantanés correspondant à des points de terminaison globaux ou régionaux pour optimiser l'expérience utilisateur. Pour les différences détaillées entre les versions, veuillez consulter la documentation officielle.

Noms publics annoncés par xAI : grok-4-fast-reasoning et grok-4-fast-non-reasoning. Chaque variante indique la même limite de contexte de 2M jetons. La plateforme continue également d’héberger l’ancien modèle phare Grok-4 (p. ex., variantes grok-4-0709 utilisées précédemment).

Plus de modèles

C

Claude Opus 4.7

Entrée:$3/M
Sortie:$15/M
Le modèle le plus intelligent pour les agents et la programmation
A

Claude Sonnet 4.6

Entrée:$2.4/M
Sortie:$12/M
Claude Sonnet 4.6 est notre modèle Sonnet le plus performant à ce jour. Il s’agit d’une mise à niveau complète des capacités du modèle dans la programmation, l’usage de l’ordinateur, le raisonnement sur des contextes étendus, la planification d’agents, le travail intellectuel et la conception. Sonnet 4.6 propose également une fenêtre de contexte de 1M de jetons en bêta.
O

GPT-5.4 nano

Entrée:$0.16/M
Sortie:$1/M
GPT-5.4 nano est conçu pour des tâches où la vitesse et le coût comptent le plus, comme la classification, l’extraction de données, le classement et les sous-agents.
O

GPT-5.4 mini

Entrée:$0.6/M
Sortie:$3.6/M
GPT-5.4 mini apporte les atouts de GPT-5.4 dans un modèle plus rapide et plus efficace, conçu pour des charges de travail à grande échelle.
X

Grok 4.20

Entrée:$1.6/M
Sortie:$4.8/M
La version 4.20 de Grok introduit une architecture multi‑agents (plusieurs agents spécialisés coordonnés en temps réel), des modes de contexte étendus, ainsi que des améliorations ciblées en matière de suivi des instructions, de réduction des hallucinations et de sorties structurées/outillées.
Q

Qwen3.6-Plus

Entrée:$0.32/M
Sortie:$1.92/M
Qwen 3.6-Plus est désormais disponible, avec des capacités de développement de code renforcées et une efficacité accrue en matière de reconnaissance et d’inférence multimodales, améliorant encore l’expérience Vibe Coding.

Blogs connexes

Comment utiliser z-image pour créer du contenu NSFW ? Le meilleur guide dont vous avez besoin
Jan 7, 2026

Comment utiliser z-image pour créer du contenu NSFW ? Le meilleur guide dont vous avez besoin

Tongyi Lab d'Alibaba a officiellement lancé Z-Image, un modèle open source de génération d'images de 6 milliards de paramètres qui fait actuellement sensation dans la communauté de l'IA. Lancé fin 2025, Z-Image a rapidement détrôné les favoris précédents comme Flux et SDXL aux yeux de nombreux utilisateurs locaux.
API rapide Grok 4.1
Nov 19, 2025
grok-4-1-fast
x-ai

API rapide Grok 4.1

Grok 4.1 Fast est le modèle de grande taille de xAI, conçu pour la production et optimisé pour l'appel d'outils automatisé, les flux de travail à contexte long et l'inférence à faible latence. Il s'agit d'une famille multimodale à deux variantes, conçue pour exécuter des agents autonomes capables de rechercher, d'exécuter du code, d'appeler des services et de raisonner sur des contextes extrêmement vastes (jusqu'à 2 millions de jetons).