Ce qu’est GLM-4.7

GLM-4.7 est le dernier modèle linguistique à large échelle à base ouverte (open‑foundation) phare de Z.ai / Zhipu AI (nom du modèle glm-4.7). Il est positionné comme un modèle « réfléchi » orienté développeurs, avec des améliorations particulières en codage/exécution de tâches agentiques, raisonnement en plusieurs étapes, invocation d’outils et workflows à long contexte. Cette version met l’accent sur la gestion de grands contextes (jusqu’à 200K de contexte), un maximum de sortie élevé (jusqu’à 128K jetons) et des modes « réfléchis » spécialisés pour les pipelines agentiques.

Principales caractéristiques

Améliorations agentiques / usage d’outils : Modes de réflexion intégrés (« Interleaved Thinking », « Preserved Thinking », contrôle au niveau des tours) permettant au modèle de « réfléchir avant d’agir », de conserver le raisonnement d’un tour à l’autre et d’être plus stable lors des appels d’outils ou de l’exécution de tâches multi‑étapes. Cela vise des workflows d’agent robustes (terminaux, chaînes d’outils, navigation web).
Compétence en codage et terminal : Améliorations significatives sur les benchmarks de codage et les tâches d’automatisation de terminal — les benchmarks du fournisseur montrent des gains nets par rapport à GLM-4.6 sur les métriques SWE-bench et Terminal Bench. Cela se traduit par une meilleure génération de code multi‑tours, un enchaînement des commandes et une reprise plus fiable dans des environnements agentiques.
« Vibe coding » / qualité de sortie front‑end : Qualité par défaut de l’UI/de la mise en page améliorée pour le HTML, les diapositives et présentations générés (dispositions plus propres, dimensionnement, meilleurs paramètres visuels par défaut).
Workflows à long contexte : Fenêtre de contexte de 200K jetons et outils pour la mise en cache du contexte ; pratique pour des bases de code multi‑fichiers, des documents longs et des sessions d’agent multi‑tours.

Performances sur benchmarks

Les éditeurs/mainteneurs de GLM‑4.7 et les tableaux de benchmarks de la communauté signalent des gains substantiels par rapport à GLM‑4.6 et des résultats compétitifs face à d’autres modèles contemporains sur les tâches de codage, agentiques et d’utilisation d’outils. Quelques chiffres sélectionnés (source : tableaux officiels publiés par Hugging Face / Z.AI) :

LiveCodeBench-v6 (benchmark d’agent de codage) : 84.9 (SOTA open‑source cité).
SWE-bench Verified (codage) : 73.8% (contre 68.0% pour GLM‑4.6).
SWE-bench Multilingual : 66.7% (+12.9% par rapport à GLM‑4.6).
Terminal Bench 2.0 (actions de terminal agentiques) : 41.0% (amélioration notable de +16.5% par rapport à 4.6).
HLE (raisonnement complexe avec des outils) : 42.8% lorsqu’utilisé avec des outils (forte amélioration signalée par rapport aux versions précédentes).
τ²-Bench (invocation d’outils interactive) : 87.4 (SOTA open‑source rapporté).

Cas d’utilisation typiques et scénarios d’exemple

Assistants de codage agentiques : Génération de code autonome ou semi‑autonome, corrections de code multi‑tours, automatisation de terminal et scripting CI/CD.
Agents pilotés par des outils : Navigation web, orchestration d’API, workflows multi‑étapes (pris en charge par la réflexion préservée et l’appel de fonctions).
Génération front‑end et UI : Génération automatique de l’ossature de sites web, jeux de diapositives, affiches avec une esthétique et une mise en page améliorées.
Recherche et tâches à long contexte : Résumé de documents, synthèse de littérature et génération augmentée par la recherche sur des documents longs (la fenêtre de 200k jetons est utile ici).
Agents éducatifs interactifs / tuteurs de codage : Tutoriel multi‑tours avec un raisonnement préservé qui se souvient des blocs de raisonnement antérieurs au fil de la session.

Comment accéder à et utiliser l’API GLM 4.7

Étape 1 : S’inscrire pour obtenir une clé API

Connectez‑vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez‑vous à votre console CometAPI. Obtenez la clé API d’accès à l’interface. Cliquez sur « Add Token » au niveau du jeton API dans l’espace personnel, récupérez la clé de jeton : sk-xxxxx et soumettez.

Étape 2 : Envoyer des requêtes à l’API MiniMax M2.1

Sélectionnez l’endpoint « glm-4.7 » pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont fournis dans la documentation API de notre site web. Notre site propose également un test Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par la clé CometAPI réelle de votre compte. Où l’appeler : APIs de type Chat.

Insérez votre question ou requête dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.

Étape 3 : Récupérer et vérifier les résultats

Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API répond avec l’état de la tâche et

Tarification pour GLM-4.7

Découvrez des tarifs compétitifs pour GLM-4.7, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment GLM-4.7 peut améliorer vos projets tout en maîtrisant les coûts.

Prix de Comet (USD / M Tokens)	Prix officiel (USD / M Tokens)	Remise
Entrée:$0.96/M Sortie:$3.84/M	Entrée:$1.2/M Sortie:$4.8/M	-20%

Exemple de code et API pour GLM-4.7

Accédez à des exemples de code complets et aux ressources API pour GLM-4.7 afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de GLM-4.7 dans vos projets.

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

# glm-4.7: Zhipu GLM-4.7 model via chat/completions
completion = client.chat.completions.create(
    model="glm-4.7",
    messages=[
        {"role": "user", "content": "Hello! Tell me a short joke."}
    ]
)

print(completion.choices[0].message.content)

Ce qu’est GLM-4.7

Principales caractéristiques

Améliorations agentiques / usage d’outils : Modes de réflexion intégrés (« Interleaved Thinking », « Preserved Thinking », contrôle au niveau des tours) permettant au modèle de « réfléchir avant d’agir », de conserver le raisonnement d’un tour à l’autre et d’être plus stable lors des appels d’outils ou de l’exécution de tâches multi‑étapes. Cela vise des workflows d’agent robustes (terminaux, chaînes d’outils, navigation web).
Compétence en codage et terminal : Améliorations significatives sur les benchmarks de codage et les tâches d’automatisation de terminal — les benchmarks du fournisseur montrent des gains nets par rapport à GLM-4.6 sur les métriques SWE-bench et Terminal Bench. Cela se traduit par une meilleure génération de code multi‑tours, un enchaînement des commandes et une reprise plus fiable dans des environnements agentiques.
« Vibe coding » / qualité de sortie front‑end : Qualité par défaut de l’UI/de la mise en page améliorée pour le HTML, les diapositives et présentations générés (dispositions plus propres, dimensionnement, meilleurs paramètres visuels par défaut).
Workflows à long contexte : Fenêtre de contexte de 200K jetons et outils pour la mise en cache du contexte ; pratique pour des bases de code multi‑fichiers, des documents longs et des sessions d’agent multi‑tours.

Performances sur benchmarks

LiveCodeBench-v6 (benchmark d’agent de codage) : 84.9 (SOTA open‑source cité).
SWE-bench Verified (codage) : 73.8% (contre 68.0% pour GLM‑4.6).
SWE-bench Multilingual : 66.7% (+12.9% par rapport à GLM‑4.6).
Terminal Bench 2.0 (actions de terminal agentiques) : 41.0% (amélioration notable de +16.5% par rapport à 4.6).
HLE (raisonnement complexe avec des outils) : 42.8% lorsqu’utilisé avec des outils (forte amélioration signalée par rapport aux versions précédentes).
τ²-Bench (invocation d’outils interactive) : 87.4 (SOTA open‑source rapporté).

Cas d’utilisation typiques et scénarios d’exemple

Assistants de codage agentiques : Génération de code autonome ou semi‑autonome, corrections de code multi‑tours, automatisation de terminal et scripting CI/CD.
Agents pilotés par des outils : Navigation web, orchestration d’API, workflows multi‑étapes (pris en charge par la réflexion préservée et l’appel de fonctions).
Génération front‑end et UI : Génération automatique de l’ossature de sites web, jeux de diapositives, affiches avec une esthétique et une mise en page améliorées.
Recherche et tâches à long contexte : Résumé de documents, synthèse de littérature et génération augmentée par la recherche sur des documents longs (la fenêtre de 200k jetons est utile ici).
Agents éducatifs interactifs / tuteurs de codage : Tutoriel multi‑tours avec un raisonnement préservé qui se souvient des blocs de raisonnement antérieurs au fil de la session.

Comment accéder à et utiliser l’API GLM 4.7

Étape 1 : S’inscrire pour obtenir une clé API

Étape 2 : Envoyer des requêtes à l’API MiniMax M2.1

Insérez votre question ou requête dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse de l’API pour obtenir la réponse générée.

Étape 3 : Récupérer et vérifier les résultats

Traitez la réponse de l’API pour obtenir la réponse générée. Après traitement, l’API répond avec l’état de la tâche et

GLM-4.7

Plus de modèles

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

Blogs connexes

GLM-5 vs GLM-4.7 : ce qui a changé, ce qui compte et faut-il mettre à niveau ?

Comment utiliser GLM-4.7-Flash en local ?

GLM-4.7 publié : qu’est-ce que cela signifie pour l’intelligence artificielle ?

GLM-4.7

Plus de modèles

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

Blogs connexes

GLM-5 vs GLM-4.7 : ce qui a changé, ce qui compte et faut-il mettre à niveau ?

Comment utiliser GLM-4.7-Flash en local ?

GLM-4.7 publié : qu’est-ce que cela signifie pour l’intelligence artificielle ?