Composer 2 : Quoi de neuf et comparaison avec Claude Opus 4.6 et GPT-5.4

Composer 2 de Cursor est le tout dernier modèle de codage agentique de l’entreprise, annoncé le 19 mars 2026. Cursor le décrit comme « de niveau de pointe en codage », conçu pour un travail logiciel à faible latence, et disponible directement dans Cursor avec un pool d’utilisation autonome pour les offres individuelles. Le lancement a également introduit une variante plus rapide avec la même intelligence, ainsi qu’une nouvelle structure tarifaire conçue pour rendre le codage agentique plus abordable que de nombreux modèles généraux de pointe.

Composer 2 compte parce qu’il reflète une évolution plus large dans le développement logiciel par IA : la valeur ne réside plus seulement dans l’intelligence brute du modèle, mais dans la combinaison de la vitesse, de la gestion de tâches à long horizon, de l’utilisation d’outils et de l’efficacité des coûts. Le cadrage de Cursor est explicite : le modèle est optimisé pour le codage agentique, peut gérer des tâches difficiles nécessitant des centaines d’actions, et a été entraîné pour préserver le contexte critique tout au long de workflows de longue durée.

What is Composer 2?

A model built for agentic coding, not just text completion

Composer 2 est le modèle de codage interne de Cursor. Composer 2 est spécialisé pour l’intelligence et la vitesse en ingénierie logicielle, entraîné dans le harnais d’agent de Cursor, et destiné à bien fonctionner sur de vraies tâches de codage plutôt que sur du chat générique. C’est important car le codage agentique diffère de la génération de code ordinaire : le modèle doit rechercher dans une base de code, modifier des fichiers, raisonner sur plusieurs étapes, et se remettre des erreurs sans perdre le fil de la tâche. Le billet de Cursor sur l’entraînement à long horizon rend cet objectif de conception très clair.

Dual Model Variants:

Variant	Purpose
Standard	Coût le plus bas
Fast	Vitesse plus élevée (par défaut)

Why Cursor built it

Les billets de recherche de Cursor suggèrent une thèse simple : de meilleurs agents de codage nécessitent à la fois de l’intelligence et une continuation efficace sur de nombreuses étapes. Les observations de son benchmark interne (CursorBench) montrent qu’une meilleure performance sur des tâches de codage réelles difficiles corrèle avec davantage de réflexion et davantage d’exploration de codebase. Composer 2 est donc entraîné non seulement à résoudre des tâches, mais à continuer à les résoudre sur des trajectoires longues qui dépassent la longueur de contexte immédiate du modèle.

How Composer 2 Work?

Continued pretraining is the big upgrade

Les gains de qualité de Composer 2 proviennent de sa « première exécution de préentraînement continu », qui est décrite comme fournissant une base bien plus solide pour l’apprentissage par renforcement. C’est important car cela suggère que le modèle n’est pas simplement une version ajustée de Composer 1.5 ; c’est un meilleur point de départ pour le type de comportement de codage à long horizon que Cursor recherche.

Reinforcement learning on long coding trajectories

Après le préentraînement continu, Cursor entraîne Composer 2 sur des tâches de codage à long horizon via l’apprentissage par renforcement. L’entreprise affirme que Composer 2 peut résoudre des problèmes difficiles nécessitant des centaines d’actions. Concrètement, cela signifie que le modèle est entraîné à persister à travers des boucles multi‑étapes de débogage, de navigation dans le code et de réparation itérative, plutôt qu’à produire une réponse en un seul coup et à s’arrêter là.

Self-summarization is a key research advance

Cursor entraîne Composer pour des horizons plus longs en utilisant « l’auto‑synthèse ». Dans cette configuration, lorsque le modèle atteint un déclencheur de contexte, il fait une pause et résume son propre état de travail, puis continue à partir de ce contexte compressé. Cursor indique que cette technique lui permet de s’entraîner sur des trajectoires bien plus longues que la fenêtre de contexte maximale du modèle et de récompenser les résumés eux‑mêmes comme partie du signal d’entraînement.

Durability

L’avantage pratique est la durabilité. Les longues tâches de codage échouent souvent lorsqu’un agent oublie une décision antérieure ou perd des détails importants dans un espace de travail tentaculaire. L’auto‑synthèse réduit l’erreur de compactage de 50 % tout en utilisant un cinquième des tokens par rapport à une baseline de compactage basée sur des invites optimisées dans ses environnements de test. C’est une affirmation substantielle, car le compactage est l’un des points faibles des systèmes d’agents actuels.

What’s New in Composer 2?

1. Continued Pretraining + RL Scaling

Composer 2 introduit la première chaîne de préentraînement continu à grande échelle de Cursor, créant un modèle de base plus solide pour l’apprentissage par renforcement.

Ensuite, il applique :

Entraînement RL à long horizon
Enchaînement de tâches sur plusieurs étapes
Workflows de codage réels

👉 Résultat : meilleure prise en charge des tâches d’ingénierie complexes, pas seulement des extraits de code.

2. Long-Horizon Task Execution

Contrairement aux modèles antérieurs qui échouent après quelques étapes :

Composer 2 peut réaliser des refactorisations multi‑fichiers
Exécuter des workflows dans le terminal
Maintenir l’état à travers des centaines d’actions

Cela le rapproche d’un véritable comportement d’agent de codage IA.

3. Code-Only Training Strategy

Composer 2 est entraîné uniquement sur des données liées à la programmation.

Pourquoi c’est important :

Factor	General Models	Composer 2
Model size	Large	Smaller
Scope	Broad	Narrow
Efficiency	Lower	Higher
Cost	High	Low

👉 Cela explique l’avantage massif en matière de rapport prix‑performance.

4. Hybrid Foundation (Kimi Base + RL)

Des divulgations récentes ont révélé que Composer 2 a été initialement construit au‑dessus de Kimi K2.5 (Moonshot AI) avec un entraînement par renforcement supplémentaire.

Seulement ~25 % de calcul provenant du modèle de base
La majorité provenant de la pile d’entraînement de Cursor

👉 Cela reflète une nouvelle tendance : ingénierie de modèles hybride + optimisation propriétaire

Performance benchmarks

Model	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
Composer 2	61.3	61.7	73.7
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

Par rapport à Composer 1.5, Composer 2 est environ 38,7 % plus élevé sur CursorBench, 28,8 % plus élevé sur Terminal‑Bench 2.0 et 11,8 % plus élevé sur SWE‑bench Multilingual. Cela ne prouve pas une supériorité universelle sur tous les modèles externes, mais cela montre une nette progression au sein de la lignée des modèles de Cursor.

How Do You Access Composer 2?

Cursor positionne Composer 2 comme partie du workflow agent‑first du produit. Il est disponible dans Cursor lui‑même, et Cursor indique que sur les offres individuelles, l’usage de Composer provient d’un pool d’utilisation autonome avec une généreuse utilisation incluse. Cursor précise aussi que les utilisateurs peuvent essayer Composer 2 dans « l’early alpha » de sa nouvelle interface. Cela signifie que Composer 2 n’est pas seulement une API de modèle ; il est destiné à être utilisé dans le workflow d’agent de Cursor, où l’éditeur, l’agent, le navigateur et les outils de relecture fonctionnent ensemble.

Inside Cursor

Composer 2 est disponible dans Cursor et aussi dans l’early alpha de sa nouvelle interface. Le modèle d’accès pratique est natif au produit plutôt qu’API‑first : les utilisateurs interagissent avec lui dans l’éditeur Cursor et son workflow d’agent. C’est cohérent avec l’orientation plus large de Cursor, où l’entreprise considère l’éditeur comme la surface principale d’interaction avec le modèle.

Usage pools and plan structure

Chaque offre individuelle inclut deux pools d’utilisation qui se réinitialisent à chaque cycle de facturation : Auto + Composer, qui donne une utilisation incluse significativement plus élevée lorsque Auto ou Composer 2 est sélectionné, et un pool API facturé au tarif API du modèle. Cursor indique également que les offres individuelles incluent au moins 20 $ d’utilisation API chaque mois, le montant exact augmentant sur les paliers supérieurs. En pratique, cela signifie que Composer 2 est conçu pour être utilisé fréquemment sans basculer immédiatement chaque requête vers une facturation purement API.

API Price:

$0.50 entrée / $2.50 sortie par 1 M tokens ; variante rapide $1.50 / $7.50

Plan context

Cursor Pro à 20 $ par mois, Pro Plus à 60 $, et Ultra à 200 $, chacun avec différents niveaux d’utilisation incluse. Pour les équipes, Cursor propose également Teams et Enterprise avec des contrôles supplémentaires. C’est important car Composer 2 n’est pas seulement une référence de modèle ; il fait partie d’un ensemble produit plus large qui mélange tarification, pools d’utilisation et contrôles de collaboration.

Composer 2 vs Claude Opus 4.6 vs GPT-5.4: Which one should I choose?

Terminal-Bench 2.0

Composer 2 : Quoi de neuf et comparaison avec Claude Opus 4.6 et GPT-5.4

Model	Score
Composer 2	61.7
Claude Opus 4.6	~58
GPT-5.4	~75

👉 Composer 2 :

Suit GPT‑5.4 en performances de pointe

Surpasse Opus 4.6 dans certaines configurations

Official Pricing

Model	Input ($/M tokens)	Output ($/M tokens)
Composer 2	0.50	2.50
Composer 2 Fast	1.50	7.50
Claude Opus 4.6	5.00	25.00
GPT-5.4	2.50–5.00	15.00–22.50

👉 Composer 2 est :

10× moins cher qu’Opus 4.6
~5–6× moins cher que GPT‑5.4

Why are Claude Opus 4.6 and GPT-5.4 still worthwhile?

Composer 2 est un excellent choix pour les développeurs qui passent la plupart de leur temps dans Cursor, en particulier sur des boucles d’édition de code répétitives, des refactorisations, des modifications multi‑fichiers et des tâches agentiques qui bénéficient de la vitesse et de l’efficacité des coûts, est optimisé autour du code et de l’exécution d’actions à long horizon, avec une tarification nettement plus basse.

Mais Claude Opus 4.6 et GPT‑5.4 apportent chacun des capacités professionnelles plus larges, de grandes fenêtres de contexte et des fonctionnalités d’entreprise plus riches. Si vous devez produire un essai soigné, un tableur, et un workflow d’agent navigateur en une seule fois.

Comparison Table:

Feature	Composer 2	Claude Opus 4.6	GPT-5.4
Focus	Coding only	General AI	General AI
Cost	⭐ Lowest	Very high	Medium
Coding Accuracy	High	Very high	High
Reasoning	Medium	Very high	Very high
Speed	Fast variant available	Moderate	Moderate
Agent Capability	Strong	Strong	Improving
Multimodal	❌	✅	✅
Best Use Case	Dev workflows	Research-grade tasks	General + coding

Best-fit use cases and Access

Si la tâche implique un raisonnement large, du multimodal ou un usage entreprise général, GPT‑5.4 et Claude Opus 4.6 sont deux candidats solides selon leur positionnement officiel et leurs capacités. Si la tâche est le codage quotidien dans Cursor, notamment lorsque le coût et la vitesse d’itération comptent, Composer 2 est l’option plus spécialisée et moins chère. Cursor positionne Composer 2 comme un modèle de codage agentique spécialisé pour Cursor lui‑même. , GPT‑5.4 et Opus 4.6 sont des modèles de pointe généralistes, tandis que Composer 2 est conçu pour la boucle IDE‑agent.

OpenAI positionne GPT-5.4 comme un modèle de pointe pour le travail professionnel complexe, avec prise en charge des outils dans l’API et un raisonnement général solide. Anthropic positionne Claude Opus 4.6 comme son modèle le plus intelligent pour le codage, le raisonnement et le travail agentique, tous désormais disponibles via CometAPI.

L’API de CometAPI est actuellement à –20 %, et elle peut générer directement des playgrounds. Comparée à d’autres solutions, CometAPI est une bien meilleure option ; c’est essentiellement un Cursor qui ne nécessite pas d’abonnement.

Conclusion

Composer 2 n’est pas un simple modèle Cursor incrémental de plus. C’est la tentative de Cursor de réinitialiser le rapport prix‑performance pour les agents de codage : de meilleurs résultats de benchmark que ses prédécesseurs, une conception centrée sur le comportement d’agent à long horizon, et une tarification très inférieure aux grandes alternatives de pointe. Les propres données de Cursor montrent des gains clairs sur Composer 1 et 1.5, tandis que sa tarification sous‑coupe Claude Opus 4.6 par 10× et GPT‑5.4 par 5× sur les tokens d’entrée.

Pour les équipes déjà ancrées dans Cursor, Composer 2 est un choix par défaut convaincant pour de nombreuses tâches de codage. Pour les travaux les plus difficiles, les plus critiques ou les plus larges en portée, Claude Opus 4.6 et GPT‑5.4 restent les références premium auxquelles se comparer. La véritable histoire, c’est que le marché des modèles de codage de pointe devient à la fois plus affûté, moins cher et plus spécialisé.

Si vous cherchez une alternative à Cursor, ou une API de modèle à la pointe et moins chère comme Claude Opus 4.6 et GPT‑5.4, alors CometAPI est le meilleur choix. Ready to go?