Composer 2: O que há de novo e comparação com Claude Opus 4.6 e GPT-5.4

O Composer 2 da Cursor é o mais novo modelo de codificação baseada em agentes da empresa, anunciado em 19 de março de 2026. A Cursor o descreve como “nível de fronteira em codificação”, construído para trabalho de software de baixa latência e disponível diretamente dentro do Cursor com um pool de uso independente para planos individuais. O lançamento também apresentou uma variante mais rápida com a mesma inteligência, além de uma nova estrutura de preços projetada para tornar a codificação com agentes mais acessível do que muitos modelos de fronteira de uso geral.

O Composer 2 é importante porque reflete uma mudança mais ampla no desenvolvimento de software com IA: o valor não é mais apenas a inteligência bruta do modelo, mas a combinação de velocidade, tratamento de tarefas de horizonte longo, uso de ferramentas e eficiência de custo. A própria formulação da Cursor é explícita: o modelo é otimizado para codificação com agentes, consegue lidar com tarefas desafiadoras que exigem centenas de ações e foi treinado para preservar o contexto crítico em fluxos de trabalho de longa duração.

O que é o Composer 2?

Um modelo construído para codificação com agentes, não apenas para completar texto

O Composer 2 é o modelo de codificação interno da Cursor. O Composer 2 é especializado em inteligência e velocidade para engenharia de software, treinado no harness de agente da Cursor e destinado a funcionar bem em tarefas reais de codificação, em vez de um chat genérico. Isso importa porque codificação com agentes é diferente de geração de código comum: o modelo deve buscar em uma base de código, editar arquivos, raciocinar em múltiplas etapas e se recuperar de erros sem perder o fio da tarefa. A postagem de treinamento de horizonte longo da Cursor deixa esse objetivo de design muito claro.

Variantes duplas do modelo:

Variante	Finalidade
Padrão	Menor custo
Rápida	Maior velocidade (padrão)

Por que a Cursor o construiu

As publicações de pesquisa da Cursor sugerem uma tese simples: agentes de codificação melhores precisam tanto de inteligência quanto de continuação eficiente ao longo de muitas etapas. As observações do benchmark interno (CursorBench) mostram que um desempenho mais forte em tarefas reais e difíceis de codificação correlaciona com mais “pensamento” e mais exploração da base de código. O Composer 2, portanto, é treinado não apenas para resolver tarefas, mas para continuar resolvendo-as em trajetórias longas que excedem o comprimento imediato de contexto do modelo.

Como o Composer 2 funciona?

Pré-treinamento contínuo é o grande upgrade

Os ganhos de qualidade do Composer 2 vêm de sua “primeira execução de pré-treinamento contínuo”, que ele descreve como fornecendo uma base muito mais forte para aprendizado por reforço. Isso é importante porque sugere que o modelo não é meramente uma versão ajustada do Composer 1.5; ele é um ponto de partida melhor para o tipo de comportamento de codificação de horizonte longo que a Cursor deseja.

Aprendizado por reforço em longas trajetórias de codificação

Após o pré-treinamento contínuo, a Cursor treina o Composer 2 em tarefas de codificação de horizonte longo por meio de aprendizado por reforço. A empresa afirma que o Composer 2 pode resolver problemas difíceis que exigem centenas de ações. Em termos práticos, isso significa que o modelo está sendo ensinado a persistir por ciclos de depuração multi-etapas, navegação de código e loops de reparo iterativos, em vez de produzir uma resposta de uma única tacada e parar por aí.

Auto-resumo é um avanço de pesquisa chave

A Cursor treina o Composer para horizontes mais longos usando “auto-resumo”. Nesse arranjo, quando o modelo atinge um gatilho de contexto, ele pausa e resume seu próprio estado de trabalho, depois continua a partir desse contexto comprimido. A Cursor diz que essa técnica permite treinar em trajetórias muito mais longas do que a janela de contexto máxima do modelo e recompensar os próprios resumos como parte do sinal de treinamento.

Durabilidade

O ganho prático é a durabilidade. Tarefas longas de codificação frequentemente falham quando um agente esquece uma decisão anterior ou perde detalhes importantes em um workspace amplo. O auto-resumo reduz o erro de compactação em 50% enquanto usa um quinto dos tokens em comparação com um baseline de compactação baseado em prompt ajustado em seus ambientes de teste. Essa é uma alegação substancial, porque compactação é um dos pontos fracos dos sistemas de agentes atuais.

O que há de novo no Composer 2?

1. Pré-treinamento contínuo + escalonamento de RL

O Composer 2 introduz o primeiro pipeline de pré-treinamento contínuo em larga escala da Cursor, criando um modelo base mais forte para aprendizado por reforço.

Em seguida, aplica:

Treinamento de RL de horizonte longo
Encadeamento de tarefas em múltiplas etapas
Fluxos de trabalho de codificação do mundo real

👉 Resultado: melhor tratamento de tarefas de engenharia complexas, não apenas trechos de código.

2. Execução de tarefas de horizonte longo

Diferente de modelos anteriores que falham após algumas etapas:

O Composer 2 pode concluir refatorações em múltiplos arquivos
Executar fluxos de trabalho de terminal
Manter estado ao longo de centenas de ações

Isso o empurra em direção a um comportamento de agente de codificação de IA verdadeiro.

3. Estratégia de treinamento apenas com código

O Composer 2 é treinado apenas em dados relacionados a programação.

Por que isso importa:

Fator	Modelos gerais	Composer 2
Tamanho do modelo	Grande	Menor
Escopo	Amplo	Estreito
Eficiência	Menor	Maior
Custo	Alto	Baixo

👉 Isso explica a enorme vantagem de preço-desempenho.

4. Base híbrida (Kimi Base + RL)

Divulgações recentes revelaram que o Composer 2 foi inicialmente construído sobre o Kimi K2.5 (Moonshot AI) com treinamento adicional por reforço.

Apenas ~25% do cômputo do modelo base
A maior parte da pilha de treinamento é da Cursor

👉 Isso reflete uma nova tendência: engenharia de modelo híbrido + otimização proprietária

Benchmarks de desempenho

Modelo	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
Composer 2	61.3	61.7	73.7
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

Em relação ao Composer 1.5, o Composer 2 é cerca de 38.7% mais alto no CursorBench, 28.8% mais alto no Terminal-Bench 2.0 e 11.8% mais alto no SWE-bench Multilingual. Isso não prova superioridade universal sobre todos os modelos externos, mas mostra um claro avanço dentro da própria linha de modelos da Cursor.

Como acessar o Composer 2?

A Cursor posiciona o Composer 2 como parte do fluxo de trabalho “agent-first” do produto. Ele está disponível no próprio Cursor, e a Cursor diz que, em planos individuais, o uso do Composer vem de um pool de uso independente com uma franquia generosa. A Cursor também diz que os usuários podem experimentar o Composer 2 no “alfa inicial” de sua nova interface. Isso significa que o Composer 2 não é apenas uma API de modelo; ele foi concebido para ser usado dentro do fluxo de trabalho de agente do Cursor, onde o editor, o agente, o navegador e as ferramentas de revisão trabalham juntos.

Dentro do Cursor

O Composer 2 está disponível no Cursor e também no alfa inicial de sua nova interface. O modelo prático de acesso é nativo do produto, e não “API-first”: os usuários interagem com ele dentro do editor do Cursor e de seu fluxo de trabalho de agente. Isso é consistente com a direção mais ampla da Cursor, em que a empresa trata o editor como a principal superfície para interação com o modelo.

Pools de uso e estrutura de planos

Todo plano individual inclui dois pools de uso que são reiniciados a cada ciclo de faturamento: Auto + Composer, que oferece significativamente mais uso incluído quando Auto ou Composer 2 é selecionado, e um pool de API cobrado à taxa de API do modelo. A Cursor também diz que os planos individuais incluem pelo menos $20 de uso de API por mês, com o valor exato aumentando nos níveis superiores. A conclusão prática é que o Composer 2 foi projetado para ser usado com frequência sem empurrar imediatamente cada solicitação para cobrança pura de API.

Preço da API:

$0.50 input / $2.50 output por 1M tokens; variante rápida $1.50 / $7.50

Contexto dos planos

Cursor Pro por $20 por mês, Pro Plus por $60 e Ultra por $200, cada um com diferentes níveis de uso incluído. Para equipes, a Cursor também oferece Teams e Enterprise com controles adicionais. Isso importa porque o Composer 2 não é apenas um SKU de modelo; é parte de um pacote de produto mais amplo que combina preços, pools de uso e controles de colaboração.

Composer 2 vs Claude Opus 4.6 vs GPT-5.4: qual devo escolher?

Terminal-Bench 2.0

Composer 2: O que há de novo e comparação com Claude Opus 4.6 e GPT-5.4

Modelo	Pontuação
Composer 2	61.7
Claude Opus 4.6	~58
GPT-5.4	~75

👉 Composer 2:

Fica atrás do GPT-5.4 em desempenho de pico

Supera o Opus 4.6 em alguns cenários

Preços oficiais

Modelo	Input ($/M tokens)	Output ($/M tokens)
Composer 2	0.50	2.50
Composer 2 Fast	1.50	7.50
Claude Opus 4.6	5.00	25.00
GPT-5.4	2.50–5.00	15.00–22.50

👉 O Composer 2 é:

10× mais barato que o Opus 4.6
~5–6× mais barato que o GPT-5.4

Por que Claude Opus 4.6 e GPT-5.4 ainda valem a pena?

O Composer 2 é uma ótima opção para desenvolvedores que passam a maior parte do tempo dentro do Cursor, especialmente em loops repetitivos de edição de código, refatorações, mudanças em múltiplos arquivos e tarefas com agentes que se beneficiam de velocidade e eficiência de custo; é otimizado para código e execução de ações de horizonte longo, com preços dramaticamente mais baixos.

Mas Claude Opus 4.6 e GPT-5.4 trazem capacidades profissionais mais amplas, grandes janelas de contexto e recursos corporativos mais ricos. Se você precisa produzir um ensaio refinado, uma planilha e um fluxo de trabalho com agente de navegador de uma só vez.

Tabela de comparação:

Recurso	Composer 2	Claude Opus 4.6	GPT-5.4
Foco	Apenas codificação	IA geral	IA geral
Custo	⭐ Mais baixo	Muito alto	Médio
Precisão em código	Alta	Muito alta	Alta
Raciocínio	Médio	Muito alto	Muito alto
Velocidade	Variante rápida disponível	Moderada	Moderada
Capacidade de agente	Forte	Forte	Em melhoria
Multimodal	❌	✅	✅
Melhor caso de uso	Fluxos de trabalho de dev blow	Tarefas de nível de pesquisa	Geral + codificação

Casos de uso ideais e acesso

Se a tarefa é raciocínio amplo, trabalho multimodal ou uso corporativo geral, GPT-5.4 e Claude Opus 4.6 são fortes candidatos com base em seu posicionamento oficial e capacidades. Se a tarefa é a codificação do dia a dia dentro do Cursor, especialmente onde custo e velocidade de iteração importam, o Composer 2 é a opção mais especializada e barata. A Cursor posiciona o Composer 2 como um modelo de codificação baseada em agentes especializado para o próprio Cursor. Já GPT-5.4 e Opus 4.6 são modelos de fronteira amplos, enquanto o Composer 2 é feito sob medida para o loop IDE-agente.

A OpenAI posiciona o GPT-5.4 como um modelo de fronteira para trabalho profissional complexo, com suporte a ferramentas na API e forte raciocínio geral. A Anthropic posiciona o Claude Opus 4.6 como seu modelo mais inteligente para codificação, raciocínio e trabalho com agentes; agora todos estão disponíveis via CometAPI.

A CometAPI está com 20% de desconto na API e pode gerar playgrounds diretamente. Em comparação com outras soluções, a CometAPI é uma opção muito melhor; é essencialmente um Cursor que não requer assinatura.

Conclusão

O Composer 2 não é apenas mais um modelo incremental da Cursor. É a tentativa da Cursor de redefinir a curva preço-desempenho para agentes de codificação: resultados de benchmark mais fortes do que seus predecessores, um design centrado em comportamento de agente de horizonte longo e preços dramaticamente abaixo das grandes alternativas de fronteira. As evidências da própria Cursor mostram ganhos claros sobre o Composer 1 e 1.5, enquanto seus preços subcotam o Claude Opus 4.6 em 10x e o GPT-5.4 em 5x nos tokens de entrada.

Para equipes que já vivem no Cursor, o Composer 2 é uma opção convincente por padrão para muitas tarefas de codificação. Para o trabalho mais difícil, de maior risco ou de escopo mais amplo, Claude Opus 4.6 e GPT-5.4 continuam sendo os benchmarks premium para comparação. A verdadeira história é que o mercado de codificação de fronteira está ficando mais afiado, mais barato e mais especializado ao mesmo tempo.

Se você está procurando uma alternativa ao Cursor ou uma API de modelo de ponta mais barata como Claude Opus 4.6 e GPT-5.4, então a CometAPI é a melhor escolha. Pronto para começar?