Composer 2: 새로운 점과 Claude Opus 4.6 및 GPT-5.4와의 비교

Cursor의 Composer 2는 회사가 2026년 3월 19일에 발표한 최신 에이전트형 코딩 모델이다. Cursor는 이를 “코딩에서의 프론티어급”으로 설명하며, 저지연 소프트웨어 작업에 맞춰 구축되었고, 개인 요금제에 대해 독립적인 사용량 풀과 함께 Cursor 내부에서 직접 사용할 수 있다고 말한다. 이번 출시에서는 동일한 지능을 유지하면서 더 빠른 변형과, 많은 범용 프론티어 모델보다 에이전트형 코딩을 더 저렴하게 만드는 새로운 가격 구조도 함께 도입했다.

Composer 2가 중요한 이유는 AI 소프트웨어 개발 전반의 변화와 맞물려 있기 때문이다. 이제 가치는 단순한 원시적 모델 지능을 넘어, 속도, 장기 호라이즌 작업 처리, 도구 사용, 비용 효율의 결합에 있다. Cursor의 자체 관점은 분명하다. 이 모델은 에이전트형 코딩에 최적화되어 있으며, 수백 단계를 요하는 어려운 작업을 처리할 수 있고, 장기 실행 워크플로우에서 중요한 컨텍스트를 보존하도록 훈련되었다.

What is Composer 2?

A model built for agentic coding, not just text completion

Composer 2는 Cursor의 사내 코딩 모델이다. Composer 2는 소프트웨어 엔지니어링 지능과 속도에 특화되어 있으며, Cursor 에이전트 하니스에서 훈련되었고, 일반적인 채팅이 아니라 실제 코딩 작업에서 잘 작동하도록 설계되었다. 이는 중요하다. 에이전트형 코딩은 일반적인 코드 생성과 다르기 때문이다. 모델은 코드베이스를 검색하고, 파일을 수정하며, 여러 단계를 거쳐 추론하고, 작업의 흐름을 잃지 않은 채 실수에서 회복해야 한다. Cursor의 장기 호라이즌 훈련 게시물은 이러한 설계 목표를 매우 명확히 제시한다.

Dual Model Variants:

Variant	용도
Standard	최저 비용
Fast	더 높은 속도(기본)

Why Cursor built it

Cursor의 연구 글은 간단한 명제를 시사한다. 더 나은 코딩 에이전트에는 지능과 다단계에 걸친 효율적인 연속성이 모두 필요하다는 것이다. 내부 벤치마크(CursorBench) 관측에 따르면, 현실의 어려운 코딩 작업에서 더 강한 성능은 더 많은 사고와 더 많은 코드베이스 탐색과 상관관계가 있다. 따라서 Composer 2는 과제를 해결하는 데 그치지 않고, 모델의 즉각적인 컨텍스트 길이를 넘어서는 긴 궤적에서도 계속 해결하도록 훈련되었다.

How Composer 2 Work?

Continued pretraining is the big upgrade

Composer 2의 품질 향상은 “첫 연속 사전훈련 런”에서 비롯되며, 이는 강화학습을 위한 훨씬 더 강력한 기반을 제공한다고 설명한다. 이는 Composer 1.5의 단순한 튜닝 버전이 아니라, Cursor가 지향하는 장기 호라이즌 코딩 행동에 더 적합한 출발점임을 의미한다.

Reinforcement learning on long coding trajectories

연속 사전훈련 이후, Cursor는 강화학습을 통해 Composer 2를 장기 호라이즌 코딩 작업에 훈련시킨다. 회사는 Composer 2가 수백 개의 액션을 요구하는 어려운 문제를 해결할 수 있다고 주장한다. 실무적으로 이는 모델이 단발성 답을 내고 멈추는 대신, 다단계 디버깅, 코드 내비게이션, 반복적 수리 루프를 통해 지속하도록 가르쳐지고 있음을 뜻한다.

Self-summarization is a key research advance

Cursor는 “self-summarization”을 사용해 더 긴 호라이즌을 학습시킨다. 이 설정에서는 모델이 컨텍스트 트리거에 도달하면 잠시 멈춰 자신의 작업 상태를 요약하고, 그 압축된 컨텍스트에서 계속 진행한다. Cursor는 이 기법이 모델의 최대 컨텍스트 윈도우를 훨씬 넘는 궤적을 훈련할 수 있게 하고, 요약 자체에도 보상을 부여하는 학습 신호를 제공한다고 말한다.

Durability

실무적인 이점은 지속성이다. 장기 코딩 작업은 에이전트가 초기 결정을 잊거나, 방대한 작업공간에서 중요한 세부를 잃을 때 자주 실패한다. 테스트 환경에서 self-summarization은 튜닝된 프롬프트 기반 압축 기준선 대비 토큰을 5분의 1만 사용하면서도 압축 오류를 50% 줄였다. 이는 현재 에이전트 시스템의 약점 중 하나인 압축의 한계를 본질적으로 개선했다는 의미 있는 주장이다.

What’s New in Composer 2?

1. Continued Pretraining + RL Scaling

Composer 2는 Cursor의 첫 대규모 연속 사전훈련 파이프라인을 도입해, 강화학습을 위한 더 강력한 베이스 모델을 만든다.

그 다음, 아래를 적용한다:

장기 호라이즌 강화학습
다단계 태스크 체이닝
실제 코딩 워크플로우

👉 Result: 코드 스니펫을 넘어선 복잡한 엔지니어링 과제를 더 잘 처리.

2. Long-Horizon Task Execution

이전 모델들이 몇 단계 후 실패하는 것과 달리:

Composer 2는 다중 파일 리팩터링을 완료할 수 있음
터미널 워크플로우를 실행
수백 개의 액션에 걸친 상태를 유지

이는 진정한 AI 코딩 에이전트 행동에 가까워진다.

3. Code-Only Training Strategy

Composer 2는 프로그래밍 관련 데이터로만 훈련된다.

왜 중요한가:

Factor	General Models	Composer 2
Model size	Large	Smaller
Scope	Broad	Narrow
Efficiency	Lower	Higher
Cost	High	Low

👉 이로 인해 거대한 가격 대비 성능 우위가 설명된다.

4. Hybrid Foundation (Kimi Base + RL)

최근 공개에 따르면, Composer 2는 초기에는 Kimi K2.5 (Moonshot AI)를 기반으로 구축되고, 여기에 추가 강화학습을 적용했다.

베이스 모델에서의 연산 자원은 ~25%만 사용
대다수는 Cursor의 훈련 스택에서 기여

👉 이는 하이브리드 모델 엔지니어링 + 독자적 최적화라는 새로운 흐름을 반영한다.

Performance benchmarks

Model	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
Composer 2	61.3	61.7	73.7
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

Composer 1.5 대비, Composer 2는 CursorBench에서 약 38.7% 높고, Terminal-Bench 2.0에서 28.8% 높으며, SWE-bench Multilingual에서 11.8% 높다. 이는 모든 외부 모델에 대한 보편적 우위를 증명하는 것은 아니지만, 적어도 Cursor 자체 라인업 내에서의 분명한 도약을 보여준다.

How Do You Access Composer 2?

Cursor는 Composer 2를 제품의 에이전트 중심 워크플로우의 일부로 포지셔닝한다. Composer 2는 Cursor 자체에서 이용 가능하며, 개인 요금제에서는 Composer 사용량이 관대한 포함 사용량과 함께 독립적인 사용량 풀에서 차감된다고 한다. 또한 새 인터페이스의 “초기 알파”에서 Composer 2를 사용해 볼 수 있다고 한다. 이는 Composer 2가 단순한 모델 API가 아니라, 에디터·에이전트·브라우저·리뷰 도구가 함께 작동하는 Cursor의 에이전트 워크플로우 안에서 사용되도록 설계되어 있다는 의미다.

Inside Cursor

Composer 2는 Cursor 및 새 인터페이스의 초기 알파에서 이용할 수 있다. 실제 접근 방식은 API 우선이 아니라 제품 내 사용이 기본이다. 사용자는 Cursor 에디터와 에이전트 워크플로우 안에서 상호작용한다. 이는 모델 상호작용의 주된 표면을 에디터로 취급하는 Cursor의 더 큰 방향성과 일치한다.

Usage pools and plan structure

모든 개인 요금제에는 각 청구 주기마다 초기화되는 두 개의 사용량 풀이 포함된다. Auto + Composer 풀은 Auto 또는 Composer 2를 선택할 때 포함 사용량이 크게 늘어나며, 별도의 API 풀은 모델의 API 요율로 과금된다. 또한 개인 요금제에는 월 최소 $20의 API 사용량이 포함되며, 상위 티어로 갈수록 그 금액이 증가한다. 실무적 결론은 Composer 2가 매 요청을 곧바로 순수 API 과금으로 몰아가지 않고도 자주 사용할 수 있도록 설계되었다는 점이다.

API Price:

$0.50 input / $2.50 output per 1M tokens; fast variant $1.50 / $7.50

Plan context

Cursor Pro는 월 $20, Pro Plus는 $60, Ultra는 $200이며, 각기 포함 사용량이 다르다. 팀을 위해 Cursor는 추가 제어 기능이 포함된 Teams와 Enterprise도 제공한다. 이는 Composer 2가 단순한 모델 SKU가 아니라, 가격·사용량 풀·협업 제어를 결합한 더 넓은 제품 패키지의 일부임을 의미한다.

Composer 2 vs Claude Opus 4.6 vs GPT-5.4: Which one should I choose?

Terminal-Bench 2.0

Composer 2: 새로운 점과 Claude Opus 4.6 및 GPT-5.4와의 비교

Model	Score
Composer 2	61.7
Claude Opus 4.6	~58
GPT-5.4	~75

👉 Composer 2:

최고 성능에서는 GPT-5.4에 뒤처짐

일부 설정에서는 Opus 4.6을 앞섬

Official Pricing

Model	Input ($/M tokens)	Output ($/M tokens)
Composer 2	0.50	2.50
Composer 2 Fast	1.50	7.50
Claude Opus 4.6	5.00	25.00
GPT-5.4	2.50–5.00	15.00–22.50

👉 Composer 2는:

Opus 4.6 대비 10× 더 저렴
GPT-5.4 대비 ~5–6× 더 저렴

Why are Claude Opus 4.6 and GPT-5.4 still worthwhile?

Composer 2는 특히 Cursor 내부에서 대부분의 시간을 보내는 개발자에게 적합하다. 반복적인 코드 편집 루프, 리팩터링, 다중 파일 변경, 속도와 비용 효율의 이점을 누리는 에이전트형 작업에서 강점을 보이며, 코드와 장기 호라이즌 액션 실행에 최적화되어 있고, 가격도 극히 낮다.

하지만 Claude Opus 4.6과 GPT-5.4는 더 넓은 전문 기능, 큰 컨텍스트 윈도우, 더 풍부한 엔터프라이즈 기능을 제공한다. 한 번에 세련된 에세이, 스프레드시트, 브라우저 에이전트 워크플로우까지 만들어야 한다면 이들 모델이 유리할 수 있다.

Comparison Table:

Feature	Composer 2	Claude Opus 4.6	GPT-5.4
Focus	Coding only	General AI	General AI
Cost	⭐ Lowest	Very high	Medium
Coding Accuracy	High	Very high	High
Reasoning	Medium	Very high	Very high
Speed	Fast variant available	Moderate	Moderate
Agent Capability	Strong	Strong	Improving
Multimodal	❌	✅	✅
Best Use Case	Dev workflows	Research-grade tasks	General + coding

Best-fit use cases and Access

과제가 폭넓은 추론, 멀티모달 작업, 일반적 엔터프라이즈 용도라면, 공식 포지셔닝과 역량에 비춰 GPT-5.4와 Claude Opus 4.6이 모두 유력한 후보가 된다. 반면, Cursor 내부의 일상적 코딩—특히 비용과 반복 속도가 중요한 경우—에서는 Composer 2가 더 특화되고 저렴한 선택이다. Cursor는 Composer 2를 Cursor 자체를 위한 특화된 에이전트형 코딩 모델로 포지셔닝한다. GPT-5.4와 Opus 4.6이 폭넓은 프론티어 모델이라면, Composer 2는 IDE-에이전트 루프에 맞춰 설계된 모델이다.

OpenAI는 GPT-5.4를 도구 지원 API와 강한 일반 추론을 갖춘 복잡한 전문 작업용 프론티어 모델로 포지셔닝한다. Anthropic은 Claude Opus 4.6을 코딩·추론·에이전트 작업에서 가장 스마트한 모델로 포지셔닝하고 있으며, 이들 모두는 CometAPI에서 이용 가능하다.

CometAPI\의 API는 현재 20% 할인 중이며, 플레이그라운드를 직접 생성할 수 있다. 다른 솔루션과 비교하면 CometAPI는 훨씬 더 나은 선택지로, 본질적으로 구독이 필요 없는 Cursor와 같다.

Comclusion

Composer 2는 단순한 소폭 개선의 Cursor 모델이 아니다. 코딩 에이전트를 위한 가격-성능 곡선을 재정의하려는 Cursor의 시도다. 전작 대비 더 강한 벤치마크 결과, 장기 호라이즌 에이전트 행동 중심의 설계, 그리고 대형 프론티어 대안 대비 극적으로 낮은 가격을 제시한다. Cursor의 자체 증거는 Composer 1 및 1.5 대비 명확한 향상을 보여주며, 입력 토큰 기준 가격은 Claude Opus 4.6 대비 10배, GPT-5.4 대비 5배 낮다.

이미 Cursor에 깊이 통합된 팀이라면, Composer 2는 많은 코딩 작업에서 설득력 있는 기본값이 될 것이다. 반면 가장 어렵고, 높은 리스크를 수반하며, 범위가 가장 넓은 작업에서는 Claude Opus 4.6과 GPT-5.4가 여전히 비교 기준이 되는 프리미엄 선택지다. 진짜 이야기는 프론티어 코딩 시장이 동시에 더 날카로워지고, 더 저렴해지며, 더 특화되고 있다는 점이다.

Cursor의 대안을 찾고 있거나, Claude Opus 4.6과 GPT-5.4 같은 최신형 모델 API를 더 저렴하게 이용하려 한다면 CometAPI가 최선의 선택이다. Ready to go?