Cursor’s Composer 2 to najnowszy agentowy model kodowania firmy, ogłoszony 19 marca 2026 roku. Cursor opisuje go jako „na poziomie frontier w kodowaniu”, zbudowanego z myślą o pracy nad oprogramowaniem z niskimi opóźnieniami i dostępnego bezpośrednio w Cursorze z osobną pulą użycia dla planów indywidualnych. Wraz z premierą wprowadzono także szybszy wariant o tej samej inteligencji, a także nową strukturę cenową zaprojektowaną tak, aby agentowe kodowanie było bardziej przystępne cenowo niż w przypadku wielu ogólnych modeli frontier.
Composer 2 jest ważny, ponieważ odzwierciedla szerszą zmianę w rozwoju oprogramowania z użyciem AI: liczy się już nie tylko surowa inteligencja modelu, lecz połączenie szybkości, obsługi zadań długiego horyzontu, użycia narzędzi i efektywności kosztowej. Sam Cursor ujmuje to wprost: model jest zoptymalizowany pod agentowe kodowanie, potrafi obsługiwać wymagające zadania wymagające setek działań i został wytrenowany tak, aby zachowywać kluczowy kontekst w długotrwałych przepływach pracy.
Czym jest Composer 2?
Model zbudowany do agentowego kodowania, a nie tylko uzupełniania tekstu
Composer 2 to autorski model kodowania Cursora. Composer 2 specjalizuje się w inteligencji i szybkości inżynierii oprogramowania, został wytrenowany w środowisku agentowym Cursor i ma dobrze działać na rzeczywistych zadaniach programistycznych, a nie w ogólnym czacie. To ważne, ponieważ agentowe kodowanie różni się od zwykłego generowania kodu: model musi przeszukiwać bazę kodu, edytować pliki, rozumować przez wiele kroków i wychodzić z błędów bez utraty wątku zadania. Wpis Cursora o treningu długiego horyzontu bardzo jasno pokazuje ten cel projektowy.
Podwójne warianty modelu:
| Wariant | Przeznaczenie |
|---|---|
| Standard | Najniższy koszt |
| Fast | Większa szybkość (domyślnie) |
Dlaczego Cursor go stworzył
Wpisy badawcze Cursora sugerują prostą tezę: lepsi agenci kodujący potrzebują zarówno inteligencji, jak i wydajnej kontynuacji przez wiele kroków. Obserwacje z jego wewnętrznego benchmarku (CursorBench) pokazują, że lepsze wyniki w trudnych, rzeczywistych zadaniach kodowania korelują z większą ilością myślenia i intensywniejszą eksploracją bazy kodu. Composer 2 jest więc trenowany nie tylko do rozwiązywania zadań, ale także do dalszego rozwiązywania ich na długich trajektoriach przekraczających bezpośrednią długość kontekstu modelu.
Jak działa Composer 2?
Kontynuowane pretrenowanie to największe ulepszenie
Wzrost jakości w Composer 2 wynika z jego „pierwszego cyklu kontynuowanego pretrenowania”, który według opisu zapewnia znacznie silniejszą bazę dla uczenia ze wzmocnieniem. To istotne, ponieważ sugeruje, że model nie jest jedynie dostrojoną wersją Composer 1.5; jest lepszym punktem wyjścia dla zachowań kodowania długiego horyzontu, których Cursor oczekuje.
Uczenie ze wzmocnieniem na długich trajektoriach kodowania
Po kontynuowanym pretrenowaniu Cursor trenuje Composer 2 na zadaniach kodowania długiego horyzontu za pomocą uczenia ze wzmocnieniem. Firma twierdzi, że Composer 2 potrafi rozwiązywać trudne problemy wymagające setek działań. W praktyce oznacza to, że model jest uczony wytrwałości w wieloetapowym debugowaniu, nawigacji po kodzie i iteracyjnych pętlach naprawczych, zamiast generowania jednorazowej odpowiedzi i zatrzymywania się na tym.
Samopodsumowanie to kluczowy postęp badawczy
Cursor trenuje Composer do dłuższych horyzontów przy użyciu „samopodsumowania”. W takim układzie, gdy model osiąga wyzwalacz kontekstu, zatrzymuje się i podsumowuje własny stan roboczy, a następnie kontynuuje z tego skompresowanego kontekstu. Cursor twierdzi, że ta technika pozwala trenować na trajektoriach znacznie dłuższych niż maksymalne okno kontekstowe modelu i nagradzać same podsumowania jako część sygnału treningowego.
Trwałość
Praktyczną korzyścią jest trwałość. Długie zadania kodowania często kończą się niepowodzeniem, gdy agent zapomina wcześniejszą decyzję lub gubi ważne szczegóły w rozległym obszarze roboczym. Samopodsumowanie zmniejsza błąd kompakcji o 50%, zużywając jedną piątą tokenów w porównaniu z dostrojoną bazą kompakcji opartą na promptach w środowiskach testowych. To znaczące twierdzenie, ponieważ kompakcja jest jednym ze słabych punktów obecnych systemów agentowych.
Co nowego w Composer 2?
1. Kontynuowane pretrenowanie + skalowanie RL
Composer 2 wprowadza pierwszy wielkoskalowy pipeline kontynuowanego pretrenowania Cursora, tworząc silniejszy model bazowy dla uczenia ze wzmocnieniem.
Następnie stosuje:
- Trening RL długiego horyzontu
- Łączenie zadań przez wiele kroków
- Rzeczywiste przepływy pracy programistycznej
👉 Rezultat: Lepsza obsługa złożonych zadań inżynieryjnych, a nie tylko fragmentów kodu.
2. Wykonywanie zadań długiego horyzontu
W przeciwieństwie do wcześniejszych modeli, które zawodzą po kilku krokach:
- Composer 2 potrafi ukończyć refaktoryzacje wielu plików
- Wykonywać przepływy pracy w terminalu
- Utrzymywać stan przez setki działań
To przybliża go do prawdziwego zachowania agenta AI do kodowania.
3. Strategia treningu wyłącznie na kodzie
Composer 2 jest trenowany wyłącznie na danych związanych z programowaniem.
Dlaczego to ważne:
| Czynnik | Modele ogólne | Composer 2 |
|---|---|---|
| Rozmiar modelu | Duży | Mniejszy |
| Zakres | Szeroki | Wąski |
| Wydajność | Niższa | Wyższa |
| Koszt | Wysoki | Niski |
👉 To wyjaśnia ogromną przewagę ceny do wydajności.
4. Hybrydowy fundament (Kimi Base + RL)
Niedawne ujawnienia pokazały, że Composer 2 został początkowo zbudowany na bazie Kimi K2.5 (Moonshot AI) z dodatkowym treningiem przez uczenie ze wzmocnieniem.
- Tylko ~25% zasobów obliczeniowych z modelu bazowego
- Większość pochodzi ze stosu treningowego Cursora
👉 To odzwierciedla nowy trend: hybrydowa inżynieria modeli + własnościowa optymalizacja
Benchmarki wydajności
| Model | CursorBench | Terminal-Bench 2.0 | SWE-bench Multilingual |
|---|---|---|---|
| Composer 2 | 61.3 | 61.7 | 73.7 |
| Composer 1.5 | 44.2 | 47.9 | 65.9 |
| Composer 1 | 38.0 | 40.0 | 56.9 |
Względem Composer 1.5, Composer 2 osiąga o około 38,7% wyższy wynik w CursorBench, o 28,8% wyższy w Terminal-Bench 2.0 oraz o 11,8% wyższy w SWE-bench Multilingual. Nie dowodzi to uniwersalnej przewagi nad każdym zewnętrznym modelem, ale pokazuje wyraźny krok naprzód w ramach własnej linii modeli Cursora.
Jak uzyskać dostęp do Composer 2?
Cursor pozycjonuje Composer 2 jako część przepływu pracy produktu nastawionego na agentów. Jest dostępny w samym Cursorze, a Cursor podaje, że w planach indywidualnych użycie Composer pochodzi z osobnej puli użycia z hojnym limitem w pakiecie. Cursor podaje też, że użytkownicy mogą wypróbować Composer 2 we „wczesnej alfie” nowego interfejsu. Oznacza to, że Composer 2 nie jest tylko API modelu; ma być używany wewnątrz agentowego przepływu pracy Cursora, gdzie edytor, agent, przeglądarka i narzędzia recenzji działają razem.
Wewnątrz Cursor
Composer 2 jest dostępny w Cursorze, a także we wczesnej alfie jego nowego interfejsu. Praktyczny model dostępu jest natywny produktowo, a nie nastawiony przede wszystkim na API: użytkownicy wchodzą z nim w interakcję wewnątrz edytora Cursor i jego przepływu pracy agentowego. Jest to zgodne z szerszym kierunkiem Cursora, w którym firma traktuje edytor jako główną powierzchnię interakcji z modelem.
Pule użycia i struktura planów
Każdy plan indywidualny obejmuje dwie pule użycia, resetowane co cykl rozliczeniowy: Auto + Composer, która daje znacząco więcej użycia w pakiecie, gdy wybrane są Auto lub Composer 2, oraz pulę API rozliczaną według stawki API modelu. Cursor podaje również, że plany indywidualne obejmują co najmniej 20 USD użycia API miesięcznie, a dokładna kwota rośnie na wyższych poziomach. Praktyczny wniosek jest taki, że Composer 2 został zaprojektowany do częstego używania bez natychmiastowego przenoszenia każdego żądania do czystego rozliczania API.
Cena API:
0,50 USD wejście / 2,50 USD wyjście za 1M tokenów; wariant fast 1,50 / 7,50
Kontekst planów
Cursor Pro za 20 USD miesięcznie, Pro Plus za 60 USD i Ultra za 200 USD, każdy z różnymi poziomami użycia w pakiecie. Dla zespołów Cursor oferuje również Teams i Enterprise z dodatkowymi mechanizmami kontroli. To istotne, ponieważ Composer 2 nie jest tylko SKU modelu; jest częścią szerszego pakietu produktowego łączącego ceny, pule użycia i mechanizmy współpracy.
Composer 2 vs Claude Opus 4.6 vs GPT-5.4: który wybrać?
Terminal-Bench 2.0

| Model | Wynik |
|---|---|
| Composer 2 | 61.7 |
| Claude Opus 4.6 | ~58 |
| GPT-5.4 | ~75 |
👉 Composer 2:
Ustępuje GPT-5.4 pod względem szczytowej wydajności
Przewyższa Opus 4.6 w niektórych konfiguracjach
Oficjalne ceny
| Model | Wejście ($/M tokenów) | Wyjście ($/M tokenów) |
|---|---|---|
| Composer 2 | 0.50 | 2.50 |
| Composer 2 Fast | 1.50 | 7.50 |
| Claude Opus 4.6 | 5.00 | 25.00 |
| GPT-5.4 | 2.50–5.00 | 15.00–22.50 |
👉 Composer 2 jest:
- 10× tańszy niż Opus 4.6
- ~5–6× tańszy niż GPT-5.4
Dlaczego Claude Opus 4.6 i GPT-5.4 nadal są warte uwagi?
Composer 2 dobrze pasuje do deweloperów, którzy większość czasu spędzają w Cursorze, szczególnie przy powtarzalnych pętlach edycji kodu, refaktoryzacjach, zmianach w wielu plikach i zadaniach agentowych korzystających z szybkości i efektywności kosztowej; jest zoptymalizowany pod kod i wykonywanie działań długiego horyzontu, a jego ceny są dramatycznie niższe.
Jednak Claude Opus 4.6 i GPT-5.4 oferują szersze możliwości profesjonalne, duże okna kontekstowe i bogatsze funkcje korporacyjne. Jeśli potrzebujesz jednocześnie stworzyć dopracowany esej, arkusz kalkulacyjny i przepływ pracy agenta przeglądarkowego.
Tabela porównawcza:
| Funkcja | Composer 2 | Claude Opus 4.6 | GPT-5.4 |
|---|---|---|---|
| Ukierunkowanie | Tylko kodowanie | Ogólna AI | Ogólna AI |
| Koszt | ⭐ Najniższy | Bardzo wysoki | Średni |
| Dokładność kodowania | Wysoka | Bardzo wysoka | Wysoka |
| Rozumowanie | Średnie | Bardzo wysokie | Bardzo wysokie |
| Szybkość | Dostępny wariant fast | Umiarkowana | Umiarkowana |
| Zdolności agentowe | Silne | Silne | Rosnące |
| Multimodalność | ❌ | ✅ | ✅ |
| Najlepszy przypadek użycia | Przepływy pracy deweloperskiej | Zadania klasy badawczej | Ogólne + kodowanie |
Najlepiej dopasowane przypadki użycia i dostęp
Jeśli zadanie wymaga szerokiego rozumowania, pracy multimodalnej lub ogólnego zastosowania korporacyjnego, GPT-5.4 i Claude Opus 4.6 są mocnymi kandydatami na podstawie ich oficjalnego pozycjonowania i możliwości. Jeśli zadaniem jest codzienne kodowanie w Cursorze, szczególnie tam, gdzie liczy się koszt i szybkość iteracji, Composer 2 jest bardziej wyspecjalizowanym i tańszym wyborem. Cursor pozycjonuje Composer 2 jako wyspecjalizowany agentowy model kodowania dla samego Cursora. , GPT-5.4 i Opus 4.6 to szerokie modele frontier, podczas gdy Composer 2 został zbudowany specjalnie pod pętlę IDE-agent.
OpenAI pozycjonuje GPT-5.4 jako model frontier do złożonej pracy profesjonalnej, z obsługą narzędzi w API i silnym ogólnym rozumowaniem. Anthropic pozycjonuje Claude Opus 4.6 jako swój najmądrzejszy model do kodowania, rozumowania i pracy agentowej, a teraz wszystkie są dostępne przez CometAPI.
API CometAPI jest obecnie przecenione o 20% i może bezpośrednio generować playgroundy. W porównaniu z innymi rozwiązaniami CometAPI jest znacznie lepszą opcją; to zasadniczo cursor, który nie wymaga subskrypcji.
Podsumowanie
Composer 2 to nie tylko kolejny przyrostowy model Cursora. To próba Cursora przestawienia krzywej ceny do wydajności dla agentów kodujących: mocniejsze wyniki benchmarków niż u poprzedników, konstrukcja skoncentrowana na agentowym zachowaniu długiego horyzontu oraz ceny dramatycznie niższe od dużych alternatyw frontier. Własne dane Cursora pokazują wyraźne zyski względem Composer 1 i 1.5, podczas gdy jego ceny są 10x niższe niż Claude Opus 4.6 i 5x niższe niż GPT-5.4 dla tokenów wejściowych.
Dla zespołów już pracujących w Cursorze Composer 2 jest przekonującym domyślnym wyborem do wielu zadań związanych z kodowaniem. Dla najtrudniejszych, najbardziej ryzykownych lub najszerszych zakresowo zadań Claude Opus 4.6 i GPT-5.4 pozostają premium benchmarkami, z którymi warto go porównywać. Prawdziwa historia jest taka, że rynek frontier kodowania staje się jednocześnie ostrzejszy, tańszy i bardziej wyspecjalizowany.
Jeśli szukasz alternatywy dla Cursors albo tańszego, nowoczesnego API modeli, takiego jak Claude Opus 4.6 i GPT-5.4, to CometAPI jest najlepszym wyborem. Gotowy do startu?
