Composer 2: Apa yang baru dan Perbandingannya dengan Claude Opus 4.6 & GPT-5.4

Model coding agent terbaru milik Cursor, Composer 2, diumumkan pada 19 Maret 2026. Cursor menggambarkannya sebagai “setara frontier dalam coding”, dibangun untuk pekerjaan software berlatensi rendah, dan tersedia langsung di dalam Cursor dengan pool penggunaan terpisah untuk paket individual. Peluncuran ini juga memperkenalkan varian yang lebih cepat dengan tingkat kecerdasan yang sama, serta struktur harga baru yang dirancang agar agentic coding lebih terjangkau dibanding banyak model frontier serbaguna.

Composer 2 penting karena mencerminkan pergeseran yang lebih luas dalam pengembangan software berbasis AI: nilainya bukan lagi sekadar kecerdasan model mentah, tetapi kombinasi antara kecepatan, kemampuan menangani tugas jangka panjang, penggunaan tool, dan efisiensi biaya. Penjelasan Cursor sendiri sangat jelas: model ini dioptimalkan untuk agentic coding, dapat menangani tugas menantang yang memerlukan ratusan aksi, dan dilatih untuk mempertahankan konteks penting di seluruh alur kerja yang berjalan lama.

Apa itu Composer 2?

Model yang dibangun untuk agentic coding, bukan sekadar penyelesaian teks

Composer 2 adalah model coding buatan Cursor sendiri. Composer 2 dikhususkan untuk kecerdasan dan kecepatan software engineering, dilatih dalam agent harness milik Cursor, dan ditujukan agar bekerja baik pada tugas coding nyata, bukan chat generik. Ini penting karena agentic coding berbeda dari code generation biasa: model harus menelusuri codebase, mengedit file, bernalar melalui banyak langkah, dan pulih dari kesalahan tanpa kehilangan alur tugas. Postingan pelatihan jangka panjang milik Cursor menjelaskan tujuan desain ini dengan sangat jelas.

Varian Model Ganda:

Varian	Tujuan
Standard	Biaya terendah
Fast	Kecepatan lebih tinggi (default)

Mengapa Cursor membangunnya

Postingan riset Cursor menunjukkan tesis yang sederhana: agen coding yang lebih baik membutuhkan kecerdasan sekaligus keberlanjutan yang efisien selama banyak langkah. Pengamatan dari benchmark internalnya (CursorBench) menunjukkan bahwa performa yang lebih kuat pada tugas coding dunia nyata yang sulit berkorelasi dengan lebih banyak pemikiran dan lebih banyak eksplorasi codebase. Karena itu, Composer 2 dilatih bukan hanya untuk menyelesaikan tugas, tetapi untuk terus menyelesaikannya di sepanjang trajektori panjang yang melampaui panjang konteks langsung model.

Bagaimana Composer 2 Bekerja?

Continued pretraining adalah peningkatan terbesar

Peningkatan kualitas Composer 2 berasal dari “continued pretraining run pertamanya”, yang disebut memberikan fondasi yang jauh lebih kuat untuk reinforcement learning. Ini penting karena menunjukkan bahwa model ini bukan sekadar versi yang di-tuning dari Composer 1.5; melainkan titik awal yang lebih baik untuk perilaku coding jangka panjang yang diinginkan Cursor.

Reinforcement learning pada trajektori coding panjang

Setelah continued pretraining, Cursor melatih Composer 2 pada tugas coding jangka panjang melalui reinforcement learning. Perusahaan mengklaim Composer 2 dapat menyelesaikan masalah sulit yang membutuhkan ratusan aksi. Dalam praktiknya, ini berarti model diajarkan untuk bertahan melalui debugging multi-langkah, navigasi kode, dan loop perbaikan iteratif alih-alih menghasilkan jawaban sekali jadi lalu berhenti di sana.

Self-summarization adalah kemajuan riset kunci

Cursor melatih Composer untuk horizon yang lebih panjang menggunakan “self-summarization”. Dalam pengaturan ini, ketika model mencapai pemicu konteks, model berhenti sejenak dan merangkum status kerjanya sendiri, lalu melanjutkan dari konteks yang telah dipadatkan itu. Cursor mengatakan teknik ini memungkinkannya melatih trajektori yang jauh lebih panjang daripada jendela konteks maksimum model serta memberi reward pada ringkasan itu sendiri sebagai bagian dari sinyal pelatihan.

Daya tahan

Keunggulan praktisnya adalah daya tahan. Tugas coding yang panjang sering gagal ketika agen melupakan keputusan sebelumnya atau kehilangan detail penting dalam workspace yang luas. Self-summarization mengurangi compaction error sebesar 50% sambil hanya menggunakan seperlima token dibanding baseline compaction berbasis prompt yang telah di-tuning di lingkungan pengujiannya. Ini adalah klaim yang signifikan, karena compaction merupakan salah satu titik lemah sistem agen saat ini.

Apa yang Baru di Composer 2?

1. Continued Pretraining + RL Scaling

Composer 2 memperkenalkan pipeline continued pretraining skala besar pertama milik Cursor, yang menciptakan model dasar yang lebih kuat untuk reinforcement learning.

Lalu, model ini menerapkan:

Pelatihan RL jangka panjang
Task chaining lintas banyak langkah
Workflow coding dunia nyata

👉 Hasil: Penanganan tugas engineering yang kompleks menjadi lebih baik, bukan sekadar potongan kode.

2. Eksekusi Tugas Jangka Panjang

Berbeda dari model sebelumnya yang gagal setelah beberapa langkah:

Composer 2 dapat menyelesaikan refactor multi-file
Menjalankan workflow terminal
Mempertahankan state di sepanjang ratusan aksi

Ini mendorongnya menuju perilaku agen coding AI yang sesungguhnya.

3. Strategi Pelatihan Khusus Kode

Composer 2 dilatih hanya pada data yang terkait dengan pemrograman.

Mengapa ini penting:

Faktor	Model Umum	Composer 2
Ukuran model	Besar	Lebih kecil
Cakupan	Luas	Sempit
Efisiensi	Lebih rendah	Lebih tinggi
Biaya	Tinggi	Rendah

👉 Ini menjelaskan keunggulan besar dalam price-performance.

4. Fondasi Hibrida (Kimi Base + RL)

Pengungkapan terbaru menunjukkan bahwa Composer 2 pada awalnya dibangun di atas Kimi K2.5 (Moonshot AI) dengan pelatihan reinforcement tambahan.

Hanya ~25% komputasi dari model dasar
Mayoritas berasal dari stack pelatihan milik Cursor

👉 Ini mencerminkan tren baru: rekayasa model hibrida + optimasi proprietary

Benchmark performa

Model	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
Composer 2	61.3	61.7	73.7
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

Dibandingkan dengan Composer 1.5, Composer 2 sekitar 38.7% lebih tinggi pada CursorBench, 28.8% lebih tinggi pada Terminal-Bench 2.0, dan 11.8% lebih tinggi pada SWE-bench Multilingual. Itu tidak membuktikan keunggulan universal atas setiap model eksternal, tetapi memang menunjukkan lompatan yang jelas dalam lini model Cursor sendiri.

Bagaimana Cara Mengakses Composer 2?

Cursor memosisikan Composer 2 sebagai bagian dari workflow produk yang mengutamakan agen. Model ini tersedia di Cursor sendiri, dan Cursor mengatakan bahwa pada paket individual, penggunaan Composer berasal dari pool penggunaan mandiri dengan kuota bawaan yang besar. Cursor juga mengatakan pengguna dapat mencoba Composer 2 di “early alpha” antarmuka barunya. Ini berarti Composer 2 bukan sekadar API model; model ini dimaksudkan untuk digunakan di dalam workflow agen Cursor, tempat editor, agen, browser, dan tool review bekerja bersama.

Di dalam Cursor

Composer 2 tersedia di Cursor dan juga dalam early alpha dari antarmuka barunya. Model akses praktisnya bersifat native-product, bukan API-first: pengguna berinteraksi dengannya di dalam editor Cursor dan workflow agennya. Ini sejalan dengan arah Cursor yang lebih luas, di mana perusahaan memperlakukan editor sebagai permukaan utama untuk interaksi model.

Pool penggunaan dan struktur paket

Setiap paket individual mencakup dua pool penggunaan yang di-reset setiap siklus penagihan: Auto + Composer, yang memberikan penggunaan bawaan yang jauh lebih banyak saat Auto atau Composer 2 dipilih, dan API pool yang dikenakan biaya sesuai tarif API model. Cursor juga mengatakan paket individual mencakup setidaknya $20 penggunaan API setiap bulan, dengan jumlah pastinya meningkat pada tier yang lebih tinggi. Kesimpulan praktisnya adalah Composer 2 dirancang agar dapat sering digunakan tanpa langsung memaksa setiap permintaan masuk ke penagihan API murni.

Harga API:

$0.50 input / $2.50 output per 1M token; varian fast $1.50 / $7.50

Konteks paket

Cursor Pro seharga $20 per bulan, Pro Plus $60, dan Ultra $200, masing-masing dengan tingkat penggunaan bawaan yang berbeda. Untuk tim, Cursor juga menawarkan Teams dan Enterprise dengan kontrol tambahan. Ini penting karena Composer 2 bukan hanya SKU model; model ini merupakan bagian dari paket produk yang lebih luas yang memadukan harga, pool penggunaan, dan kontrol kolaborasi.

Composer 2 vs Claude Opus 4.6 vs GPT-5.4: Mana yang Harus Saya Pilih?

Terminal-Bench 2.0

Composer 2: Apa yang baru dan Perbandingannya dengan Claude Opus 4.6 & GPT-5.4

Model	Skor
Composer 2	61.7
Claude Opus 4.6	~58
GPT-5.4	~75

👉 Composer 2:

Tertinggal dari GPT-5.4 dalam performa puncak

Mengungguli Opus 4.6 dalam beberapa pengaturan

Harga Resmi

Model	Input ($/M token)	Output ($/M token)
Composer 2	0.50	2.50
Composer 2 Fast	1.50	7.50
Claude Opus 4.6	5.00	25.00
GPT-5.4	2.50–5.00	15.00–22.50

👉 Composer 2 adalah:

10× lebih murah daripada Opus 4.6
~5–6× lebih murah daripada GPT-5.4

Mengapa Claude Opus 4.6 dan GPT-5.4 masih layak dipertimbangkan?

Composer 2 sangat cocok untuk developer yang menghabiskan sebagian besar waktunya di dalam Cursor, terutama pada loop pengeditan kode yang repetitif, refactor, perubahan multi-file, dan tugas agentic yang mendapat manfaat dari kecepatan dan efisiensi biaya, karena model ini dioptimalkan untuk kode dan eksekusi aksi jangka panjang, dengan harga yang jauh lebih rendah.

Namun Claude Opus 4.6 dan GPT-5.4 masing-masing menawarkan kapabilitas profesional yang lebih luas, jendela konteks yang besar, dan fitur enterprise yang lebih kaya. Jika Anda perlu menghasilkan esai yang matang, spreadsheet, dan workflow browser-agent sekaligus.

Tabel Perbandingan:

Fitur	Composer 2	Claude Opus 4.6	GPT-5.4
Fokus	Hanya coding	AI umum	AI umum
Biaya	⭐ Paling rendah	Sangat tinggi	Menengah
Akurasi coding	Tinggi	Sangat tinggi	Tinggi
Penalaran	Sedang	Sangat tinggi	Sangat tinggi
Kecepatan	Varian fast tersedia	Sedang	Sedang
Kapabilitas agen	Kuat	Kuat	Terus meningkat
Multimodal	❌	✅	✅
Kasus penggunaan terbaik	Workflow dev	Tugas setingkat riset	Umum + coding

Kasus penggunaan terbaik dan Akses

Jika tugasnya mencakup penalaran luas, pekerjaan multimodal, atau penggunaan enterprise umum, GPT-5.4 dan Claude Opus 4.6 sama-sama merupakan kandidat kuat berdasarkan positioning dan kapabilitas resmi mereka. Jika tugasnya adalah coding sehari-hari di dalam Cursor, terutama ketika biaya dan kecepatan iterasi penting, Composer 2 adalah pilihan yang lebih terspesialisasi dan lebih murah. Cursor memosisikan Composer 2 sebagai model agentic coding khusus untuk Cursor itu sendiri. , GPT-5.4 dan Opus 4.6 adalah model frontier umum, sedangkan Composer 2 dibangun khusus untuk loop IDE-agent.

OpenAI memosisikan GPT-5.4 sebagai model frontier untuk pekerjaan profesional yang kompleks, dengan dukungan tool di API dan penalaran umum yang kuat. Anthropic memosisikan Claude Opus 4.6 sebagai model terpintarnya untuk coding, penalaran, dan pekerjaan agentic, dan kini semuanya tersedia melalui CometAPI.

API CometAPI saat ini sedang diskon 20%, dan dapat langsung menghasilkan playground. Dibandingkan solusi lain, CometAPI adalah pilihan yang jauh lebih baik; pada dasarnya ini adalah Cursor yang tidak memerlukan langganan.

Kesimpulan

Composer 2 bukan sekadar model Cursor incremental lainnya. Ini adalah upaya Cursor untuk mengatur ulang kurva price-performance bagi agen coding: hasil benchmark yang lebih kuat daripada para pendahulunya, desain yang berpusat pada perilaku agen jangka panjang, dan harga yang jauh di bawah alternatif frontier besar. Bukti dari Cursor sendiri menunjukkan peningkatan yang jelas dibanding Composer 1 dan 1.5, sementara harganya memangkas biaya Claude Opus 4.6 hingga 10x dan GPT-5.4 hingga 5x pada token input.

Bagi tim yang sudah hidup di ekosistem Cursor, Composer 2 adalah default yang menarik untuk banyak tugas coding. Untuk pekerjaan yang paling sulit, paling berisiko tinggi, atau dengan cakupan paling luas, Claude Opus 4.6 dan GPT-5.4 tetap menjadi benchmark premium untuk dibandingkan. Cerita sebenarnya adalah bahwa pasar coding frontier menjadi lebih tajam, lebih murah, dan lebih terspesialisasi secara bersamaan.

Jika Anda mencari alternatif untuk Cursor, atau API model mutakhir yang lebih murah seperti Claude Opus 4.6 dan GPT-5.4, maka CometAPI adalah pilihan terbaik. Siap mulai?