API MiniMax M2.5 Terjangkau | text-to-text

Spesifikasi teknis MiniMax‑M2.5

Bidang	Klaim / nilai
Nama model	MiniMax-M2.5 (rilis produksi, 12 Februari 2026).
Arsitektur	Transformer Mixture-of-Experts (MoE) (keluarga M2).
Total parameter	~230 miliar (kapasitas MoE total).
Parameter aktif (per-inferensi)	~10 miliar diaktifkan per inferensi (aktivasi jarang).
Jenis input	Teks dan kode (dukungan bawaan untuk konteks kode multi-berkas), pemanggilan alat / antarmuka alat API (alur kerja agentik).
Jenis output	Teks, keluaran terstruktur (JSON/pemanggilan alat), kode (multi-berkas), artefak Office (PPT/Excel/Word melalui rantai alat).
Varian / mode	M2.5 (akurasi/kapabilitas tinggi) dan M2.5-Lightning (kualitas sama, latensi lebih rendah / TPS lebih tinggi).

Apa itu MiniMax‑M2.5?

MiniMax‑M2.5 adalah pembaruan andalan keluarga M2.x yang berfokus pada produktivitas dunia nyata dan alur kerja agentik. Rilis ini menekankan peningkatan dekomposisi tugas, integrasi alat/pencarian, fidelitas generasi kode, dan efisiensi token untuk masalah yang panjang dan multi‑langkah. Model ini ditawarkan dalam varian standar dan varian “lightning” berlatensi lebih rendah untuk pertukaran kebutuhan penerapan yang berbeda.

Fitur utama MiniMax‑M2.5

Desain agentic-first: Perencanaan dan orkestrasi alat yang ditingkatkan untuk tugas multi‑tahap (pencarian, pemanggilan alat, kerangka eksekusi kode).
Efisiensi token: Penurunan konsumsi token per tugas dibanding M2.1, memungkinkan biaya ujung-ke-ujung lebih rendah untuk alur kerja panjang.
Penyelesaian ujung-ke-ujung lebih cepat: Benchmark penyedia melaporkan waktu penyelesaian tugas rata‑rata ~37% lebih cepat daripada M2.1 pada evaluasi pengkodean agentik.
Pemahaman kode yang kuat: Disetel pada korpus kode multi‑bahasa untuk refaktor lintas bahasa yang andal, penyuntingan multi‑berkas, dan penalaran skala repositori.
Penyajian throughput tinggi: Ditargetkan untuk penerapan produksi dengan profil token/detik tinggi; cocok untuk beban kerja agen kontinu.
Varian untuk pertukaran latensi vs. daya: M2.5‑lightning menawarkan latensi lebih rendah pada komputasi dan jejak yang lebih kecil untuk skenario interaktif.

Kinerja benchmark (dilaporkan)

Sorotan yang dilaporkan penyedia — metrik representatif (rilis):

SWE‑Bench Verified: 80,2% (tingkat kelulusan yang dilaporkan pada harness benchmark penyedia)
BrowseComp (pencarian & penggunaan alat): 76,3%
Multi‑SWE‑Bench (pengodean multi‑bahasa): 51,3%
Kecepatan / efisiensi relatif: ~37% lebih cepat penyelesaian ujung-ke-ujung vs M2.1 pada SWE‑Bench Verified dalam pengujian penyedia; ~20% lebih sedikit putaran pencarian/al alat di beberapa evaluasi.

Interpretasi: Angka‑angka ini menempatkan M2.5 setara atau mendekati model agentik/kode terdepan industri pada benchmark yang disebutkan. Benchmark dilaporkan oleh penyedia dan direproduksi oleh beberapa kanal ekosistem — perlakukan sebagai pengukuran di bawah harness/konfigurasi penyedia kecuali direproduksi secara independen.

MiniMax‑M2.5 vs pesaing (perbandingan ringkas)

Dimensi	MiniMax‑M2.5	MiniMax M2.1	Contoh pesaing (Anthropic Opus 4.6)
SWE‑Bench Verified	80,2%	~71–76% (bervariasi menurut harness)	Sebanding (Opus dilaporkan dengan hasil hampir teratas)
Kecepatan tugas agentik	37% lebih cepat vs M2.1 (uji penyedia)	Baseline	Kecepatan serupa pada harness tertentu
Efisiensi token	Meningkat vs M2.1 (~lebih sedikit token per tugas)	Penggunaan token lebih tinggi	Kompetitif
Penggunaan terbaik	Alur kerja agentik produksi, pipeline pengodean	Generasi sebelumnya dari keluarga yang sama	Kuat pada penalaran multimodal dan tugas yang disetel untuk keselamatan

Catatan penyedia: perbandingan berasal dari materi rilis dan laporan benchmark vendor. Perbedaan kecil bisa sensitif terhadap harness, rantai alat, dan protokol evaluasi.

Contoh kasus penggunaan perusahaan yang representatif

Refaktor skala repositori & pipeline migrasi — mempertahankan maksud di seluruh penyuntingan multi‑berkas dan patch PR otomatis.
Orkestrasi agentik untuk DevOps — mengorkestrasi menjalankan pengujian, langkah CI, instalasi paket, dan diagnostik lingkungan dengan integrasi alat.
Tinjau kode otomatis & remediasi — triase kerentanan, mengusulkan perbaikan minimal, dan menyiapkan kasus uji yang dapat direproduksi.
Pengambilan informasi berbasis pencarian — memanfaatkan kompetensi pencarian setingkat BrowseComp untuk melakukan eksplorasi multi‑putaran dan peringkasan basis pengetahuan teknis.
Agen & asisten produksi — agen kontinu yang memerlukan inferensi jangka panjang yang hemat biaya dan stabil.

Cara mengakses dan mengintegrasikan MiniMax‑M2.5

Langkah 1: Daftar untuk Kunci API

Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.

Langkah 2: Kirim Permintaan ke API `minimax-m2.5`

Pilih endpoint “minimax-m2.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan uji Apifox untuk kemudahan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI aktual dari akun Anda. Tempat untuk memanggilnya: format Chat.

Masukkan pertanyaan atau permintaan Anda ke bidang content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.

Langkah 3: Ambil dan Verifikasi Hasil

Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.

MiniMax-M2.5 dioptimalkan untuk produktivitas dunia nyata dan alur kerja berbasis agen — terutama pengodean kompleks, perencanaan multi-tahap, pemanggilan tool, pencarian, dan pengembangan sistem lintas platform. Pelatihannya menekankan kemampuan menangani siklus hidup pengembangan secara penuh, dari perencanaan arsitektur hingga tinjauan kode dan pengujian.

Dibandingkan dengan M2.1, M2.5 menunjukkan peningkatan signifikan dalam dekomposisi tugas, efisiensi token, dan kecepatan — misalnya menyelesaikan beberapa tolok ukur berbasis agen sekitar 37% lebih cepat dan dengan lebih sedikit token yang digunakan per tugas.

M2.5 mencapai sekitar 80.2% pada SWE-Bench Verified, sekitar 51.3% pada Multi-SWE-Bench, dan kira-kira 76.3% pada BrowseComp dalam konteks di mana perencanaan tugas dan pencarian diaktifkan — hasil yang kompetitif dengan model andalan dari penyedia lain.

Ya — M2.5 dilatih pada lebih dari 10 bahasa pemrograman termasuk Python, Java, Rust, Go, TypeScript, C/C++, Ruby, dan Dart, memungkinkannya menangani beragam tugas pemrograman di berbagai ekosistem.

Ya — MiniMax memposisikan M2.5 untuk menangani proyek full-stack yang mencakup Web, Android, iOS, Windows, dan Mac, meliputi fase desain, implementasi, iterasi, dan pengujian.

M2.5 dapat berjalan dengan throughput token yang tinggi (e.g., ~100 tokens/sec) dengan efisiensi biaya sekitar 10–20× lebih rendah daripada banyak model frontier berdasarkan harga keluaran, sehingga memungkinkan penerapan alur kerja berbasis agen yang dapat diskalakan.

MiniMax-M2.5 tersedia melalui endpoint API (e.g., varian standar dan throughput tinggi) dengan menentukan minimax-m2.5 sebagai model dalam permintaan.

M2.5 unggul dalam tugas pemrograman dan tugas berbasis agen; model ini mungkin kurang terspesialisasi untuk pembuatan narasi yang sepenuhnya kreatif dibandingkan model kreatif khusus, sehingga untuk penulisan cerita atau fiksi kreatif, model lain mungkin lebih disukai.

Harga Comet (USD / M Tokens)	Harga Resmi (USD / M Tokens)	Diskon
Masukan:$0.24/M Keluaran:$0.96/M	Masukan:$0.3/M Keluaran:$1.2/M	-20%