Spesifikasi teknis MiniMax‑M2.5
| Bidang | Klaim / nilai |
|---|---|
| Nama model | MiniMax-M2.5 (rilis produksi, 12 Februari 2026). |
| Arsitektur | Transformer Mixture-of-Experts (MoE) (keluarga M2). |
| Total parameter | ~230 miliar (kapasitas MoE total). |
| Parameter aktif (per-inferensi) | ~10 miliar diaktifkan per inferensi (aktivasi jarang). |
| Jenis input | Teks dan kode (dukungan bawaan untuk konteks kode multi-berkas), pemanggilan alat / antarmuka alat API (alur kerja agentik). |
| Jenis output | Teks, keluaran terstruktur (JSON/pemanggilan alat), kode (multi-berkas), artefak Office (PPT/Excel/Word melalui rantai alat). |
| Varian / mode | M2.5 (akurasi/kapabilitas tinggi) dan M2.5-Lightning (kualitas sama, latensi lebih rendah / TPS lebih tinggi). |
Apa itu MiniMax‑M2.5?
MiniMax‑M2.5 adalah pembaruan andalan keluarga M2.x yang berfokus pada produktivitas dunia nyata dan alur kerja agentik. Rilis ini menekankan peningkatan dekomposisi tugas, integrasi alat/pencarian, fidelitas generasi kode, dan efisiensi token untuk masalah yang panjang dan multi‑langkah. Model ini ditawarkan dalam varian standar dan varian “lightning” berlatensi lebih rendah untuk pertukaran kebutuhan penerapan yang berbeda.
Fitur utama MiniMax‑M2.5
- Desain agentic-first: Perencanaan dan orkestrasi alat yang ditingkatkan untuk tugas multi‑tahap (pencarian, pemanggilan alat, kerangka eksekusi kode).
- Efisiensi token: Penurunan konsumsi token per tugas dibanding M2.1, memungkinkan biaya ujung-ke-ujung lebih rendah untuk alur kerja panjang.
- Penyelesaian ujung-ke-ujung lebih cepat: Benchmark penyedia melaporkan waktu penyelesaian tugas rata‑rata ~37% lebih cepat daripada M2.1 pada evaluasi pengkodean agentik.
- Pemahaman kode yang kuat: Disetel pada korpus kode multi‑bahasa untuk refaktor lintas bahasa yang andal, penyuntingan multi‑berkas, dan penalaran skala repositori.
- Penyajian throughput tinggi: Ditargetkan untuk penerapan produksi dengan profil token/detik tinggi; cocok untuk beban kerja agen kontinu.
- Varian untuk pertukaran latensi vs. daya: M2.5‑lightning menawarkan latensi lebih rendah pada komputasi dan jejak yang lebih kecil untuk skenario interaktif.
Kinerja benchmark (dilaporkan)
Sorotan yang dilaporkan penyedia — metrik representatif (rilis):
- SWE‑Bench Verified: 80,2% (tingkat kelulusan yang dilaporkan pada harness benchmark penyedia)
- BrowseComp (pencarian & penggunaan alat): 76,3%
- Multi‑SWE‑Bench (pengodean multi‑bahasa): 51,3%
- Kecepatan / efisiensi relatif: ~37% lebih cepat penyelesaian ujung-ke-ujung vs M2.1 pada SWE‑Bench Verified dalam pengujian penyedia; ~20% lebih sedikit putaran pencarian/al alat di beberapa evaluasi.
Interpretasi: Angka‑angka ini menempatkan M2.5 setara atau mendekati model agentik/kode terdepan industri pada benchmark yang disebutkan. Benchmark dilaporkan oleh penyedia dan direproduksi oleh beberapa kanal ekosistem — perlakukan sebagai pengukuran di bawah harness/konfigurasi penyedia kecuali direproduksi secara independen.
MiniMax‑M2.5 vs pesaing (perbandingan ringkas)
| Dimensi | MiniMax‑M2.5 | MiniMax M2.1 | Contoh pesaing (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80,2% | ~71–76% (bervariasi menurut harness) | Sebanding (Opus dilaporkan dengan hasil hampir teratas) |
| Kecepatan tugas agentik | 37% lebih cepat vs M2.1 (uji penyedia) | Baseline | Kecepatan serupa pada harness tertentu |
| Efisiensi token | Meningkat vs M2.1 (~lebih sedikit token per tugas) | Penggunaan token lebih tinggi | Kompetitif |
| Penggunaan terbaik | Alur kerja agentik produksi, pipeline pengodean | Generasi sebelumnya dari keluarga yang sama | Kuat pada penalaran multimodal dan tugas yang disetel untuk keselamatan |
Catatan penyedia: perbandingan berasal dari materi rilis dan laporan benchmark vendor. Perbedaan kecil bisa sensitif terhadap harness, rantai alat, dan protokol evaluasi.
Contoh kasus penggunaan perusahaan yang representatif
- Refaktor skala repositori & pipeline migrasi — mempertahankan maksud di seluruh penyuntingan multi‑berkas dan patch PR otomatis.
- Orkestrasi agentik untuk DevOps — mengorkestrasi menjalankan pengujian, langkah CI, instalasi paket, dan diagnostik lingkungan dengan integrasi alat.
- Tinjau kode otomatis & remediasi — triase kerentanan, mengusulkan perbaikan minimal, dan menyiapkan kasus uji yang dapat direproduksi.
- Pengambilan informasi berbasis pencarian — memanfaatkan kompetensi pencarian setingkat BrowseComp untuk melakukan eksplorasi multi‑putaran dan peringkasan basis pengetahuan teknis.
- Agen & asisten produksi — agen kontinu yang memerlukan inferensi jangka panjang yang hemat biaya dan stabil.
Cara mengakses dan mengintegrasikan MiniMax‑M2.5
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke CometAPI console. Dapatkan kredensial akses kunci API antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirimkan.
Langkah 2: Kirim Permintaan ke API minimax-m2.5
Pilih endpoint “minimax-m2.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs kami. Situs kami juga menyediakan uji Apifox untuk kemudahan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI aktual dari akun Anda. Tempat untuk memanggilnya: format Chat.
Masukkan pertanyaan atau permintaan Anda ke bidang content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.