Spesifikasi teknis MiniMax‑M2.5
| Field | Claim / value |
|---|---|
| Model name | MiniMax-M2.5 (rilis produksi, 12 Feb 2026). |
| Architecture | Transformer Mixture-of-Experts (MoE) (keluarga M2). |
| Total parameters | ~230 miliar (kapasitas MoE total). |
| Active (per-inference) parameters | ~10 miliar diaktifkan per inferensi (aktivasi jarang). |
| Input types | Teks dan kode (dukungan native untuk konteks kode multi-berkas), pemanggilan alat / antarmuka alat API (alur kerja berbasis agen). |
| Output types | Teks, keluaran terstruktur (JSON/panggilan alat), kode (multi-berkas), artefak Office (PPT/Excel/Word melalui rantai alat). |
| Variants / modes | M2.5 (akurasi/kapabilitas tinggi) dan M2.5-Lightning (kualitas sama, latensi lebih rendah / TPS lebih tinggi). |
Apa itu MiniMax‑M2.5?
MiniMax‑M2.5 adalah pembaruan andalan keluarga M2.x yang berfokus pada produktivitas dunia nyata dan alur kerja berbasis agen. Rilis ini menekankan peningkatan dekomposisi tugas, integrasi alat/penelusuran, fidelitas generasi kode, dan efisiensi token untuk masalah panjang multi-langkah. Model ini ditawarkan dalam varian standar dan varian “lightning” berlatensi lebih rendah untuk trade-off penerapan yang berbeda.
Fitur utama MiniMax‑M2.5
- Desain yang mengutamakan agen: Perencanaan dan orkestrasi alat yang lebih baik untuk tugas multi‑tahap (penelusuran, panggilan alat, kerangka eksekusi kode).
- Efisiensi token: Penurunan konsumsi token per tugas dibandingkan M2.1, memungkinkan biaya end‑to‑end lebih rendah untuk alur kerja yang panjang.
- Penyelesaian end‑to‑end lebih cepat: Benchmarking penyedia melaporkan waktu penyelesaian tugas rata‑rata ~37% lebih cepat dibanding M2.1 pada evaluasi pengodean berbasis agen.
- Pemahaman kode yang kuat: Disetel pada korpus kode multi‑bahasa untuk refaktor lintas bahasa yang andal, penyuntingan multi‑berkas, dan penalaran skala repositori.
- Penyajian throughput tinggi: Ditujukan untuk penerapan produksi dengan profil token/detik tinggi; cocok untuk beban kerja agen berkelanjutan.
- Varian untuk trade‑off latensi vs. daya: M2.5‑lightning menawarkan latensi lebih rendah dengan komputasi dan jejak yang lebih kecil untuk skenario interaktif.
Kinerja benchmark (dilaporkan)
Sorotan yang dilaporkan penyedia — metrik representatif (rilis):
- SWE‑Bench Verified: 80,2% (tingkat lulus yang dilaporkan pada harness benchmark penyedia)
- BrowseComp (pencarian & penggunaan alat): 76,3%
- Multi‑SWE‑Bench (pengodean multi‑bahasa): 51,3%
- Kecepatan / efisiensi relatif: ~37% lebih cepat penyelesaian end‑to‑end vs M2.1 pada SWE‑Bench Verified dalam uji penyedia; ~20% lebih sedikit putaran pencarian/alat dalam beberapa evaluasi.
Interpretasi: Angka‑angka ini menempatkan M2.5 setara atau mendekati model agen/kode terdepan di industri pada benchmark yang disebutkan. Benchmark dilaporkan oleh penyedia dan direproduksi oleh beberapa outlet dalam ekosistem — perlakukan sebagai hasil yang diukur di bawah harness/konfigurasi penyedia kecuali direproduksi secara independen.
MiniMax‑M2.5 vs rekan sejawat (perbandingan ringkas)
| Dimensi | MiniMax‑M2.5 | MiniMax M2.1 | Contoh rekan (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80,2% | ~71–76% (bervariasi menurut harness) | Sebanding (Opus dilaporkan hasil dekat puncak) |
| Kecepatan tugas berbasis agen | 37% lebih cepat vs M2.1 (uji penyedia) | Baseline | Kecepatan serupa pada harness tertentu |
| Efisiensi token | Meningkat vs M2.1 (~token per tugas lebih rendah) | Penggunaan token lebih tinggi | Kompetitif |
| Penggunaan terbaik | Alur kerja agen produksi, pipeline pengodean | Generasi sebelumnya dari keluarga yang sama | Unggul pada penalaran multimodal dan tugas yang disetel untuk keselamatan |
Catatan penyedia: perbandingan berasal dari materi rilis dan laporan benchmark vendor. Perbedaan kecil dapat sensitif pada harness, rantai alat, dan protokol evaluasi.
Kasus penggunaan perusahaan yang representatif
- Refaktor skala repositori & pipeline migrasi — mempertahankan maksud di seluruh penyuntingan multi‑berkas dan patch PR otomatis.
- Orkestrasi berbasis agen untuk DevOps — mengorkestrasi pelaksanaan pengujian, langkah CI, pemasangan paket, dan diagnostik lingkungan dengan integrasi alat.
- Tinjauan kode & remediasi otomatis — triase kerentanan, mengusulkan perbaikan minimal, dan menyiapkan kasus uji yang dapat direproduksi.
- Pengambilan informasi berbasis pencarian — memanfaatkan kompetensi pencarian setara BrowseComp untuk melakukan eksplorasi multi‑putaran dan peringkasan basis pengetahuan teknis.
- Agen & asisten produksi — agen berkelanjutan yang memerlukan inferensi jangka panjang yang hemat biaya dan stabil.
Cara mengakses dan mengintegrasikan MiniMax‑M2.5
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke konsol CometAPI. Dapatkan kunci API sebagai kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
Langkah 2: Kirim permintaan ke API minimax-m2.5
Pilih endpoint “minimax-m2.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API di situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. Di mana memanggilnya: format Chat.
Masukkan pertanyaan atau permintaan Anda ke dalam kolom content—ini yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan verifikasi hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah pemrosesan, API merespons dengan status tugas dan data keluaran.