Spesifikasi teknis MiniMax‑M2.5
| Bidang | Klaim / nilai |
|---|---|
| Nama model | MiniMax‑M2.5 (rilis produksi, 12 Feb 2026). |
| Arsitektur | Transformer Mixture‑of‑Experts (MoE) (keluarga M2). |
| Total parameter | ~230 miliar (kapasitas total MoE). |
| Parameter aktif (per inferensi) | ~10 miliar diaktifkan per inferensi (aktivasi sparse). |
| Jenis input | Teks dan kode (dukungan bawaan untuk konteks kode multi‑berkas), pemanggilan alat / antarmuka alat API (alur kerja agentik). |
| Jenis output | Teks, output terstruktur (JSON/pemanggilan alat), kode (multi‑berkas), artefak Office (PPT/Excel/Word melalui rantai alat). |
| Varian / mode | M2.5 (akurasi/kapabilitas tinggi) dan M2.5‑Lightning (kualitas sama, latensi lebih rendah / TPS lebih tinggi). |
Apa itu MiniMax‑M2.5?
MiniMax‑M2.5 adalah pembaruan andalan keluarga M2.x yang berfokus pada produktivitas dunia nyata dan alur kerja agentik. Rilis ini menekankan peningkatan dekomposisi tugas, integrasi alat/pencarian, fidelitas generasi kode, serta efisiensi token untuk masalah panjang bertahap. Model ini ditawarkan dalam varian standar dan varian “lightning” berlatensi lebih rendah yang ditujukan untuk kompromi penerapan yang berbeda.
Fitur utama MiniMax‑M2.5
- Desain agentic‑first: Perencanaan dan orkestrasi alat yang ditingkatkan untuk tugas multi‑tahap (pencarian, pemanggilan alat, kerangka eksekusi kode).
- Efisiensi token: Penurunan konsumsi token per tugas dibandingkan M2.1, memungkinkan biaya end‑to‑end yang lebih rendah untuk alur kerja panjang.
- Penyelesaian end‑to‑end lebih cepat: Benchmarking penyedia melaporkan waktu penyelesaian tugas rata‑rata ~37% lebih cepat daripada M2.1 pada evaluasi pengodean agentik.
- Pemahaman kode yang kuat: Disetel pada korpus kode multibahasa untuk refaktor lintas bahasa yang andal, penyuntingan multi‑berkas, dan penalaran skala repositori.
- Penyajian throughput tinggi: Ditujukan untuk penerapan produksi dengan profil token/detik tinggi; cocok untuk beban kerja agen berkelanjutan.
- Varian untuk kompromi latensi vs. daya: M2.5‑lightning menawarkan latensi lebih rendah dengan komputasi dan jejak yang lebih kecil untuk skenario interaktif.
Performa benchmark (dilaporkan)
Sorotan yang dilaporkan penyedia — metrik representatif (rilis):
- SWE‑Bench Verified: 80.2% (tingkat kelulusan yang dilaporkan pada harness benchmark penyedia)
- BrowseComp (search & tool use): 76.3%
- Multi‑SWE‑Bench (multi‑language coding): 51.3%
- Kecepatan / efisiensi relatif: ~37% penyelesaian end‑to‑end lebih cepat vs M2.1 pada SWE‑Bench Verified dalam pengujian penyedia; ~20% putaran pencarian/alat lebih sedikit dalam beberapa evaluasi.
Interpretasi: Angka‑angka ini menempatkan M2.5 setara atau mendekati model agen/kode terdepan industri pada benchmark yang disebutkan. Benchmark dilaporkan oleh penyedia dan direproduksi oleh beberapa pihak ekosistem — perlakukan sebagai diukur di bawah harness/konfigurasi penyedia kecuali direproduksi secara independen.
MiniMax‑M2.5 vs rekan selevel (perbandingan ringkas)
| Dimensi | MiniMax‑M2.5 | MiniMax M2.1 | Contoh rekan (Anthropic Opus 4.6) |
|---|---|---|---|
| SWE‑Bench Verified | 80.2% | ~71–76% (bervariasi menurut harness) | Sebanding (Opus melaporkan hasil mendekati puncak) |
| Kecepatan tugas agentik | 37% lebih cepat vs M2.1 (uji penyedia) | Basis | Kecepatan serupa pada harness tertentu |
| Efisiensi token | Meningkat vs M2.1 (~token per tugas lebih sedikit) | Penggunaan token lebih tinggi | Kompetitif |
| Penggunaan terbaik | Alur kerja agentik produksi, pipeline pengodean | Generasi sebelumnya dari keluarga yang sama | Kuat pada penalaran multimodal dan tugas yang diatur keamanannya |
Catatan penyedia: perbandingan berasal dari materi rilis dan laporan benchmark vendor. Perbedaan kecil dapat sensitif terhadap harness, rantai alat, dan protokol evaluasi.
Kasus penggunaan enterprise yang representatif
- Refaktor skala repositori & pipeline migrasi — menjaga intent di seluruh penyuntingan multi‑berkas dan patch PR otomatis.
- Orkestrasi agentik untuk DevOps — mengorkestrasi menjalankan pengujian, langkah‑langkah CI, instalasi paket, dan diagnostik lingkungan dengan integrasi alat.
- Tinjauan kode otomatis & remediasi — melakukan triase kerentanan, mengusulkan perbaikan minimal, dan menyiapkan kasus uji yang dapat direproduksi.
- Pengambilan informasi berbasis pencarian — memanfaatkan kompetensi pencarian tingkat BrowseComp untuk melakukan eksplorasi multi‑putaran dan peringkasan basis pengetahuan teknis.
- Agen & asisten produksi — agen berkelanjutan yang memerlukan inferensi jangka panjang yang hemat biaya dan stabil.
Cara mengakses dan mengintegrasikan MiniMax‑M2.5
Langkah 1: Daftar untuk Kunci API
Masuk ke cometapi.com. Jika Anda belum menjadi pengguna kami, silakan daftar terlebih dahulu. Masuk ke Konsol CometAPI. Dapatkan kunci API kredensial akses untuk antarmuka. Klik “Add Token” pada token API di pusat pribadi, dapatkan kunci token: sk-xxxxx dan kirim.
Langkah 2: Kirim Permintaan ke API minimax-m2.5
Pilih endpoint “minimax-m2.5” untuk mengirim permintaan API dan atur body permintaan. Metode permintaan dan body permintaan diperoleh dari dokumen API situs web kami. Situs kami juga menyediakan pengujian Apifox untuk kenyamanan Anda. Ganti <YOUR_API_KEY> dengan kunci CometAPI Anda yang sebenarnya dari akun Anda. Di mana memanggilnya: format Chat.
Masukkan pertanyaan atau permintaan Anda ke kolom content—itulah yang akan direspons oleh model. Proses respons API untuk mendapatkan jawaban yang dihasilkan.
Langkah 3: Ambil dan Verifikasi Hasil
Proses respons API untuk mendapatkan jawaban yang dihasilkan. Setelah diproses, API merespons dengan status tugas dan data keluaran.