model
Masukan:$0.4/M
Keluaran:$2.4/M
Ikhtisar Kapabilitas Inti: Resolusi: Hingga 4K (4096×4096), setara dengan Pro. Konsistensi Gambar Referensi: Hingga 14 gambar referensi (10 objek + 4 karakter), mempertahankan konsistensi gaya/karakter. Rasio Aspek Ekstrem: Rasio baru 1:4, 4:1, 1:8, 8:1 ditambahkan, cocok untuk gambar panjang, poster, dan banner. Rendering Teks: Pembuatan teks tingkat lanjut, cocok untuk infografis dan tata letak poster pemasaran. Peningkatan Pencarian: Terintegrasi dengan Google Search + Pencarian Gambar. Grounding: Proses penalaran bawaan; prompt kompleks dinalar terlebih dahulu sebelum pembuatan.Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 adalah model bahasa besar kelas “Opus” dari Anthropic, dirilis pada Februari 2026. Model ini diposisikan sebagai andalan untuk pekerjaan berbasis pengetahuan dan alur kerja riset — meningkatkan penalaran dalam konteks panjang, perencanaan multi-langkah, penggunaan alat (termasuk alur kerja perangkat lunak berbasis agen), serta tugas penggunaan komputer seperti pembuatan slide dan spreadsheet secara otomatis.Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 adalah model Sonnet kami yang paling mumpuni sejauh ini. Ini merupakan peningkatan menyeluruh atas keahlian model di bidang pemrograman, penggunaan komputer, penalaran konteks panjang, perencanaan agen, pekerjaan berbasis pengetahuan, dan desain. Sonnet 4.6 juga menyertakan jendela konteks 1M token dalam tahap beta.Konteks:400,000
Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano dirancang untuk tugas-tugas di mana kecepatan dan biaya paling penting, seperti klasifikasi, ekstraksi data, pemeringkatan, dan sub-agen.Konteks:400,000
Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini menghadirkan keunggulan GPT-5.4 ke model yang lebih cepat dan lebih efisien, dirancang untuk beban kerja bervolume tinggi.Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview adalah model frontier kami yang paling mumpuni hingga saat ini, dan menunjukkan
lompatan skor yang mencolok pada banyak tolok ukur evaluasi dibandingkan dengan model frontier kami sebelumnya, Claude Opus 4.6.Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro adalah model fondasi unggulan Xiaomi, dengan total lebih dari 1T parameter dan panjang konteks 1M, yang dioptimalkan secara mendalam untuk skenario agentic. Model ini sangat mudah beradaptasi dengan kerangka agent umum seperti OpenClaw. Model ini berada di jajaran teratas global dalam tolok ukur standar PinchBench dan ClawBench, dengan performa yang dirasakan mendekati Opus 4.6. MiMo-V2-Pro dirancang untuk berfungsi sebagai otak sistem agent, mengorkestrasi alur kerja yang kompleks, mendorong tugas rekayasa produksi, dan memberikan hasil secara andal.Masukan:$0.32/M
Keluaran:$1.6/M
MiMo-V2-Omni adalah model omni-modal mutakhir yang secara native memproses input gambar, video, dan audio dalam satu arsitektur terpadu. Model ini menggabungkan persepsi multimodal yang kuat dengan kapabilitas agentik - visual grounding, perencanaan multi-langkah, penggunaan alat, dan eksekusi kode - sehingga sangat cocok untuk tugas dunia nyata yang kompleks dan mencakup berbagai modalitas. Jendela konteks 256K.Masukan:$0.24/M
Keluaran:$0.96/M
MiniMax-M2.7 menawarkan kecerdasan kelas teratas yang sama seperti versi standar—termasuk evolusi diri rekursif dan produktivitas perkantoran tingkat pakar—namun dirancang untuk aplikasi yang memerlukan latensi sub-detik dan generasi token berkecepatan tinggi. Dengan memanfaatkan arsitektur backbone inferensi yang ditingkatkan, kecepatan outputnya 66% lebih cepat daripada model standar (mencapai 100 tps). Ini adalah pilihan utama untuk asisten pemrograman interaktif, eksekusi loop agen secara real-time, dan pipeline perusahaan ber-throughput tinggi dengan persyaratan waktu penyelesaian yang ketat.Konteks:200k
Masukan:$0.96/M
Keluaran:$3.264/M
GLM-5 Turbo adalah model baru dari Z.ai yang dirancang untuk inferensi cepat dan kinerja yang kuat di lingkungan yang digerakkan oleh agen seperti skenario OpenClaw.Konteks:1,050,000
Masukan:$24/M
Keluaran:$144/M
Versi GPT-5.4 yang menghasilkan respons yang lebih cerdas dan lebih presisi.Konteks:1,050,000
Masukan:$2/M
Keluaran:$12/M
GPT-5.4 adalah model terdepan untuk pekerjaan profesional yang kompleks. Reasoning.effort mendukung: none (default), low, medium, high, dan xhigh.Masukan:$1.4/M
Keluaran:$11.2/M
Model GPT-5.3 Instant yang digunakan di ChatGPTMasukan:$0.2/M
Keluaran:$1.2/M
Gemini 3.1 Flash-Lite adalah model Tier-3 yang sangat efisien dari sisi biaya dan berlatensi rendah dalam seri Gemini 3 dari Google, dirancang untuk alur kerja AI produksi berskala besar di mana throughput dan kecepatan lebih penting daripada kedalaman penalaran maksimum. Model ini menggabungkan jendela konteks multimodal yang besar dengan kinerja inferensi yang efisien, dengan biaya lebih rendah dibandingkan kebanyakan model andalan.Konteks:200K
Masukan:$0.8/M
Keluaran:$4/M
Model tercepat dan paling hemat biaya.Per Detik:$0.24
Sora 2 Pro adalah model pembuatan media kami yang paling canggih dan kuat, mampu menghasilkan video dengan audio tersinkronisasi. Model ini dapat membuat klip video yang detail dan dinamis dari bahasa alami atau gambar.Per Detik:$0.08
Model generasi video yang sangat canggih, dengan efek suara, mendukung format chat.Per Permintaan:$0.6
Midjourney video generationMasukan:$0.16/M
Keluaran:$0.96/M
Sebagai model visi-bahasa native, QWEN3.5-397B-A17B dari seri Qwen3.5 unggul dalam evaluasi benchmarking yang komprehensif seperti inferensi, pemrograman, kapabilitas agen, dan pemahaman multimodal, membantu pengembang dan perusahaan secara signifikan meningkatkan produktivitas. Model ini menggunakan arsitektur hibrida inovatif yang menggabungkan attention linear (Gated Delta Networks) dengan pakar hibrida sparse (MoE) untuk mencapai efisiensi inferensi yang unggul: 397 miliar parameter total dan hanya 17 miliar parameter yang diaktifkan per propagasi maju, mengoptimalkan kecepatan dan biaya sambil mempertahankan kapabilitas. Kami juga telah memperluas dukungan bahasa dan dialek dari 119 menjadi 201, memberikan ketersediaan yang lebih luas dan dukungan yang lebih baik bagi pengguna di seluruh dunia.Konteks:2,000,000
Masukan:$1.6/M
Keluaran:$4.8/M
Rilis Grok 4.20 memperkenalkan arsitektur multiagen (beberapa agen terspesialisasi yang dikoordinasikan secara waktu nyata), mode konteks yang diperluas, serta peningkatan yang berfokus pada kemampuan mengikuti instruksi, pengurangan halusinasi, dan keluaran terstruktur/berbantuan alat.Per Detik:$0.04
Hasilkan video dari prompt teks, animasikan gambar statis, atau sunting video yang sudah ada dengan bahasa alami. API mendukung durasi, rasio aspek, dan resolusi yang dapat dikonfigurasi untuk video yang dihasilkan — dengan SDK yang secara otomatis menangani polling asinkron.Konteks:32,000
Masukan:$3.2/M
Keluaran:$12.8/M
Model suara terbaik untuk input audio, output audio.Masukan:$2/M
Keluaran:$8/M
Model suara terbaik untuk input audio dan output audio dengan Chat Completions.Konteks:400,000
Masukan:$1.4/M
Keluaran:$11.2/M
GPT-5.3-Codex dioptimalkan untuk tugas pengodean berbasis agen di Codex atau lingkungan serupa. GPT-5.3-Codex mendukung pengaturan upaya penalaran low, medium, high, dan xhigh.Per Permintaan:$0.028
Seedream 5.0 Lite adalah model generasi gambar multimodal terpadu yang dibekali kapabilitas pemikiran mendalam dan penelusuran online, serta menghadirkan peningkatan menyeluruh pada kemampuan pemahaman, penalaran, dan generasi.Masukan:$1.6/M
Keluaran:$9.6/M
Gemini 3.1 Pro adalah generasi berikutnya dalam seri model Gemini, berupa rangkaian model penalaran yang sangat mumpuni dan secara native bersifat multimodal. Gemini 3 Pro kini merupakan model paling canggih dari Google untuk tugas-tugas kompleks, dan mampu memahami kumpulan data yang sangat besar serta masalah-masalah menantang dari berbagai sumber informasi, termasuk teks, audio, gambar, video, dan seluruh repositori kodeMasukan:$0.32/M
Keluaran:$1.92/M
Model seri Plus Qwen3.5 visi-bahasa natif dibangun di atas arsitektur hibrida yang mengintegrasikan mekanisme atensi linear dengan model campuran ahli yang jarang, sehingga mencapai efisiensi inferensi yang lebih tinggi.Masukan:$0.48/M
Keluaran:$2.88/M
Model visi-bahasa native 397B-A17B dalam seri Qwen3.5 dibangun di atas arsitektur hibrida yang mengintegrasikan mekanisme atensi linear dengan model mixture-of-experts yang jarang, sehingga mencapai efisiensi inferensi yang lebih tinggi.Masukan:$0.024/M
Keluaran:$0.24/M
🔹 Seri Doubao Seed 2.0
doubao-seed-2-0-code-preview-260215
Berfokus pada kemampuan penalaran rantai panjang dan stabilitas pada tugas-tugas kompleks, diadaptasi untuk skenario kompleks di lingkungan bisnis nyata. Sebagai versi Seed 2.0 yang ditingkatkan untuk pengodean, model ini lebih cocok untuk Agentic Coding.
doubao-seed-2-0-lite-260215
Menyeimbangkan kualitas keluaran dengan kecepatan respons, sehingga cocok sebagai model tingkat produksi tujuan umum.
doubao-seed-2-0-mini-260215
Dirancang untuk skenario latensi rendah, konkurensi tinggi, dan sensitif biaya. Menekankan respons cepat dan penerapan inferensi yang fleksibel, serta mendukung kemampuan berpikir empat tingkat dan pemahaman multimodal.Masukan:$0.24/M
Keluaran:$0.96/M
MiniMax-M2.5 adalah model bahasa besar mutakhir yang dirancang untuk produktivitas dunia nyata. Dilatih dalam beragam lingkungan kerja digital dunia nyata yang kompleks, M2.5 dibangun di atas keahlian pengodean M2.1 untuk memperluas cakupan ke pekerjaan perkantoran umum, menjadi mahir dalam menghasilkan dan mengoperasikan file Word, Excel, dan Powerpoint, beralih konteks di antara berbagai lingkungan perangkat lunak, serta bekerja lintas tim agen maupun manusia.