model-model
Masukan:$0.4/M
Keluaran:$2.4/M
Gambaran Keseluruhan Keupayaan Teras: Resolusi: Sehingga 4K (4096×4096), setara dengan Pro. Ketekalan Imej Rujukan: Sehingga 14 imej rujukan (10 objek + 4 watak), mengekalkan ketekalan gaya/watak. Nisbah Aspek Melampau: Nisbah baharu 1:4, 4:1, 1:8, 8:1 ditambah, sesuai untuk imej panjang, poster dan sepanduk. Penjanaan Teks: Penjanaan teks lanjutan, sesuai untuk infografik dan susun atur poster pemasaran. Peningkatan Carian: Carian Google + Carian Imej bersepadu. Pembumian: Proses pemikiran terbina dalam; arahan kompleks dirasionalkan sebelum penjanaan.Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 ialah model bahasa besar kelas “Opus” oleh Anthropic, dikeluarkan pada Februari 2026. Ia diposisikan sebagai tulang belakang untuk kerja berpengetahuan dan aliran kerja penyelidikan — menambah baik penaakulan berkonteks panjang, perancangan berbilang langkah, penggunaan alat (termasuk aliran kerja perisian berasaskan ejen), dan tugas penggunaan komputer seperti penjanaan slaid dan hamparan automatik.Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 ialah model Sonnet kami yang paling berkeupayaan setakat ini. Ia merupakan peningkatan menyeluruh terhadap kemahiran model yang meliputi pengaturcaraan, penggunaan komputer, penaakulan konteks panjang, perancangan agen, kerja berasaskan pengetahuan, dan reka bentuk. Sonnet 4.6 turut menampilkan tetingkap konteks 1M token dalam beta.Konteks:400,000
Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano direka untuk tugasan yang amat mengutamakan kelajuan dan kos, seperti pengelasan, pengekstrakan data, pemeringkatan dan sub-agen.Konteks:400,000
Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini membawa kekuatan GPT-5.4 ke dalam model yang lebih pantas dan lebih cekap, direka untuk beban kerja berskala besar.Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview ialah model terdepan kami yang paling berkemampuan setakat ini, dan menunjukkan
lonjakan yang ketara dalam skor pada banyak penanda aras penilaian berbanding model terdepan kami sebelum ini, Claude Opus 4.6.Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro ialah model asas perdana daripada Xiaomi, menampilkan lebih daripada 1T jumlah parameter dan panjang konteks 1M, yang dioptimumkan secara mendalam untuk senario berasaskan agen. Ia sangat mudah disesuaikan dengan rangka kerja agen umum seperti OpenClaw. Ia berada pada peringkat teratas global dalam penanda aras standard PinchBench dan ClawBench, dengan prestasi yang diperhatikan menghampiri Opus 4.6. MiMo-V2-Pro direka untuk berperanan sebagai otak sistem agen, menyelaras aliran kerja yang kompleks, memacu tugasan kejuruteraan pengeluaran, dan menyampaikan hasil secara boleh dipercayai.Masukan:$0.32/M
Keluaran:$1.6/M
MiMo-V2-Omni ialah model omni-modal termaju yang memproses input imej, video dan audio secara natif dalam seni bina bersatu. Ia menggabungkan persepsi multimodal yang kukuh dengan keupayaan agentik - visual grounding, perancangan berbilang langkah, penggunaan alat dan pelaksanaan kod - menjadikannya sangat sesuai untuk tugasan dunia sebenar yang kompleks merentas modaliti. Tetingkap konteks 256K.Masukan:$0.24/M
Keluaran:$0.96/M
MiniMax-M2.7 menawarkan kecerdasan bertaraf tertinggi yang sama seperti versi standard—termasuk evolusi kendiri rekursif dan produktiviti pejabat pada tahap pakar—tetapi direka untuk aplikasi yang memerlukan kependaman di bawah satu saat dan penjanaan token berkelajuan tinggi. Dengan memanfaatkan seni bina tulang belakang inferens yang dipertingkat, kelajuan keluarannya adalah 66% lebih pantas berbanding model standard (mencapai 100 tps). Ia merupakan pilihan utama untuk pembantu pengaturcaraan interaktif, pelaksanaan gelung ejen masa nyata, dan saluran pemprosesan perusahaan berkapasiti tinggi dengan keperluan masa siap yang ketat.Konteks:200k
Masukan:$0.96/M
Keluaran:$3.264/M
GLM-5 Turbo ialah model baharu daripada Z.ai yang direka untuk inferens pantas dan prestasi mantap dalam persekitaran dipacu ejen seperti senario OpenClaw.Konteks:1,050,000
Masukan:$24/M
Keluaran:$144/M
Versi GPT-5.4 yang menghasilkan respons yang lebih pintar dan lebih tepat.Konteks:1,050,000
Masukan:$2/M
Keluaran:$12/M
GPT-5.4 ialah model termaju untuk kerja profesional yang kompleks. Reasoning.effort menyokong: tiada (lalai), rendah, sederhana, tinggi dan xhigh.Masukan:$1.4/M
Keluaran:$11.2/M
Model GPT-5.3 Instant yang digunakan dalam ChatGPTMasukan:$0.2/M
Keluaran:$1.2/M
Gemini 3.1 Flash-Lite ialah model Tier-3 yang sangat menjimatkan kos dan berlatensi rendah dalam Siri Gemini 3 Google, direka untuk aliran kerja AI pengeluaran bervolum tinggi, di mana throughput dan kelajuan lebih diutamakan daripada kedalaman penaakulan maksimum. Ia menggabungkan tetingkap konteks multimodal yang besar dengan prestasi inferens yang cekap pada kos yang lebih rendah berbanding kebanyakan model flagship.Konteks:200K
Masukan:$0.8/M
Keluaran:$4/M
Model terpantas, paling berkesan dari segi kos.Setiap Saat:$0.24
Sora 2 Pro ialah model generatif media kami yang paling canggih dan berkuasa, mampu menjana video dengan Audio yang disegerakkan. Ia boleh mencipta klip video yang terperinci dan dinamik daripada bahasa semula jadi atau imej.Setiap Saat:$0.08
Model penjanaan video yang sangat berkuasa, dengan kesan bunyi, menyokong format sembang.Setiap Permintaan:$0.6
Midjourney video generationMasukan:$0.16/M
Keluaran:$0.96/M
Sebagai model visi-bahasa asli, QWEN3.5-397B-A17B dalam siri Qwen3.5 cemerlang dalam penilaian penanda aras yang komprehensif seperti inferens, pengaturcaraan, keupayaan ejen dan pemahaman multimodal, membantu pembangun dan perusahaan meningkatkan produktiviti dengan ketara. Model ini menggunakan seni bina hibrid inovatif yang menggabungkan perhatian linear (Gated Delta Networks) dengan pakar hibrid jarang (MoE) untuk mencapai kecekapan inferens yang cemerlang: jumlah parameter 397 bilion dan hanya 17 bilion parameter diaktifkan bagi setiap propagasi ke hadapan, mengoptimumkan kelajuan dan kos sambil mengekalkan keupayaan. Kami juga telah memperluas sokongan bahasa dan dialek kami daripada 119 kepada 201, menyediakan ketersediaan yang lebih luas dan sokongan yang lebih baik untuk pengguna di seluruh dunia.Konteks:2,000,000
Masukan:$1.6/M
Keluaran:$4.8/M
Keluaran Grok 4.20 memperkenalkan seni bina berbilang ejen (beberapa ejen khusus yang dikoordinasikan secara masa nyata), mod konteks yang diperluas, serta penambahbaikan tertumpu pada pematuhan arahan, pengurangan halusinasi, dan output berstruktur/berbantukan alat.Setiap Saat:$0.04
Hasilkan video daripada gesaan teks, animasikan imej pegun, atau sunting video sedia ada menggunakan bahasa semula jadi. API menyokong tempoh, nisbah aspek dan resolusi yang boleh dikonfigurasi untuk video yang dijana — dengan SDK mengendalikan polling asinkron secara automatik.Konteks:32,000
Masukan:$3.2/M
Keluaran:$12.8/M
Model suara terbaik untuk input audio dan output audio.Masukan:$2/M
Keluaran:$8/M
Model suara terbaik untuk audio masuk, audio keluar dengan Chat CompletionsKonteks:400,000
Masukan:$1.4/M
Keluaran:$11.2/M
GPT-5.3-Codex dioptimumkan untuk tugas pengekodan berorientasikan agen dalam Codex atau persekitaran yang serupa. GPT-5.3-Codex menyokong tetapan tahap usaha penaakulan rendah, sederhana, tinggi, dan xhigh.Setiap Permintaan:$0.028
Seedream 5.0 Lite ialah model penjanaan imej multimodal bersepadu yang dilengkapi dengan keupayaan pemikiran mendalam dan carian dalam talian, serta menampilkan peningkatan menyeluruh dalam keupayaan pemahaman, penaakulan dan penjanaan.Masukan:$1.6/M
Keluaran:$9.6/M
Gemini 3.1 Pro ialah generasi seterusnya dalam siri model Gemini, iaitu satu himpunan model penaakulan yang sangat berkeupayaan dan multimodal asli. Gemini 3 Pro kini merupakan model paling canggih Google untuk tugasan kompleks, dan boleh memahami set data yang amat besar, masalah mencabar daripada pelbagai sumber maklumat, termasuk teks, audio, imej, video, dan keseluruhan repositori kod.Masukan:$0.32/M
Keluaran:$1.92/M
Model siri Plus vision-language natif Qwen3.5 dibina berasaskan seni bina hibrid yang mengintegrasikan mekanisme perhatian linear dengan model campuran pakar jarang, sekali gus mencapai kecekapan inferens yang lebih tinggi.Masukan:$0.48/M
Keluaran:$2.88/M
Model penglihatan-bahasa asli siri Qwen3.5 397B-A17B dibina berasaskan seni bina hibrid yang mengintegrasikan mekanisme perhatian linear dengan model campuran pakar jarang, sekaligus mencapai kecekapan inferens yang lebih tinggi.Masukan:$0.024/M
Keluaran:$0.24/M
🔹 Siri Doubao Seed 2.0
doubao-seed-2-0-code-preview-260215
Memfokuskan pada keupayaan penaakulan rantaian panjang dan kestabilan tugas kompleks, diadaptasi untuk senario kompleks dalam persekitaran perniagaan sebenar. Sebagai versi Seed 2.0 yang dipertingkat untuk pengkodan, ia lebih sesuai untuk Agentic Coding.
doubao-seed-2-0-lite-260215
Mengimbangi kualiti penjanaan dengan kelajuan respons, menjadikannya sesuai sebagai model tujuan umum bertaraf produksi.
doubao-seed-2-0-mini-260215
Direka untuk senario latensi rendah, keserentakan tinggi dan peka kos. Ia menekankan respons pantas dan penyebaran inferens yang fleksibel, menyokong keupayaan pemikiran empat peringkat dan pemahaman multimodal.Masukan:$0.24/M
Keluaran:$0.96/M
MiniMax-M2.5 ialah model bahasa besar termaju yang direka untuk produktiviti dunia sebenar. Dilatih dalam pelbagai persekitaran kerja digital dunia sebenar yang kompleks, M2.5 memanfaatkan kepakaran pengaturcaraan M2.1 untuk berkembang ke kerja pejabat am, mencapai kefasihan dalam menghasilkan dan mengendalikan fail Word, Excel dan PowerPoint, menukar konteks antara pelbagai persekitaran perisian, serta bekerja merentas pasukan ejen dan manusia yang berbeza.