Model - Satu Akses API untuk 500+ Model AI - CometAPI

Nano Banana 2

Nano Banana 2

Keluaran:$2.4/M

Gambaran Keseluruhan Keupayaan Teras: Resolusi: Sehingga 4K (4096×4096), setara dengan Pro. Ketekalan Imej Rujukan: Sehingga 14 imej rujukan (10 objek + 4 watak), mengekalkan ketekalan gaya/watak. Nisbah Aspek Melampau: Nisbah baharu 1:4, 4:1, 1:8, 8:1 ditambah, sesuai untuk imej panjang, poster dan sepanduk. Penjanaan Teks: Penjanaan teks lanjutan, sesuai untuk infografik dan susun atur poster pemasaran. Peningkatan Carian: Carian Google + Carian Imej bersepadu. Pembumian: Proses pemikiran terbina dalam; arahan kompleks dirasionalkan sebelum penjanaan.

Claude Opus 4.6

Claude Opus 4.6

Claude Opus 4.6 ialah model bahasa besar kelas “Opus” oleh Anthropic, dikeluarkan pada Februari 2026. Ia diposisikan sebagai tulang belakang untuk kerja berpengetahuan dan aliran kerja penyelidikan — menambah baik penaakulan berkonteks panjang, perancangan berbilang langkah, penggunaan alat (termasuk aliran kerja perisian berasaskan ejen), dan tugas penggunaan komputer seperti penjanaan slaid dan hamparan automatik.

Claude Sonnet 4.6

Claude Sonnet 4.6

Claude Sonnet 4.6 ialah model Sonnet kami yang paling berkeupayaan setakat ini. Ia merupakan peningkatan menyeluruh terhadap kemahiran model yang meliputi pengaturcaraan, penggunaan komputer, penaakulan konteks panjang, perancangan agen, kerja berasaskan pengetahuan, dan reka bentuk. Sonnet 4.6 turut menampilkan tetingkap konteks 1M token dalam beta.

GPT-5.4 nano

GPT-5.4 nano

Konteks:400,000

Masukan:$0.16/M

GPT-5.4 nano direka untuk tugasan yang amat mengutamakan kelajuan dan kos, seperti pengelasan, pengekstrakan data, pemeringkatan dan sub-agen.

GPT-5.4 mini

GPT-5.4 mini

Konteks:400,000

Keluaran:$3.6/M

GPT-5.4 mini membawa kekuatan GPT-5.4 ke dalam model yang lebih pantas dan lebih cekap, direka untuk beban kerja berskala besar.

Claude Mythos Preview

Claude Mythos Preview

Keluaran:$240/M

Claude Mythos Preview ialah model terdepan kami yang paling berkemampuan setakat ini, dan menunjukkan lonjakan yang ketara dalam skor pada banyak penanda aras penilaian berbanding model terdepan kami sebelum ini, Claude Opus 4.6.

mimo-v2-pro

mimo-v2-pro

Keluaran:$2.4/M

MiMo-V2-Pro ialah model asas perdana daripada Xiaomi, menampilkan lebih daripada 1T jumlah parameter dan panjang konteks 1M, yang dioptimumkan secara mendalam untuk senario berasaskan agen. Ia sangat mudah disesuaikan dengan rangka kerja agen umum seperti OpenClaw. Ia berada pada peringkat teratas global dalam penanda aras standard PinchBench dan ClawBench, dengan prestasi yang diperhatikan menghampiri Opus 4.6. MiMo-V2-Pro direka untuk berperanan sebagai otak sistem agen, menyelaras aliran kerja yang kompleks, memacu tugasan kejuruteraan pengeluaran, dan menyampaikan hasil secara boleh dipercayai.

mimo-v2-omni

mimo-v2-omni

Masukan:$0.32/M

Keluaran:$1.6/M

MiMo-V2-Omni ialah model omni-modal termaju yang memproses input imej, video dan audio secara natif dalam seni bina bersatu. Ia menggabungkan persepsi multimodal yang kukuh dengan keupayaan agentik - visual grounding, perancangan berbilang langkah, penggunaan alat dan pelaksanaan kod - menjadikannya sangat sesuai untuk tugasan dunia sebenar yang kompleks merentas modaliti. Tetingkap konteks 256K.

MiniMax-M2.7

MiniMax-M2.7

Masukan:$0.24/M

Keluaran:$0.96/M

MiniMax-M2.7 menawarkan kecerdasan bertaraf tertinggi yang sama seperti versi standard—termasuk evolusi kendiri rekursif dan produktiviti pejabat pada tahap pakar—tetapi direka untuk aplikasi yang memerlukan kependaman di bawah satu saat dan penjanaan token berkelajuan tinggi. Dengan memanfaatkan seni bina tulang belakang inferens yang dipertingkat, kelajuan keluarannya adalah 66% lebih pantas berbanding model standard (mencapai 100 tps). Ia merupakan pilihan utama untuk pembantu pengaturcaraan interaktif, pelaksanaan gelung ejen masa nyata, dan saluran pemprosesan perusahaan berkapasiti tinggi dengan keperluan masa siap yang ketat.

GLM 5 Turbo

GLM 5 Turbo

Masukan:$0.96/M

Keluaran:$3.264/M

GLM-5 Turbo ialah model baharu daripada Z.ai yang direka untuk inferens pantas dan prestasi mantap dalam persekitaran dipacu ejen seperti senario OpenClaw.

GPT-5.4 pro

GPT-5.4 pro

Konteks:1,050,000

Keluaran:$144/M

Versi GPT-5.4 yang menghasilkan respons yang lebih pintar dan lebih tepat.

GPT-5.4

GPT-5.4

Konteks:1,050,000

GPT-5.4 ialah model termaju untuk kerja profesional yang kompleks. Reasoning.effort menyokong: tiada (lalai), rendah, sederhana, tinggi dan xhigh.

GPT-5.3 Chat

GPT-5.3 Chat

Keluaran:$11.2/M

Model GPT-5.3 Instant yang digunakan dalam ChatGPT

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite

Keluaran:$1.2/M

Gemini 3.1 Flash-Lite ialah model Tier-3 yang sangat menjimatkan kos dan berlatensi rendah dalam Siri Gemini 3 Google, direka untuk aliran kerja AI pengeluaran bervolum tinggi, di mana throughput dan kelajuan lebih diutamakan daripada kedalaman penaakulan maksimum. Ia menggabungkan tetingkap konteks multimodal yang besar dengan prestasi inferens yang cekap pada kos yang lebih rendah berbanding kebanyakan model flagship.

Claude Haiku 4.5

Claude Haiku 4.5

Model terpantas, paling berkesan dari segi kos.

Sora 2 Pro

Sora 2 Pro

Setiap Saat:$0.24

Sora 2 Pro ialah model generatif media kami yang paling canggih dan berkuasa, mampu menjana video dengan Audio yang disegerakkan. Ia boleh mencipta klip video yang terperinci dan dinamik daripada bahasa semula jadi atau imej.

Sora 2

Sora 2

Setiap Saat:$0.08

Model penjanaan video yang sangat berkuasa, dengan kesan bunyi, menyokong format sembang.

mj_fast_video

mj_fast_video

Setiap Permintaan:$0.6

Midjourney video generation

Qwen 3.5 Flash

Qwen 3.5 Flash

Masukan:$0.16/M

Keluaran:$0.96/M

Sebagai model visi-bahasa asli, QWEN3.5-397B-A17B dalam siri Qwen3.5 cemerlang dalam penilaian penanda aras yang komprehensif seperti inferens, pengaturcaraan, keupayaan ejen dan pemahaman multimodal, membantu pembangun dan perusahaan meningkatkan produktiviti dengan ketara. Model ini menggunakan seni bina hibrid inovatif yang menggabungkan perhatian linear (Gated Delta Networks) dengan pakar hibrid jarang (MoE) untuk mencapai kecekapan inferens yang cemerlang: jumlah parameter 397 bilion dan hanya 17 bilion parameter diaktifkan bagi setiap propagasi ke hadapan, mengoptimumkan kelajuan dan kos sambil mengekalkan keupayaan. Kami juga telah memperluas sokongan bahasa dan dialek kami daripada 119 kepada 201, menyediakan ketersediaan yang lebih luas dan sokongan yang lebih baik untuk pengguna di seluruh dunia.

Grok 4.20

Grok 4.20

Konteks:2,000,000

Keluaran:$4.8/M

Keluaran Grok 4.20 memperkenalkan seni bina berbilang ejen (beberapa ejen khusus yang dikoordinasikan secara masa nyata), mod konteks yang diperluas, serta penambahbaikan tertumpu pada pematuhan arahan, pengurangan halusinasi, dan output berstruktur/berbantukan alat.

Grok Imagine Video

Grok Imagine Video

Setiap Saat:$0.04

Hasilkan video daripada gesaan teks, animasikan imej pegun, atau sunting video sedia ada menggunakan bahasa semula jadi. API menyokong tempoh, nisbah aspek dan resolusi yang boleh dikonfigurasi untuk video yang dijana — dengan SDK mengendalikan polling asinkron secara automatik.

gpt-realtime-1.5

gpt-realtime-1.5

Keluaran:$12.8/M

Model suara terbaik untuk input audio dan output audio.

gpt-audio-1.5

gpt-audio-1.5

Model suara terbaik untuk audio masuk, audio keluar dengan Chat Completions

GPT 5.3 Codex

GPT 5.3 Codex

Konteks:400,000

Keluaran:$11.2/M

GPT-5.3-Codex dioptimumkan untuk tugas pengekodan berorientasikan agen dalam Codex atau persekitaran yang serupa. GPT-5.3-Codex menyokong tetapan tahap usaha penaakulan rendah, sederhana, tinggi, dan xhigh.

Doubao Seedream 5

Doubao Seedream 5

Setiap Permintaan:$0.028

Seedream 5.0 Lite ialah model penjanaan imej multimodal bersepadu yang dilengkapi dengan keupayaan pemikiran mendalam dan carian dalam talian, serta menampilkan peningkatan menyeluruh dalam keupayaan pemahaman, penaakulan dan penjanaan.

Gemini 3.1 Pro

Gemini 3.1 Pro

Keluaran:$9.6/M

Gemini 3.1 Pro ialah generasi seterusnya dalam siri model Gemini, iaitu satu himpunan model penaakulan yang sangat berkeupayaan dan multimodal asli. Gemini 3 Pro kini merupakan model paling canggih Google untuk tugasan kompleks, dan boleh memahami set data yang amat besar, masalah mencabar daripada pelbagai sumber maklumat, termasuk teks, audio, imej, video, dan keseluruhan repositori kod.

qwen3.5-plus

qwen3.5-plus

Masukan:$0.32/M

Keluaran:$1.92/M

Model siri Plus vision-language natif Qwen3.5 dibina berasaskan seni bina hibrid yang mengintegrasikan mekanisme perhatian linear dengan model campuran pakar jarang, sekali gus mencapai kecekapan inferens yang lebih tinggi.

qwen3.5-397b-a17b

qwen3.5-397b-a17b

Masukan:$0.48/M

Keluaran:$2.88/M

Model penglihatan-bahasa asli siri Qwen3.5 397B-A17B dibina berasaskan seni bina hibrid yang mengintegrasikan mekanisme perhatian linear dengan model campuran pakar jarang, sekaligus mencapai kecekapan inferens yang lebih tinggi.

Doubao-Seed-2.0

Doubao-Seed-2.0

Masukan:$0.024/M

Keluaran:$0.24/M

🔹 Siri Doubao Seed 2.0 doubao-seed-2-0-code-preview-260215 Memfokuskan pada keupayaan penaakulan rantaian panjang dan kestabilan tugas kompleks, diadaptasi untuk senario kompleks dalam persekitaran perniagaan sebenar. Sebagai versi Seed 2.0 yang dipertingkat untuk pengkodan, ia lebih sesuai untuk Agentic Coding. doubao-seed-2-0-lite-260215 Mengimbangi kualiti penjanaan dengan kelajuan respons, menjadikannya sesuai sebagai model tujuan umum bertaraf produksi. doubao-seed-2-0-mini-260215 Direka untuk senario latensi rendah, keserentakan tinggi dan peka kos. Ia menekankan respons pantas dan penyebaran inferens yang fleksibel, menyokong keupayaan pemikiran empat peringkat dan pemahaman multimodal.

MiniMax M2.5

MiniMax M2.5

Masukan:$0.24/M

Keluaran:$0.96/M

MiniMax-M2.5 ialah model bahasa besar termaju yang direka untuk produktiviti dunia sebenar. Dilatih dalam pelbagai persekitaran kerja digital dunia sebenar yang kompleks, M2.5 memanfaatkan kepakaran pengaturcaraan M2.1 untuk berkembang ke kerja pejabat am, mencapai kefasihan dalam menghasilkan dan mengendalikan fail Word, Excel dan PowerPoint, menukar konteks antara pelbagai persekitaran perisian, serta bekerja merentas pasukan ejen dan manusia yang berbeza.