Model - One API Akses 500+ Model AI - CometAPI

Nano Banana 2

Nano Banana 2

Keluaran:$2.4/M

Ikhtisar Kapabilitas Inti: Resolusi: Hingga 4K (4096×4096), setara dengan Pro. Konsistensi Gambar Referensi: Hingga 14 gambar referensi (10 objek + 4 karakter), mempertahankan konsistensi gaya/karakter. Rasio Aspek Ekstrem: Rasio baru 1:4, 4:1, 1:8, 8:1 ditambahkan, cocok untuk gambar panjang, poster, dan banner. Rendering Teks: Pembuatan teks tingkat lanjut, cocok untuk infografis dan tata letak poster pemasaran. Peningkatan Pencarian: Terintegrasi dengan Google Search + Pencarian Gambar. Grounding: Proses penalaran bawaan; prompt kompleks dinalar terlebih dahulu sebelum pembuatan.

Claude Opus 4.6

Claude Opus 4.6

Claude Opus 4.6 adalah model bahasa besar kelas “Opus” dari Anthropic, dirilis pada Februari 2026. Model ini diposisikan sebagai andalan untuk pekerjaan berbasis pengetahuan dan alur kerja riset — meningkatkan penalaran dalam konteks panjang, perencanaan multi-langkah, penggunaan alat (termasuk alur kerja perangkat lunak berbasis agen), serta tugas penggunaan komputer seperti pembuatan slide dan spreadsheet secara otomatis.

Claude Sonnet 4.6

Claude Sonnet 4.6

Claude Sonnet 4.6 adalah model Sonnet kami yang paling mumpuni sejauh ini. Ini merupakan peningkatan menyeluruh atas keahlian model di bidang pemrograman, penggunaan komputer, penalaran konteks panjang, perencanaan agen, pekerjaan berbasis pengetahuan, dan desain. Sonnet 4.6 juga menyertakan jendela konteks 1M token dalam tahap beta.

GPT-5.4 nano

GPT-5.4 nano

Konteks:400,000

Masukan:$0.16/M

GPT-5.4 nano dirancang untuk tugas-tugas di mana kecepatan dan biaya paling penting, seperti klasifikasi, ekstraksi data, pemeringkatan, dan sub-agen.

GPT-5.4 mini

GPT-5.4 mini

Konteks:400,000

Keluaran:$3.6/M

GPT-5.4 mini menghadirkan keunggulan GPT-5.4 ke model yang lebih cepat dan lebih efisien, dirancang untuk beban kerja bervolume tinggi.

Claude Mythos Preview

Claude Mythos Preview

Keluaran:$240/M

Claude Mythos Preview adalah model frontier kami yang paling mumpuni hingga saat ini, dan menunjukkan lompatan skor yang mencolok pada banyak tolok ukur evaluasi dibandingkan dengan model frontier kami sebelumnya, Claude Opus 4.6.

mimo-v2-pro

mimo-v2-pro

Keluaran:$2.4/M

MiMo-V2-Pro adalah model fondasi unggulan Xiaomi, dengan total lebih dari 1T parameter dan panjang konteks 1M, yang dioptimalkan secara mendalam untuk skenario agentic. Model ini sangat mudah beradaptasi dengan kerangka agent umum seperti OpenClaw. Model ini berada di jajaran teratas global dalam tolok ukur standar PinchBench dan ClawBench, dengan performa yang dirasakan mendekati Opus 4.6. MiMo-V2-Pro dirancang untuk berfungsi sebagai otak sistem agent, mengorkestrasi alur kerja yang kompleks, mendorong tugas rekayasa produksi, dan memberikan hasil secara andal.

mimo-v2-omni

mimo-v2-omni

Masukan:$0.32/M

Keluaran:$1.6/M

MiMo-V2-Omni adalah model omni-modal mutakhir yang secara native memproses input gambar, video, dan audio dalam satu arsitektur terpadu. Model ini menggabungkan persepsi multimodal yang kuat dengan kapabilitas agentik - visual grounding, perencanaan multi-langkah, penggunaan alat, dan eksekusi kode - sehingga sangat cocok untuk tugas dunia nyata yang kompleks dan mencakup berbagai modalitas. Jendela konteks 256K.

MiniMax-M2.7

MiniMax-M2.7

Masukan:$0.24/M

Keluaran:$0.96/M

MiniMax-M2.7 menawarkan kecerdasan kelas teratas yang sama seperti versi standar—termasuk evolusi diri rekursif dan produktivitas perkantoran tingkat pakar—namun dirancang untuk aplikasi yang memerlukan latensi sub-detik dan generasi token berkecepatan tinggi. Dengan memanfaatkan arsitektur backbone inferensi yang ditingkatkan, kecepatan outputnya 66% lebih cepat daripada model standar (mencapai 100 tps). Ini adalah pilihan utama untuk asisten pemrograman interaktif, eksekusi loop agen secara real-time, dan pipeline perusahaan ber-throughput tinggi dengan persyaratan waktu penyelesaian yang ketat.

GLM 5 Turbo

GLM 5 Turbo

Masukan:$0.96/M

Keluaran:$3.264/M

GLM-5 Turbo adalah model baru dari Z.ai yang dirancang untuk inferensi cepat dan kinerja yang kuat di lingkungan yang digerakkan oleh agen seperti skenario OpenClaw.

GPT-5.4 pro

GPT-5.4 pro

Konteks:1,050,000

Keluaran:$144/M

Versi GPT-5.4 yang menghasilkan respons yang lebih cerdas dan lebih presisi.

GPT-5.4

GPT-5.4

Konteks:1,050,000

GPT-5.4 adalah model terdepan untuk pekerjaan profesional yang kompleks. Reasoning.effort mendukung: none (default), low, medium, high, dan xhigh.

GPT-5.3 Chat

GPT-5.3 Chat

Keluaran:$11.2/M

Model GPT-5.3 Instant yang digunakan di ChatGPT

Gemini 3.1 Flash-Lite

Gemini 3.1 Flash-Lite

Keluaran:$1.2/M

Gemini 3.1 Flash-Lite adalah model Tier-3 yang sangat efisien dari sisi biaya dan berlatensi rendah dalam seri Gemini 3 dari Google, dirancang untuk alur kerja AI produksi berskala besar di mana throughput dan kecepatan lebih penting daripada kedalaman penalaran maksimum. Model ini menggabungkan jendela konteks multimodal yang besar dengan kinerja inferensi yang efisien, dengan biaya lebih rendah dibandingkan kebanyakan model andalan.

Claude Haiku 4.5

Claude Haiku 4.5

Model tercepat dan paling hemat biaya.

Sora 2 Pro

Sora 2 Pro

Per Detik:$0.24

Sora 2 Pro adalah model pembuatan media kami yang paling canggih dan kuat, mampu menghasilkan video dengan audio tersinkronisasi. Model ini dapat membuat klip video yang detail dan dinamis dari bahasa alami atau gambar.

Sora 2

Sora 2

Per Detik:$0.08

Model generasi video yang sangat canggih, dengan efek suara, mendukung format chat.

mj_fast_video

mj_fast_video

Per Permintaan:$0.6

Midjourney video generation

Qwen 3.5 Flash

Qwen 3.5 Flash

Masukan:$0.16/M

Keluaran:$0.96/M

Sebagai model visi-bahasa native, QWEN3.5-397B-A17B dari seri Qwen3.5 unggul dalam evaluasi benchmarking yang komprehensif seperti inferensi, pemrograman, kapabilitas agen, dan pemahaman multimodal, membantu pengembang dan perusahaan secara signifikan meningkatkan produktivitas. Model ini menggunakan arsitektur hibrida inovatif yang menggabungkan attention linear (Gated Delta Networks) dengan pakar hibrida sparse (MoE) untuk mencapai efisiensi inferensi yang unggul: 397 miliar parameter total dan hanya 17 miliar parameter yang diaktifkan per propagasi maju, mengoptimalkan kecepatan dan biaya sambil mempertahankan kapabilitas. Kami juga telah memperluas dukungan bahasa dan dialek dari 119 menjadi 201, memberikan ketersediaan yang lebih luas dan dukungan yang lebih baik bagi pengguna di seluruh dunia.

Grok 4.20

Grok 4.20

Konteks:2,000,000

Keluaran:$4.8/M

Rilis Grok 4.20 memperkenalkan arsitektur multiagen (beberapa agen terspesialisasi yang dikoordinasikan secara waktu nyata), mode konteks yang diperluas, serta peningkatan yang berfokus pada kemampuan mengikuti instruksi, pengurangan halusinasi, dan keluaran terstruktur/berbantuan alat.

Grok Imagine Video

Grok Imagine Video

Per Detik:$0.04

Hasilkan video dari prompt teks, animasikan gambar statis, atau sunting video yang sudah ada dengan bahasa alami. API mendukung durasi, rasio aspek, dan resolusi yang dapat dikonfigurasi untuk video yang dihasilkan — dengan SDK yang secara otomatis menangani polling asinkron.

gpt-realtime-1.5

gpt-realtime-1.5

Keluaran:$12.8/M

Model suara terbaik untuk input audio, output audio.

gpt-audio-1.5

gpt-audio-1.5

Model suara terbaik untuk input audio dan output audio dengan Chat Completions.

GPT 5.3 Codex

GPT 5.3 Codex

Konteks:400,000

Keluaran:$11.2/M

GPT-5.3-Codex dioptimalkan untuk tugas pengodean berbasis agen di Codex atau lingkungan serupa. GPT-5.3-Codex mendukung pengaturan upaya penalaran low, medium, high, dan xhigh.

Doubao Seedream 5

Doubao Seedream 5

Per Permintaan:$0.028

Seedream 5.0 Lite adalah model generasi gambar multimodal terpadu yang dibekali kapabilitas pemikiran mendalam dan penelusuran online, serta menghadirkan peningkatan menyeluruh pada kemampuan pemahaman, penalaran, dan generasi.

Gemini 3.1 Pro

Gemini 3.1 Pro

Keluaran:$9.6/M

Gemini 3.1 Pro adalah generasi berikutnya dalam seri model Gemini, berupa rangkaian model penalaran yang sangat mumpuni dan secara native bersifat multimodal. Gemini 3 Pro kini merupakan model paling canggih dari Google untuk tugas-tugas kompleks, dan mampu memahami kumpulan data yang sangat besar serta masalah-masalah menantang dari berbagai sumber informasi, termasuk teks, audio, gambar, video, dan seluruh repositori kode

qwen3.5-plus

qwen3.5-plus

Masukan:$0.32/M

Keluaran:$1.92/M

Model seri Plus Qwen3.5 visi-bahasa natif dibangun di atas arsitektur hibrida yang mengintegrasikan mekanisme atensi linear dengan model campuran ahli yang jarang, sehingga mencapai efisiensi inferensi yang lebih tinggi.

qwen3.5-397b-a17b

qwen3.5-397b-a17b

Masukan:$0.48/M

Keluaran:$2.88/M

Model visi-bahasa native 397B-A17B dalam seri Qwen3.5 dibangun di atas arsitektur hibrida yang mengintegrasikan mekanisme atensi linear dengan model mixture-of-experts yang jarang, sehingga mencapai efisiensi inferensi yang lebih tinggi.

Doubao-Seed-2.0

Doubao-Seed-2.0

Masukan:$0.024/M

Keluaran:$0.24/M

🔹 Seri Doubao Seed 2.0 doubao-seed-2-0-code-preview-260215 Berfokus pada kemampuan penalaran rantai panjang dan stabilitas pada tugas-tugas kompleks, diadaptasi untuk skenario kompleks di lingkungan bisnis nyata. Sebagai versi Seed 2.0 yang ditingkatkan untuk pengodean, model ini lebih cocok untuk Agentic Coding. doubao-seed-2-0-lite-260215 Menyeimbangkan kualitas keluaran dengan kecepatan respons, sehingga cocok sebagai model tingkat produksi tujuan umum. doubao-seed-2-0-mini-260215 Dirancang untuk skenario latensi rendah, konkurensi tinggi, dan sensitif biaya. Menekankan respons cepat dan penerapan inferensi yang fleksibel, serta mendukung kemampuan berpikir empat tingkat dan pemahaman multimodal.

MiniMax M2.5

MiniMax M2.5

Masukan:$0.24/M

Keluaran:$0.96/M

MiniMax-M2.5 adalah model bahasa besar mutakhir yang dirancang untuk produktivitas dunia nyata. Dilatih dalam beragam lingkungan kerja digital dunia nyata yang kompleks, M2.5 dibangun di atas keahlian pengodean M2.1 untuk memperluas cakupan ke pekerjaan perkantoran umum, menjadi mahir dalam menghasilkan dan mengoperasikan file Word, Excel, dan Powerpoint, beralih konteks di antara berbagai lingkungan perangkat lunak, serta bekerja lintas tim agen maupun manusia.