What tasks is Gemini 3.1 Flash-Lite best suited for?

Gemini 3.1 Flash-Lite dioptimumkan untuk aliran kerja berisipadu tinggi dan sensitif kependaman seperti terjemahan, penyederhanaan kandungan, pengelasan, penjanaan UI/papan pemuka, dan saluran paip prompt simulasi, di mana kelajuan dan kos rendah menjadi keutamaan.

What is the context window and output capability of Gemini 3.1 Flash-Lite?

Gemini 3.1 Flash-Lite menyokong tetingkap konteks yang besar sehingga **1 juta token** untuk input multimodal termasuk teks, imej, audio dan video, dengan output sehingga **64 K token**.

How does Gemini 3.1 Flash-Lite compare to Gemini 2.5 Flash in performance and cost?

Berbanding model Gemini 2.5 Flash, Gemini 3.1 Flash-Lite memberikan masa ke jawapan pertama yang ~2.5× lebih pantas dan daya pemprosesan output ~45 % lebih tinggi sambil jauh lebih murah bagi setiap juta token untuk kedua-dua input dan output. }

Does Gemini 3.1 Flash-Lite support adjustable reasoning depth?

Ya — ia menawarkan pelbagai tahap penaakulan atau “pemikiran” (contohnya, minimum, rendah, sederhana, tinggi) supaya pembangun boleh membuat pertukaran antara kelajuan dan penaakulan yang lebih mendalam untuk tugasan yang kompleks. :contentReference[oaicite:3]{index=3}

What are typical benchmark strengths of Gemini 3.1 Flash-Lite?

Pada penanda aras seperti GPQA Diamond (pengetahuan saintifik) dan MMMU Pro (pemahaman multimodal), Gemini 3.1 Flash-Lite memperoleh skor yang kukuh berbanding model Flash-Lite terdahulu, dengan GPQA ~86.9 % dan MMMU ~76.8 % dalam penilaian rasmi.

How can I access Gemini 3.1 Flash-Lite via API?

Anda boleh menggunakan titik hujung `gemini-3.1-flash-lite-preview` melalui CometAPI untuk integrasi perusahaan.

When should I choose Gemini 3.1 Flash-Lite vs Gemini 3.1 Pro?

Pilih Flash-Lite apabila daya pemprosesan, kependaman dan kos menjadi keutamaan untuk tugasan berskala besar; pilih Pro untuk tugasan yang memerlukan tahap penaakulan tertinggi, ketepatan analitis, atau pemahaman kritikal misi.

API Gemini 3.1 Flash-Lite Berpatutan | text-to-text

📊 Spesifikasi Teknikal

Spesifikasi	Butiran
Keluarga model	Gemini 3 (Flash-Lite)
Tetingkap konteks	Sehingga 1 juta token (teks, imej, audio, video multimodal)
Had token output	Sehingga 64 K token
Jenis input	Teks, imej, audio, video
Asas seni bina teras	Berdasarkan Gemini 3 Pro
Saluran penggunaan	Gemini API (Google AI Studio), Vertex AI
Harga (pratonton)	~$0.25 bagi setiap 1M token input, ~$1.50 bagi setiap 1M token output
Kawalan penaakulan	“Tahap pemikiran” boleh dilaras (cth., minimum hingga tinggi)

🔍 Apakah Gemini 3.1 Flash-Lite?

Gemini 3.1 Flash-Lite ialah varian jejak kos efektif dalam siri Gemini 3 Google, dioptimumkan untuk beban kerja AI berskala besar—terutamanya apabila kependaman lebih rendah, kos per token yang lebih murah, dan throughput tinggi menjadi keutamaan. Ia mengekalkan tulang belakang penaakulan multimodal teras Gemini 3 Pro sambil menyasarkan kes penggunaan pemprosesan pukal seperti terjemahan, pengelasan, penyederhanaan kandungan, penjanaan UI, dan sintesis data berstruktur.

✨ Ciri-ciri Utama

Tetingkap Konteks Ultra-Besar: Mengendalikan sehingga 1 M token input multimodal, membolehkan penaakulan dokumen panjang serta pemprosesan konteks video/audio.
Pelaksanaan Cekap Kos: Kos per token jauh lebih rendah berbanding model Flash-Lite terdahulu dan pesaing, membolehkan penggunaan volum tinggi.
Throughput Tinggi & Kependaman Rendah: ~2.5× lebih pantas dari segi masa ke token pertama dan ~45 % lebih pantas untuk throughput output berbanding Gemini 2.5 Flash.
Kawalan Penaakulan Dinamik: “Tahap pemikiran” membolehkan pembangun melaras prestasi berbanding penaakulan lebih mendalam bagi setiap permintaan.
Sokongan Multimodal: Pemprosesan asli untuk imej, audio, video, dan teks dalam ruang konteks bersatu.
Akses API Fleksibel: Tersedia melalui Gemini API dalam Google AI Studio dan aliran kerja Vertex AI perusahaan.

📈 Prestasi Penanda Aras

Metrik berikut menunjukkan kecekapan dan keupayaan Gemini 3.1 Flash-Lite berbanding varian Flash/Lite terdahulu dan model lain (dilaporkan pada Mac 2026):

Penanda aras	Gemini 3.1 Flash-Lite	Gemini 2.5 Flash Dynamic	GPT-5 Mini
GPQA Diamond (pengetahuan saintifik)	86.9 %	66.7 %	82.3 %
MMMU-Pro (penaakulan multimodal)	76.8 %	51.0 %	74.1 %
CharXiv (penaakulan carta kompleks)	73.2 %	55.5 %	75.5 % (+python)
Video-MMMU	84.8 %	60.7 %	82.5 %
LiveCodeBench (penaakulan kod)	72.0 %	34.3 %	80.4 %
1M Long-Context	12.3 %	5.4 %	Tidak disokong

Skor ini menunjukkan bahawa Flash-Lite mengekalkan penaakulan kompetitif dan pemahaman multimodal walaupun dengan reka bentuk yang berorientasikan kecekapan, dan sering mengatasi varian Flash lama merentas penanda aras utama.

⚖️ Perbandingan dengan Model Berkaitan

Ciri	Gemini 3.1 Flash-Lite	Gemini 3.1 Pro
Kos per token	Lebih rendah (peringkat asas)	Lebih tinggi (premium)
Kependaman / throughput	Dioptimumkan untuk kelajuan	Seimbang dengan kedalaman
Kedalaman penaakulan	Boleh dilaras, tetapi lebih cetek	Penaakulan mendalam lebih kuat
Fokus kes penggunaan	Saluran pukal, penyederhanaan, terjemahan	Tugas penaakulan kritikal misi
Tetingkap konteks	1 M token	1 M token (sama)

Flash-Lite disesuaikan untuk skala dan kos; Pro adalah untuk ketepatan tinggi dan penaakulan mendalam.

🧠 Kes Penggunaan Perusahaan

Terjemahan & Penyederhanaan Volum Tinggi: Saluran bahasa dan kandungan masa nyata dengan kependaman rendah.
Pengekstrakan & Pengelasan Data Pukal: Pemprosesan korpus besar dengan ekonomi token yang cekap.
Penjanaan UI/UX: JSON berstruktur, templat papan pemuka, dan perancah bahagian hadapan.
Prompting Simulasi: Penjejakan keadaan logik merentas interaksi lanjutan.
Aplikasi Multimodal: Penaakulan berasaskan video, audio, dan imej dalam konteks bersatu.

🧪 Keterbatasan

Kedalaman penaakulan dan ketepatan analitik mungkin ketinggalan berbanding Gemini 3.1 Pro dalam tugas kompleks dan kritikal misi. :
Hasil penanda aras seperti gabungan konteks panjang menunjukkan masih ada ruang untuk penambahbaikan berbanding model perdana.
Kawalan penaakulan dinamik menukar ganti kelajuan dengan ketelitian; tidak semua tahap menjamin kualiti output yang sama.

GPT-5.3 Chat (Alias: gpt-5.3-chat-latest) — Gambaran Keseluruhan

GPT-5.3 Chat ialah model sembang pengeluaran terkini daripada OpenAI, ditawarkan sebagai endpoint gpt-5.3-chat-latest dalam API rasmi dan menggerakkan pengalaman perbualan harian ChatGPT. Ia memfokuskan pada peningkatan kualiti interaksi harian—menjadikan respons lebih lancar, lebih tepat, dan lebih berkonteks—sambil mengekalkan keupayaan teknikal yang kuat yang diwarisi daripada keluarga GPT-5 yang lebih luas. :contentReference[oaicite:1]{index=1}

📊 Spesifikasi Teknikal

Spesifikasi	Butiran
Nama/alias model	GPT-5.3 Chat / gpt-5.3-chat-latest
Penyedia	OpenAI
Tetingkap konteks	128,000 token
Token output maksimum setiap permintaan	16,384 token
Had pengetahuan	31 Ogos 2025
Modaliti input	Input teks dan imej (penglihatan sahaja)
Modaliti output	Teks
Pemanggilan fungsi	Disokong
Output berstruktur	Disokong
Respons penstriman	Disokong
Penalaan halus	Tidak disokong
Distilasi / embeddings	Distilasi tidak disokong; embeddings disokong
Endpoint penggunaan biasa	Chat completions, Responses, Assistants, Batch, Realtime
Pemanggilan fungsi & alat	Pemanggilan fungsi didayakan; menyokong carian web & fail melalui Responses API

🧠 Apa yang Menjadikan GPT-5.3 Chat Unik

GPT-5.3 Chat mewakili penambahbaikan berperingkat ke atas keupayaan berorientasikan sembang dalam garis keturunan GPT-5. Matlamat utama varian ini adalah untuk menyediakan respons perbualan yang lebih semula jadi, koheren dari segi konteks, dan mesra pengguna berbanding model terdahulu seperti GPT-5.2 Instant. Penambahbaikan tertumpu pada:

Nada dinamik dan semula jadi dengan lebih sedikit penafian yang tidak membantu dan jawapan yang lebih langsung.
Pemahaman konteks dan kerelevanan yang lebih baik dalam senario sembang biasa.
Integrasi lebih lancar dengan kes penggunaan sembang yang kaya termasuk dialog berbilang pusingan, peringkasan, dan bantuan perbualan.

GPT-5.3 Chat disyorkan untuk pembangun dan aplikasi interaktif yang memerlukan penambahbaikan perbualan terkini tanpa kedalaman penaakulan khusus seperti varian GPT-5.3 “Thinking” atau “Pro” pada masa hadapan (yang akan datang).

🚀 Ciri-ciri Utama

Tetingkap Konteks Sembang Besar: 128K token membolehkan sejarah perbualan yang kaya dan penjejakan konteks panjang. :contentReference[oaicite:17]{index=17}
Kualiti Respons Dipertingkat: Aliran perbualan yang diperhalus dengan lebih sedikit kaveat yang tidak perlu atau penolakan yang terlalu berhati-hati. :contentReference[oaicite:18]{index=18}
Sokongan API Rasmi: Endpoint yang disokong sepenuhnya untuk sembang, pemprosesan kelompok, output berstruktur, dan aliran kerja masa nyata.
Sokongan Input Serba Boleh: Menerima dan mengontekstualkan input teks dan imej, sesuai untuk kes penggunaan sembang multimodal.
Pemanggilan Fungsi & Output Berstruktur: Membolehkan corak aplikasi berstruktur dan interaktif melalui API. :contentReference[oaicite:21]{index=21}
Keserasian Ekosistem Luas: Berfungsi dengan v1/chat/completions, v1/responses, Assistants, dan antara muka API OpenAI moden yang lain.

📈 Penanda Aras Lazim & Tingkah Laku

📈 Prestasi Penanda Aras

Laporan OpenAI dan laporan bebas menunjukkan peningkatan prestasi dunia sebenar:

Metrik	GPT-5.3 Instant berbanding GPT-5.2 Instant
Kadar halusinasi dengan carian web	−26.8%
Kadar halusinasi tanpa carian	−19.7%
Ralat fakta yang ditandai pengguna (web)	~−22.5%
Ralat fakta yang ditandai pengguna (dalaman)	~−9.6%

Yang ketara, fokus GPT-5.3 pada kualiti perbualan dunia sebenar bermaksud peningkatan skor penanda aras (seperti metrik NLP piawai) kurang ditonjolkan dalam keluaran ini — penambahbaikan paling jelas muncul dalam metrik pengalaman pengguna berbanding skor ujian mentah.

Dalam perbandingan industri, varian sembang keluarga GPT-5 diketahui mengatasi modul GPT-4 terdahulu dalam kerelevanan sembang harian dan penjejakan konteks, walaupun tugas penaakulan khusus mungkin masih lebih memihak kepada varian “Pro” khusus atau endpoint yang dioptimumkan untuk penaakulan.

🤖 Kes Penggunaan

GPT-5.3 Chat sangat sesuai untuk:

Bot sokongan pelanggan dan pembantu perbualan
Agen tutorial interaktif atau pendidikan
Peringkasan dan carian perbualan
Agen pengetahuan dalaman dan pembantu sembang pasukan
Soal jawab multimodal (teks + imej)

Keseimbangan antara kualiti perbualan dan kepelbagaian API menjadikannya ideal untuk aplikasi interaktif yang menggabungkan dialog semula jadi dengan output data berstruktur.

🔍 Keterbatasan

Bukan varian penaakulan terdalam: Untuk kedalaman analitik yang kritikal misi dan berisiko tinggi, model GPT-5.3 Thinking atau Pro yang akan datang mungkin lebih sesuai.
Output multimodal terhad: Walaupun input imej disokong, penjanaan imej/video penuh atau aliran kerja output multimodal kaya bukan fokus utama varian ini.
Penalaan halus tidak disokong: Anda tidak boleh melakukan fine-tune pada model ini, walaupun anda boleh mengawal tingkah laku melalui prompt sistem.

Cara mengakses API Gemini 3.1 flash lite

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke konsol CometAPI anda. Dapatkan kelayakan akses kunci API bagi antara muka tersebut. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

cometapi-key

Langkah 2: Hantar Permintaan ke API Gemini 3.1 flash lite

Pilih endpoint “` gemini-3.1-flash-lite” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. URL asas ialah Gemini Generating Content

Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan Semula dan Sahkan Hasil

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan memberikan respons dengan status tugas dan data output.

Harga Comet (USD / M Tokens)	Harga Rasmi (USD / M Tokens)	Diskaun
Masukan:$0.2/M Keluaran:$1.2/M	Masukan:$0.25/M Keluaran:$1.5/M	-20%

ID model	Penerangan	Ketersediaan	Permintaan
gemini-3-1-flash	Secara automatik merujuk kepada model terkini	✅	Gemini Menjana Kandungan
gemini-3-1-flash-preview	Pratonton Rasmi	✅	Gemini Menjana Kandungan
gemini-3.1-flash-lite-preview-thinking	versi pemikiran	✅	Gemini Menjana Kandungan
gemini-3.1-flash-lite-thinking	versi pemikiran	✅	Gemini Menjana Kandungan

📊 Spesifikasi Teknikal

Spesifikasi	Butiran
Keluarga model	Gemini 3 (Flash-Lite)
Tetingkap konteks	Sehingga 1 juta token (teks, imej, audio, video multimodal)
Had token output	Sehingga 64 K token
Jenis input	Teks, imej, audio, video
Asas seni bina teras	Berdasarkan Gemini 3 Pro
Saluran penggunaan	Gemini API (Google AI Studio), Vertex AI
Harga (pratonton)	~$0.25 bagi setiap 1M token input, ~$1.50 bagi setiap 1M token output
Kawalan penaakulan	“Tahap pemikiran” boleh dilaras (cth., minimum hingga tinggi)

🔍 Apakah Gemini 3.1 Flash-Lite?

✨ Ciri-ciri Utama

Tetingkap Konteks Ultra-Besar: Mengendalikan sehingga 1 M token input multimodal, membolehkan penaakulan dokumen panjang serta pemprosesan konteks video/audio.
Pelaksanaan Cekap Kos: Kos per token jauh lebih rendah berbanding model Flash-Lite terdahulu dan pesaing, membolehkan penggunaan volum tinggi.
Throughput Tinggi & Kependaman Rendah: ~2.5× lebih pantas dari segi masa ke token pertama dan ~45 % lebih pantas untuk throughput output berbanding Gemini 2.5 Flash.
Kawalan Penaakulan Dinamik: “Tahap pemikiran” membolehkan pembangun melaras prestasi berbanding penaakulan lebih mendalam bagi setiap permintaan.
Sokongan Multimodal: Pemprosesan asli untuk imej, audio, video, dan teks dalam ruang konteks bersatu.
Akses API Fleksibel: Tersedia melalui Gemini API dalam Google AI Studio dan aliran kerja Vertex AI perusahaan.

📈 Prestasi Penanda Aras

Metrik berikut menunjukkan kecekapan dan keupayaan Gemini 3.1 Flash-Lite berbanding varian Flash/Lite terdahulu dan model lain (dilaporkan pada Mac 2026):

Penanda aras	Gemini 3.1 Flash-Lite	Gemini 2.5 Flash Dynamic	GPT-5 Mini
GPQA Diamond (pengetahuan saintifik)	86.9 %	66.7 %	82.3 %
MMMU-Pro (penaakulan multimodal)	76.8 %	51.0 %	74.1 %
CharXiv (penaakulan carta kompleks)	73.2 %	55.5 %	75.5 % (+python)
Video-MMMU	84.8 %	60.7 %	82.5 %
LiveCodeBench (penaakulan kod)	72.0 %	34.3 %	80.4 %
1M Long-Context	12.3 %	5.4 %	Tidak disokong

⚖️ Perbandingan dengan Model Berkaitan

Ciri	Gemini 3.1 Flash-Lite	Gemini 3.1 Pro
Kos per token	Lebih rendah (peringkat asas)	Lebih tinggi (premium)
Kependaman / throughput	Dioptimumkan untuk kelajuan	Seimbang dengan kedalaman
Kedalaman penaakulan	Boleh dilaras, tetapi lebih cetek	Penaakulan mendalam lebih kuat
Fokus kes penggunaan	Saluran pukal, penyederhanaan, terjemahan	Tugas penaakulan kritikal misi
Tetingkap konteks	1 M token	1 M token (sama)

Flash-Lite disesuaikan untuk skala dan kos; Pro adalah untuk ketepatan tinggi dan penaakulan mendalam.

🧠 Kes Penggunaan Perusahaan

Terjemahan & Penyederhanaan Volum Tinggi: Saluran bahasa dan kandungan masa nyata dengan kependaman rendah.
Pengekstrakan & Pengelasan Data Pukal: Pemprosesan korpus besar dengan ekonomi token yang cekap.
Penjanaan UI/UX: JSON berstruktur, templat papan pemuka, dan perancah bahagian hadapan.
Prompting Simulasi: Penjejakan keadaan logik merentas interaksi lanjutan.
Aplikasi Multimodal: Penaakulan berasaskan video, audio, dan imej dalam konteks bersatu.

🧪 Keterbatasan

Kedalaman penaakulan dan ketepatan analitik mungkin ketinggalan berbanding Gemini 3.1 Pro dalam tugas kompleks dan kritikal misi. :
Hasil penanda aras seperti gabungan konteks panjang menunjukkan masih ada ruang untuk penambahbaikan berbanding model perdana.
Kawalan penaakulan dinamik menukar ganti kelajuan dengan ketelitian; tidak semua tahap menjamin kualiti output yang sama.

GPT-5.3 Chat (Alias: gpt-5.3-chat-latest) — Gambaran Keseluruhan

📊 Spesifikasi Teknikal

Spesifikasi	Butiran
Nama/alias model	GPT-5.3 Chat / gpt-5.3-chat-latest
Penyedia	OpenAI
Tetingkap konteks	128,000 token
Token output maksimum setiap permintaan	16,384 token
Had pengetahuan	31 Ogos 2025
Modaliti input	Input teks dan imej (penglihatan sahaja)
Modaliti output	Teks
Pemanggilan fungsi	Disokong
Output berstruktur	Disokong
Respons penstriman	Disokong
Penalaan halus	Tidak disokong
Distilasi / embeddings	Distilasi tidak disokong; embeddings disokong
Endpoint penggunaan biasa	Chat completions, Responses, Assistants, Batch, Realtime
Pemanggilan fungsi & alat	Pemanggilan fungsi didayakan; menyokong carian web & fail melalui Responses API

🧠 Apa yang Menjadikan GPT-5.3 Chat Unik

Nada dinamik dan semula jadi dengan lebih sedikit penafian yang tidak membantu dan jawapan yang lebih langsung.
Pemahaman konteks dan kerelevanan yang lebih baik dalam senario sembang biasa.
Integrasi lebih lancar dengan kes penggunaan sembang yang kaya termasuk dialog berbilang pusingan, peringkasan, dan bantuan perbualan.

🚀 Ciri-ciri Utama

Tetingkap Konteks Sembang Besar: 128K token membolehkan sejarah perbualan yang kaya dan penjejakan konteks panjang. :contentReference[oaicite:17]{index=17}
Kualiti Respons Dipertingkat: Aliran perbualan yang diperhalus dengan lebih sedikit kaveat yang tidak perlu atau penolakan yang terlalu berhati-hati. :contentReference[oaicite:18]{index=18}
Sokongan API Rasmi: Endpoint yang disokong sepenuhnya untuk sembang, pemprosesan kelompok, output berstruktur, dan aliran kerja masa nyata.
Sokongan Input Serba Boleh: Menerima dan mengontekstualkan input teks dan imej, sesuai untuk kes penggunaan sembang multimodal.
Pemanggilan Fungsi & Output Berstruktur: Membolehkan corak aplikasi berstruktur dan interaktif melalui API. :contentReference[oaicite:21]{index=21}
Keserasian Ekosistem Luas: Berfungsi dengan v1/chat/completions, v1/responses, Assistants, dan antara muka API OpenAI moden yang lain.

📈 Penanda Aras Lazim & Tingkah Laku

📈 Prestasi Penanda Aras

Laporan OpenAI dan laporan bebas menunjukkan peningkatan prestasi dunia sebenar:

Metrik	GPT-5.3 Instant berbanding GPT-5.2 Instant
Kadar halusinasi dengan carian web	−26.8%
Kadar halusinasi tanpa carian	−19.7%
Ralat fakta yang ditandai pengguna (web)	~−22.5%
Ralat fakta yang ditandai pengguna (dalaman)	~−9.6%

🤖 Kes Penggunaan

GPT-5.3 Chat sangat sesuai untuk:

Bot sokongan pelanggan dan pembantu perbualan
Agen tutorial interaktif atau pendidikan
Peringkasan dan carian perbualan
Agen pengetahuan dalaman dan pembantu sembang pasukan
Soal jawab multimodal (teks + imej)

Keseimbangan antara kualiti perbualan dan kepelbagaian API menjadikannya ideal untuk aplikasi interaktif yang menggabungkan dialog semula jadi dengan output data berstruktur.

🔍 Keterbatasan

Bukan varian penaakulan terdalam: Untuk kedalaman analitik yang kritikal misi dan berisiko tinggi, model GPT-5.3 Thinking atau Pro yang akan datang mungkin lebih sesuai.
Output multimodal terhad: Walaupun input imej disokong, penjanaan imej/video penuh atau aliran kerja output multimodal kaya bukan fokus utama varian ini.
Penalaan halus tidak disokong: Anda tidak boleh melakukan fine-tune pada model ini, walaupun anda boleh mengawal tingkah laku melalui prompt sistem.

Cara mengakses API Gemini 3.1 flash lite

Langkah 1: Daftar untuk Kunci API

cometapi-key

Langkah 2: Hantar Permintaan ke API Gemini 3.1 flash lite

Masukkan soalan atau permintaan anda ke dalam medan content—itulah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dijana.

Langkah 3: Dapatkan Semula dan Sahkan Hasil

Proses respons API untuk mendapatkan jawapan yang dijana. Selepas diproses, API akan memberikan respons dengan status tugas dan data output.

Gemini 3.1 Flash-Lite

Lebih Banyak Model

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Qwen3.6-Plus

Blog Berkaitan

Cara mendapatkan Gemini 3.1 Deep Think

Google memperkenalkan Gemini 3.1 Flash-Lite — LLM yang pantas dan berkos rendah

Gemini 3.1 Flash-Lite

Lebih Banyak Model

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Qwen3.6-Plus

Blog Berkaitan

Cara mendapatkan Gemini 3.1 Deep Think

Google memperkenalkan Gemini 3.1 Flash-Lite — LLM yang pantas dan berkos rendah