Ulasan Gemini 3.5 Flash: Fitur, Benchmark, Harga, dan lainnya

CometAPI
AnnaMay 20, 2026
Ulasan Gemini 3.5 Flash: Fitur, Benchmark, Harga, dan lainnya

Google merilis Gemini 3.5 Flash pada 19 Mei 2026 di I/O, memposisikannya sebagai model berinteligensi tinggi yang dioptimalkan untuk kecepatan, dengan kinerja frontier berkelanjutan dalam alur kerja agentic, coding, dan tugas multimodal. Model ini dibangun di atas fondasi Gemini 3 Flash dengan “tingkat pemikiran” yang ditingkatkan untuk menyeimbangkan kualitas, biaya, dan latensi.

Panduan komprehensif ini mencakup semuanya: apa itu Gemini 3.5 Flash, fitur kunci, kinerja benchmark terperinci, harga, perbandingan dengan GPT-5.5, Claude 4.7/4.6, dan lainnya. Sebagai agregator API AI terdepan, CometAPI membantu pengembang mengakses Gemini 3.5 Flash (dan para pesaingnya) dengan harga terpadu, integrasi yang disederhanakan, serta alat optimasi biaya.

Apa Itu Gemini 3.5 Flash?

Gemini 3.5 Flash dibangun di atas fondasi penalaran Gemini 3 Flash dengan “tingkat pemikiran” yang ditingkatkan (minimal, rendah, sedang/default, tinggi) untuk menyetel trade-off kualitas-latensi-biaya. Ini adalah model multimodal native yang mendukung teks, gambar, video, audio, dan dokumen (termasuk PDF), dengan jendela konteks 1M token dan hingga 65K token keluaran. Batas pengetahuan adalah Januari 2025.

Pembedaan utama dari model Flash sebelumnya:

  • Kinerja frontier berkelanjutan pada tugas agentic, coding, dan long-horizon.
  • Pelestarian pemikiran: Secara otomatis mempertahankan penalaran intermediate di percakapan multi-giliran tanpa perubahan API tambahan.
  • Dioptimalkan untuk skala: Dirancang untuk eksekusi agentic paralel, coding iteratif, dan alur kerja enterprise multi-langkah.
  • Belum mendukung computer use, tetapi peningkatan kuat pada penggunaan alat dan pemanggilan fungsi.

Google memposisikannya sebagai “model Flash paling cerdas” untuk produksi, mengungguli Gemini 3.1 Pro sebelumnya pada banyak benchmark agentic dan coding sembari menghadirkan kecepatan setara Flash (sering >280 token keluaran/detik dalam pengujian).

Gemini 3.5 Flash unggul dalam alur kerja agentic dan coding dengan inteligensi mendekati Pro pada latensi dan biaya yang dioptimalkan, meraih skor seperti 76.2% pada Terminal-bench 2.1 dan 83.6% pada tugas multi-langkah MCP Atlas.

Terobosan Kinerja Benchmark

Pengujian independen menegaskan model ini memberikan kinerja setara atau melampaui Pro pada tugas coding/agentic dengan kecepatan lebih tinggi, meski total biaya eksekusi benchmark meningkat karena lebih banyak token terpakai dalam loop agen yang kompleks dan kenaikan harga 3x dibanding Flash sebelumnya.

Gemini 3.5 Flash menunjukkan peningkatan kuat dibanding pendahulunya, khususnya di domain agentic dan coding. Berikut hasil kunci dari model card Google DeepMind dan evaluasi independen (per Mei 2026):

Benchmark Terpilih (Gemini 3.5 Flash vs. pembanding):

Coding:

  • Terminal-bench 2.1 (Agentic terminal coding): 76.2% (vs. Gemini 3 Flash 58.0%, Gemini 3.1 Pro 70.3%, GPT-5.5 78.2%)
  • SWE-Bench Pro (Public, diverse agentic coding): 55.1% (vs. 49.6% untuk 3 Flash, 54.2% untuk 3.1 Pro)

Penggunaan Alat Agentic:

  • MCP Atlas (Multi-step workflows): 83.6% (unggul kuat)
  • Toolathlon (Real-world general tool use): 56.5%
  • Finance Agent v2: 57.9% (+15.3% besar atas 3 Flash)

Multimodal:

  • CharXiv (Chart reasoning): 84.2%
  • MMMU-Pro: 83.6% (memimpin banyak pesaing)

Penalaran & Konteks Panjang:

  • Humanity’s Last Exam: 40.2%
  • ARC-AGI-2: 72.1%
  • MRCR v2 (128k): 77.3%; konteks 1M kuat di 26.6% pointwise.

Ulasan Gemini 3.5 Flash: Fitur, Benchmark, Harga, dan lainnya

Artificial Analysis Intelligence Index: Gemini 3.5 Flash meraih 55 (pemikiran tinggi), naik 9 poin dari Gemini 3 Flash. Ia memimpin frontier Pareto Kecerdasan vs. Kecepatan, dengan peningkatan pada tugas agentic dan penurunan halusinasi (turun ke tingkat halusinasi 61%). Ia mencapai >280 token keluaran/detik tetapi menimbulkan penggunaan token lebih tinggi dalam loop agentic.

Model ini bersinar pada konteks panjang (MRCR v2 kuat dan 1M pointwise), kepemimpinan multimodal (grafik, dokumen), dan kinerja agentic berkelanjutan dengan pengurangan pemborosan token pada beberapa alur kerja (mis., 42% lebih baik pada benchmark siber dengan 72% lebih sedikit token).

Keseimbangan Kecepatan dan Kapabilitas Agentic

Gemini 3.5 Flash menonjol dalam trade-off kecepatan-inteligensi. Ia mencapai throughput tinggi (>280 token/detik) sambil mendukung perilaku agentic canggih seperti penerapan sub-agen, eksekusi paralel, dan iterasi cepat.

Upaya pemikiran default kini medium, berubah dari high pada Gemini 3 Flash Preview.

Thinking Levels memungkinkan kontrol presisi:

  • Medium (default): Keseimbangan terbaik untuk sebagian besar tugas kode dan agentic yang kompleks.
  • High: Memaksimalkan penalaran mendalam untuk masalah tersulit.
  • Low/Minimal: Latensi ultra-rendah untuk kueri yang lebih sederhana.

Google melaporkan peningkatan efisiensi token yang signifikan pada skenario agentic dunia nyata (mis., pengurangan 72% pada beberapa benchmark siber dibanding versi sebelumnya), menjadikannya layak untuk alur kerja jangka panjang yang berkelanjutan.

Trade-off: Harga lebih tinggi daripada model Flash sebelumnya menyebabkan peningkatan biaya keseluruhan pada skenario agentic yang berat token (biaya Indeks Kecerdasan 5.5x vs. Gemini 3 Flash akibat harga + penggunaan).

Kapabilitas yang Ditingkatkan untuk Agen Cerdas

Gemini 3.5 Flash memajukan “era agentic Gemini.” Peningkatan kunci mencakup:

  • Loop eksekusi agentic paralel: Menerapkan banyak sub-agen untuk pemecahan masalah kompleks.
  • Coding dan prototyping iteratif: Eksplorasi cepat jalur solusi dengan penggunaan alat dinamis.
  • Alur kerja multi-langkah berjangka panjang: Menangani proses enterprise yang diperluas dengan pelestarian pemikiran.
  • Peningkatan penggunaan alat: Pencocokan respons fungsi yang ketat, respons fungsi multimodal, dan pengurangan pemanggilan yang tidak perlu melalui prompting yang lebih baik dan tingkat pemikiran lebih rendah. Kuat pada OSWorld dan tugas UI.

Model ini menggerakkan agen informasi baru Google, riset otonom, dan pipeline coding. Dalam pengujian internal, model ini unggul membangun sistem kompleks dan mengelola proyek riset.

Bagi pengembang, Interactions API (beta) menyederhanakan pengelolaan riwayat di sisi server, mirip dengan pola lanjutan di ekosistem lain.

Rekomendasi CometAPI: Gunakan API terpadu kami untuk merangkai Gemini 3.5 Flash dengan model spesialis (mis., Claude untuk ulasan kode mendalam atau GPT untuk tugas kreatif) dalam sistem agentic. Fitur routing dan fallback kami memastikan keandalan dan penghematan biaya.

Kepemimpinan Multimodal

Google mempertahankan kepemimpinan dalam pemahaman multimodal. Gemini 3.5 Flash secara native memproses dan menalar atas teks + gambar + video + audio + dokumen. Model ini memimpin atau bersaing ketat pada benchmark seperti CharXiv, MMMU-Pro, dan tugas pemahaman video.

Kasus penggunaan: Sintesis grafik/data, analisis video, pemanggilan fungsi multimodal (mis., memproses gambar dalam respons alat), dan agen media kaya. Ini ideal untuk aplikasi e-commerce, pembuatan konten, visualisasi ilmiah, dan lainnya.

Harga: Berapa Biaya Gemini 3.5 Flash?

Harga Gemini API (per 1M token, tarif global perkiraan):

  • Input (teks/gambar/video/audio): $1.50
  • Output: $9.00
  • Context caching: $0.15 (penghematan signifikan untuk prompt berulang)

Ini merepresentasikan kenaikan ~3x dibanding Gemini 3 Flash Preview ($0.50/$3) namun tetap kompetitif untuk lompatan kapabilitasnya. Ia mendekati harga Gemini 3.1 Pro ($2/$12) sembari menawarkan kecepatan lebih baik untuk banyak beban kerja.

Tingkatan Enterprise/Agent Platform dapat bervariasi dengan diskon volume dan add-on. Input yang dicache dan prompting yang efisien (tingkat pemikiran lebih rendah, riwayat yang dioptimalkan) sangat membantu mengendalikan biaya.

Ini merepresentasikan kenaikan ~3x dibanding Gemini 3 Flash Preview ($0.50/$3) namun tetap kompetitif untuk lompatan kapabilitasnya. Ia mendekati harga Gemini 3.1 Pro ($2/$12) sembari menawarkan kecepatan lebih baik untuk banyak beban kerja.

Free Tier: Akses terbatas melalui Google AI Studio/Gemini app; berbayar untuk produksi.

Cometapi Advantage: Akses Gemini 3.5 Flash API bersama 100+ model dengan tarif kompetitif, analitik penggunaan, dan alat optimasi untuk meminimalkan pengeluaran token. Platform kami sering menghadirkan harga efektif lebih baik melalui smart routing dan batching. Harga API biasanya 20% lebih rendah daripada harga resmi.

Gemini 3.5 Flash vs. GPT-5.5, Claude 4.7/4.6 dan Lainnya

Kekuatan Gemini 3.5 Flash:

  • Keseimbangan Kecepatan + Agentic: Inferensi lebih cepat daripada kebanyakan model frontier sambil memperkecil kesenjangan inteligensi.
  • Multimodal & Konteks Panjang: Konteks 1M native dan kepemimpinan visi.
  • Biaya untuk Volume: Lebih murah per token daripada Claude/GPT papan atas untuk banyak beban kerja, terutama dengan caching.
  • Ekosistem Google: Integrasi mulus dengan Search, Workspace, Cloud.

Di Mana Pesaing Unggul:

  • GPT-5.5 sering unggul pada penalaran murni (mis., ARC-AGI) dan mungkin lebih kuat pada kapabilitas kreatif/umum.
  • Claude Opus 4.7/Sonnet 4.6 unggul dalam coding yang cermat (SWE-Bench lebih tinggi pada beberapa kasus) serta penulisan/keamanan yang bernuansa.
  • Efisiensi token bervariasi; loop agentic dapat membuat 3.5 Flash lebih mahal secara keseluruhan.

Perbandingan Tingkat Tinggi (metrik perkiraan/terpilih; selalu verifikasi papan peringkat terbaru):

Benchmark / MetrikGemini 3.5 FlashGPT-5.5Claude Opus 4.7 / Sonnet 4.6Gemini 3.1 ProCatatan
Terminal-bench 2.1 (Coding)76.2%78.2%~66%70.3%Agentic coding
MCP Atlas (Agentic)83.6%75.3%79.1% / 69.5%78.2%Alur kerja multi-langkah
GDPval-AA (Agentic Knowledge)1656 Elo176917531314Nilai ekonomi
MMMU-Pro (Multimodal)83.6%81.2%~75%80.5%Keunggulan Gemini
Intelligence Index (AA)55Tinggi (bervariasi)KompetitifLebih rendahPareto kecepatan/kecerdasan
Kecepatan (token/detik)>280Lebih rendahBervariasiLebih lambatKeunggulan Flash
Harga Input/Output ($/1M)1.50 / 9.00Lebih tinggiLebih tinggi (terutama Opus)2/12Frontier hemat biaya
Context Window1MKompetitifKuat1M+Semua level frontier

Ringkasan Trade-off:

  • Gemini 3.5 Flash unggul pada kecepatan + multimodal + efisiensi agentic untuk skala.
  • GPT-5.5 sering unggul pada puncak penalaran/coding.
  • Claude 4.7 Opus unggul dalam coding yang cermat dan andal, namun dengan biaya/latensi lebih tinggi.

Gemini sering memimpin atau seri pada suite multimodal dan agentic tertentu sambil lebih cepat dan lebih terjangkau untuk penggunaan volume tinggi.

Cara Mengakses dan Mengintegrasikan Gemini 3.5 Flash

Akses melalui:

  • Gemini App / Google AI Studio
  • Gemini API (gemini-3.5-flash)
  • Google Cloud Vertex AI / Enterprise Agent Platform
  • Agregator pihak ketiga untuk fleksibilitas multi-provider.

Rekomendasi CometAPI: Untuk aplikasi produksi di Cometapi.com, integrasikan sekali melalui satu API key untuk mengakses Gemini 3.5 Flash (dan 500+ model dari OpenAI, Anthropic, xAI, dll.) dengan harga efektif 20-40% lebih rendah, tanpa penguncian vendor, dan mudah mengganti model.

Manfaat untuk Proyek Anda:

  • Uji Gemini 3.5 Flash vs. GPT-5.5 atau Claude 4.7 seketika dengan mengganti nama model.
  • Penagihan terpadu, fallback routing, dan latensi yang dioptimalkan.
  • Ideal untuk aplikasi agentic yang memerlukan keandalan lintas penyedia.
  • Pendaftaran API key gratis dengan batas uji yang lapang.

Contoh integrasi mudah dengan SDK resmi atau endpoint terpadu CometAPI—sempurna untuk penskalaan coding

Kasus Penggunaan dan Praktik Terbaik

  1. Automasi Agentic: Bangun sistem multi-agen yang tangguh untuk riset, analisis data, atau dukungan pelanggan.
  2. Coding & Pengembangan: Prototyping iteratif, debugging, dan generasi pipeline penuh di Antigravity atau IDE.
  3. Aplikasi Multimodal: Analisis gambar/video, pemahaman grafik, generasi konten.
  4. Alur Kerja Enterprise: Proses jangka panjang dengan kontrol biaya melalui caching dan tingkat pemikiran.

Tips: Gunakan riwayat percakapan penuh untuk pelestarian pemikiran. Mulai dengan medium. Optimalkan prompt untuk mengurangi pemanggilan alat. Pantau penggunaan token untuk efisiensi biaya.

Batasan dan Pertimbangan

  • Kenaikan harga memerlukan optimasi cermat untuk aplikasi volume tinggi.
  • Belum ada computer use (pantau pembaruan).
  • Evaluasi keamanan menunjukkan kinerja solid dengan peningkatan nada, meski metrik otomatis bervariasi.
  • Pengurangan halusinasi terlihat, namun selalu validasi keluaran yang kritis.
  • Kenaikan Harga: Lebih tinggi dari model Flash sebelumnya; optimalkan dengan tingkat pemikiran dan caching.
  • Batas Pengetahuan: Januari 2025—gunakan grounding/alat Pencarian untuk peristiwa terkini.

Kesimpulan: Apakah Gemini 3.5 Flash Layak?

Ya—untuk pengembang dan enterprise yang memprioritaskan kecepatan, keandalan agentic, kapabilitas multimodal, dan kinerja yang dapat diskalakan. Model ini mendorong frontier Pareto, membuat AI frontier lebih mudah diakses untuk beban kerja produksi.

Siap membangun? Kunjungi CometAPI hari ini untuk menguji Gemini 3.5 Flash bersama model top lainnya dalam satu dasbor. Optimalkan tumpukan AI Anda, tekan biaya, dan kirim lebih cepat.

Siap memangkas biaya pengembangan AI hingga 20%?

Mulai gratis dalam beberapa menit. Kredit uji coba gratis disertakan. Tidak perlu kartu kredit.

Baca Selengkapnya