ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Syarikat
Tentang kamiPerusahaan
Sumber
Model AIBlogLog PerubahanSokongan
Terma PerkhidmatanDasar Privasi
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Masukan:$0.24/M
Keluaran:$2/M
Konteks:1M
Keluaran Maksimum:65K
Gemini 2.5 Flash ialah model AI yang dibangunkan oleh Google, direka untuk menyediakan penyelesaian yang pantas dan menjimatkan kos untuk pembangun, terutamanya bagi aplikasi yang memerlukan keupayaan inferens yang dipertingkat. Menurut pengumuman pratonton Gemini 2.5 Flash, model ini dikeluarkan dalam pratonton pada 17 April 2025, menyokong input multimodal, dan mempunyai tetingkap konteks sebanyak 1 juta token. Model ini menyokong panjang konteks maksimum sebanyak 65,536 token.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API
Versi

Gemini 2.5 Flash direka untuk memberikan respons pantas tanpa menjejaskan kualiti output. Ia menyokong input multimodal, termasuk teks, imej, audio dan video, menjadikannya sesuai untuk pelbagai aplikasi. Model ini boleh diakses melalui platform seperti Google AI Studio dan Vertex AI, menyediakan pembangun dengan alat yang diperlukan untuk integrasi lancar ke dalam pelbagai sistem.


Maklumat Asas (Ciri-ciri)

Gemini 2.5 Flash memperkenalkan beberapa ciri menonjol yang membezakannya dalam keluarga Gemini 2.5:

  • Penaakulan Hibrid: Pembangun boleh menetapkan parameter thinking_budget untuk mengawal dengan teliti bilangan token yang diperuntukkan oleh model untuk penaakulan dalaman sebelum output.
  • Sempadan Pareto: Diletakkan pada titik kos-prestasi optimum, Flash menawarkan nisbah harga-ke-kepintaran terbaik dalam kalangan model 2.5.
  • Sokongan Multimodal: Memproses teks, imej, video dan audio secara natif, membolehkan keupayaan perbualan dan analitik yang lebih kaya.
  • Konteks 1 Juta Token: Panjang konteks yang tiada tandingan membolehkan analisis mendalam dan pemahaman dokumen panjang dalam satu permintaan.

Versi Model

Gemini 2.5 Flash telah melalui versi utama berikut:

  • gemini-2.5-flash-lite-preview-09-2025: Kebolehgunaaan alat dipertingkat: Prestasi lebih baik pada tugasan kompleks berbilang langkah, dengan peningkatan 5% dalam skor SWE-Bench Verified (daripada 48.9% kepada 54%). Kecekapan dipertingkat: Apabila penaakulan didayakan, output berkualiti lebih tinggi dicapai dengan lebih sedikit token, mengurangkan kependaman dan kos.
  • Preview 04-17: Keluaran akses awal dengan keupayaan “thinking”, tersedia melalui gemini-2.5-flash-preview-04-17.
  • Ketersediaan Umum (GA) Stabil: Mulai 17 Jun 2025, titik akhir stabil gemini-2.5-flash menggantikan pratonton, memastikan kebolehpercayaan gred produksi tanpa perubahan API daripada pratonton 20 Mei.
  • Penyahgunaan Pratonton: Titik akhir pratonton dijadualkan ditutup pada 15 Julai 2025; pengguna mesti berhijrah ke titik akhir GA sebelum tarikh ini.

Mulai Julai 2025, Gemini 2.5 Flash kini tersedia kepada umum dan stabil (tiada perubahan daripada gemini-2.5-flash-preview-05-20). Jika anda menggunakan gemini-2.5-flash-preview-04-17, harga pratonton sedia ada akan diteruskan sehingga persaraan berjadual titik akhir model pada 15 Julai 2025, apabila ia akan ditutup. Anda boleh berhijrah ke model yang tersedia secara umum "gemini-2.5-flash".

Lebih pantas, lebih murah, lebih pintar:

  • Matlamat reka bentuk: kependaman rendah + kadar hantaran tinggi + kos rendah;
  • Peningkatan kelajuan keseluruhan dalam penaakulan, pemprosesan multimodal dan tugasan teks panjang;
  • Penggunaan token dikurangkan sebanyak 20–30%, sekali gus mengurangkan kos penaakulan dengan ketara.

Spesifikasi Teknikal

Tetingkap Konteks Input: Sehingga 1 juta token, membolehkan pengekalan konteks yang meluas.

Token Output: Mampu menghasilkan sehingga 8,192 token bagi setiap respons.

Modaliti Disokong: Teks, imej, audio dan video.

Platform Integrasi: Tersedia melalui Google AI Studio dan Vertex AI.

Harga: Model harga berasaskan token yang kompetitif, memudahkan penggunaan yang kos efektif.


Perincian Teknikal

Pada asasnya, Gemini 2.5 Flash ialah model bahasa besar berasaskan transformer yang dilatih pada gabungan data web, kod, imej dan video. Spesifikasi teknikal utama termasuk:

Latihan Multimodal: Dilatih untuk menyelaraskan pelbagai modaliti, Flash boleh menggabungkan teks dengan imej, video atau audio secara lancar, berguna untuk tugasan seperti ringkasan video atau pengkapsyenan audio.

Proses Pemikiran Dinamik: Melaksanakan gelung penaakulan dalaman di mana model merancang dan memecahkan arahan kompleks sebelum output akhir.

Bajet Pemikiran Boleh Dikonfigur: thinking_budget boleh ditetapkan daripada 0 (tiada penaakulan) hingga 24,576 token, membolehkan pertukaran antara kependaman dan kualiti jawapan.

Integrasi Alat: Menyokong Grounding with Google Search, Code Execution, URL Context dan Function Calling, membolehkan tindakan dunia sebenar terus daripada arahan bahasa semula jadi.


Prestasi Penanda Aras

Dalam penilaian yang ketat, Gemini 2.5 Flash menunjukkan prestasi terkemuka industri:

  • LMArena Hard Prompts: Mendapat skor kedua selepas 2.5 Pro pada penanda aras Hard Prompts yang mencabar, mempamerkan keupayaan penaakulan berbilang langkah yang kukuh.
  • Skor MMLU sebanyak 0.809: Melebihi prestasi purata model dengan ketepatan MMLU 0.809, menggambarkan keluasan pengetahuan domain dan kehebatan penaakulannya.
  • Kependaman dan Kadar Hantaran: Mencapai kelajuan penyahkodan 271.4 tokens/sec dengan 0.29 s Time-to-First-Token, menjadikannya sesuai untuk beban kerja sensitif kependaman.
  • Peneraju Harga-berbanding-Prestasi: Pada $0.26/1 M tokens, Flash menewaskan ramai pesaing sambil menyamai atau mengatasi mereka pada penanda aras utama.

Hasil ini menunjukkan kelebihan daya saing Gemini 2.5 Flash dalam penaakulan, kefahaman saintifik, penyelesaian masalah matematik, pengaturcaraan, tafsiran visual dan keupayaan berbilang bahasa:


Batasan

Walaupun berkuasa, Gemini 2.5 Flash mempunyai beberapa batasan:

  • Risiko Keselamatan: Model boleh mempamerkan nada “mengajar” dan mungkin menghasilkan output yang kedengaran munasabah tetapi tidak tepat atau berat sebelah (halusinasi), terutamanya pada pertanyaan kes tepi. Penyeliaan manusia yang ketat kekal penting.
  • Had Kadar: Penggunaan API dihadkan oleh had kadar (10 RPM, 250,000 TPM, 250 RPD pada peringkat lalai), yang boleh menjejaskan pemprosesan kelompok atau aplikasi volum tinggi.
  • Paras Kecerdasan Minimum: Walaupun amat berkeupayaan untuk model flash, ia masih kurang tepat berbanding 2.5 Pro bagi tugasan agen paling mencabar seperti pengaturcaraan lanjutan atau penyelarasan berbilang agen.
  • Pertukaran Kos: Walaupun menawarkan harga-prestasi terbaik, penggunaan meluas mod thinking meningkatkan penggunaan token keseluruhan, sekali gus menaikkan kos untuk arahan yang memerlukan penaakulan mendalam.

Ciri-ciri untuk Gemini 2.5 Flash

Terokai ciri-ciri utama Gemini 2.5 Flash, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Gemini 2.5 Flash

Terokai harga yang kompetitif untuk Gemini 2.5 Flash, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Gemini 2.5 Flash boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Kod contoh dan API untuk Gemini 2.5 Flash

Gemini 2.5 Flash API ialah model AI multimodal terbaharu daripada Google, direka untuk tugasan berkelajuan tinggi serta berkesan dari segi kos, dengan keupayaan penaakulan yang boleh dikawal, membolehkan pembangun menghidupkan atau mematikan ciri "thinking" lanjutan melalui Gemini API.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Versi Gemini 2.5 Flash

Sebab Gemini 2.5 Flash mempunyai berbilang snapshot mungkin merangkumi faktor berpotensi seperti variasi output selepas kemas kini yang memerlukan snapshot lama untuk konsistensi, menyediakan tempoh peralihan untuk penyesuaian dan migrasi kepada pembangun, serta snapshot berbeza yang sepadan dengan endpoint global atau serantau untuk mengoptimumkan pengalaman pengguna. Untuk perbezaan terperinci antara versi, sila rujuk dokumentasi rasmi.
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-image-preview
gemini-2.5-flash-thinking
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-thinking

Lebih Banyak Model

C

Claude Opus 4.7

Masukan:$3/M
Keluaran:$15/M
Model paling pintar untuk ejen dan pengekodan
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 ialah model Sonnet kami yang paling berkeupayaan setakat ini. Ia merupakan peningkatan menyeluruh terhadap kemahiran model yang meliputi pengaturcaraan, penggunaan komputer, penaakulan konteks panjang, perancangan agen, kerja berasaskan pengetahuan, dan reka bentuk. Sonnet 4.6 turut menampilkan tetingkap konteks 1M token dalam beta.
O

GPT 5.5 Pro

Masukan:$24/M
Keluaran:$144/M
Model canggih yang direka bentuk untuk logik yang amat kompleks serta tuntutan profesional, mewakili piawaian tertinggi dalam penaakulan mendalam dan keupayaan analitik yang tepat.
O

GPT 5.5

Masukan:$4/M
Keluaran:$24/M
Model perdana multimodal generasi seterusnya yang mengimbangi prestasi cemerlang dengan respons yang cekap, dikhususkan untuk menyediakan perkhidmatan AI tujuan umum yang komprehensif dan stabil.
O

GPT Image 2 ALL

Setiap Permintaan:$0.04
GPT Image 2 ialah model penjanaan imej termaju daripada openai untuk penjanaan dan penyuntingan imej yang pantas serta berkualiti tinggi. Ia menyokong saiz imej yang fleksibel dan input imej berketepatan tinggi.
O

GPT 5.5 ALL

Masukan:$4/M
Keluaran:$24/M
GPT-5.5 cemerlang dalam penulisan kod, penyelidikan dalam talian, analisis data dan operasi rentas alat. Model ini bukan sahaja meningkatkan autonominya dalam menangani tugasan berbilang langkah yang kompleks, malah turut meningkatkan dengan ketara keupayaan penaakulan dan kecekapan pelaksanaan sambil mengekalkan latensi yang sama seperti pendahulunya, sekali gus menandakan satu langkah penting ke arah automasi pejabat automatik dalam AI.

Blog Berkaitan

Nano Banana 2 Flash Akan datang – Evolusi Berkelajuan Tinggi dalam Penjanaan Imej AI
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash Akan datang – Evolusi Berkelajuan Tinggi dalam Penjanaan Imej AI

Google sekali lagi menggegarkan landskap AI generatif dengan Nano Banana 2 Flash yang bakal dilancarkan tidak lama lagi, tambahan terbaharu kepada keluarga penjanaan imej "Nano Banana" yang mendapat pujian meluas. Susulan kejayaan besar Nano Banana Pro (Gemini 3 Pro Image) pada akhir tahun lalu, iterasi baharu ini menjanjikan pendemokrasian sintesis visual bertaraf profesional dengan menggabungkan kecerdasan termaju seni bina Gemini 3 dengan kelajuan dan kecekapan yang belum pernah dicapai sebelum ini.
Diskaun Nano Banana: benar-benar menjimatkan wang pada tahun 2026 untuk pembangun
Dec 25, 2025
nano-banana-pro

Diskaun Nano Banana: benar-benar menjimatkan wang pada tahun 2026 untuk pembangun

Kesimpulannya: API rasmi Nano Banana tidak menawarkan sebarang diskaun untuk Krismas, Tahun Baru, atau cuti perayaan lain. Ini ialah fakta yang mesti difahami oleh semua pembangun yang merancang untuk menggunakan Nano Banana (termasuk Nano Banana Pro) bagi penjanaan imej, penghasilan kandungan, atau integrasi produk pada tahun 2026. Google tidak menawarkan diskaun bermusim untuk API Nano Banana, sama ada ketika Krismas, Black Friday, atau Tahun Baru. Sistem harga API rasmi adalah sentiasa stabil dan telus, dengan hampir tiada ruang untuk diskaun. Jadi persoalannya ialah: Jika anda seorang pembangun, dan jika anda merancang untuk melakukan penjanaan imej berskala besar, pengujian model, atau iterasi produk semasa Krismas atau Tahun Baru, adakah terdapat cara untuk mengurangkan kos penggunaan Nano Banana?
Adakah API Gemini 2.5 Pro percuma rosak? Perubahan pada kuota percuma pada tahun 2025
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Adakah API Gemini 2.5 Pro percuma rosak? Perubahan pada kuota percuma pada tahun 2025

Google telah memperketat peringkat percuma untuk Gemini API dengan ketara: Gemini 2.5 Pro telah dikeluarkan daripada peringkat percuma dan permintaan percuma harian Gemini 2.5 Flash telah dipotong secara drastik (laporan: ~250 → ~20/hari). Itu tidak bermakna model tersebut “mati” secara kekal untuk eksperimen — tetapi ia bermakna akses percuma pada hakikatnya telah dilucutkan bagi banyak kes penggunaan dunia sebenar.
Panduan Terbaik untuk Nano-Banana: Cara Menggunakan dan Meminta yang terbaik
Sep 8, 2025
gemini-2-5-flash-image

Panduan Terbaik untuk Nano-Banana: Cara Menggunakan dan Meminta yang terbaik

Keluaran Google Gemini 2.5 Flash Image baru-baru ini — digelar “Nano-Banana” dengan cepat menjadi pilihan untuk penyuntingan imej perbualan: ia mengekalkan persamaan
Bagaimana untuk Menggunakan Banana Nano melalui API? (Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

Bagaimana untuk Menggunakan Banana Nano melalui API? (Gemini-2-5-flash-image)

Nano Banana ialah nama panggilan komuniti (dan trengkas dalaman) untuk Imej Kilat Gemini 2.5 Google — penjanaan imej multimodal berkependaman rendah berkualiti tinggi +