МодельдерБағалауКәсіпорын
500+ AI Model API, Барлығы Бір API-да. Тек CometAPI-де
Модельдер API
Әзірлеуші
Жылдам бастауҚұжаттамаAPI Бақылау Тақтасы
Компания
Біз туралыКәсіпорын
Ресурстар
AI МодельдеріБлогӨзгерістер журналыҚолдау
Қызмет көрсету шарттарыҚұпиялылық саясаты
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

Енгізу:$0.24/M
Шығыс:$2/M
Контекст:1M
Максималды шығыс:65K
Gemini 2.5 Flash — Google әзірлеген жасанды интеллект моделі, ол әзірлеушілерге, әсіресе инференс мүмкіндіктерін күшейтуді талап ететін қолданбалар үшін, жылдам әрі үнемді шешімдер ұсыну үшін жасалған. Gemini 2.5 Flash алдын ала қарау туралы хабарландыруға сәйкес, модель 2025 жылғы 17 сәуірде алдын ала нұсқада шығарылды, көпмодальды енгізуді қолдайды және 1 миллион токендік контекст терезесіне ие. Бұл модель ең көбі 65,536 токендік контекст ұзындығын қолдайды.
Жаңа
Коммерциялық пайдалану
Playground
Шолу
Мүмкіндіктер
Баға белгілеу
API
Нұсқалар

Gemini 2.5 Flash жоғары сапаны құрбан етпей, жедел жауап беру үшін жасалған. Ол мәтін, кескіндер, аудио және бейне сияқты көпмодальды енгізулерді қолдайды, бұл оны әртүрлі қолданбаларға лайықты етеді. Бұл модель Google AI Studio және Vertex AI сияқты платформалар арқылы қолжетімді, әзірлеушілерге әртүрлі жүйелерге үздіксіз біріктіруге қажетті құралдарды ұсынады.


Негізгі ақпарат (Мүмкіндіктер)

Gemini 2.5 Flash оны Gemini 2.5 отбасында ерекшелендіретін бірқатар айрықша мүмкіндіктерді ұсынады:

  • Гибридті пайымдау: Әзірлеушілер модельдің нәтиже шығаруға дейін ішкі пайымдауға қанша токен бөлуін дәл бақылау үшін thinking_budget параметрін орната алады.
  • Парето шебі: құн-өнімділіктің оңтайлы нүктесінде орналасқан Flash 2.5 модельдері арасында баға мен интеллект арақатынасы бойынша ең үздік көрсеткішті ұсынады.
  • Көпмодальды қолдау: мәтінді, кескіндерді, бейне мен аудионы табиғи түрде өңдейді, бұл неғұрлым бай диалогтық және талдамалық мүмкіндіктерге жол ашады.
  • 1 миллион токендік контекст: Бір сұранымда терең талдауға және ұзын құжаттарды түсінуге мүмкіндік беретін теңдессіз контекст ұзындығы.

Модель нұсқалары

Gemini 2.5 Flash келесі негізгі нұсқалардан өтті:

  • gemini-2.5-flash-lite-preview-09-2025: Құралдың қолданылуын жақсарту: Күрделі, көпқадамды тапсырмаларда өнімділігі артты, SWE-Bench Verified көрсеткіші 5% өсті (48.9%-дан 54%-ға). Тиімділікті арттыру: Пайымдауды қосқанда, аз токенмен жоғары сапалы нәтиже алынады, бұл кідіртуді және шығындарды азайтады.
  • Preview 04-17: «ойлау» мүмкіндігі бар ерте қолжетімділік нұсқасы, gemini-2.5-flash-preview-04-17 арқылы қолжетімді.
  • Stable General Availability (GA): 2025 жылғы 17 маусымнан бастап тұрақты соңғы нүкте gemini-2.5-flash алдын-ала нұсқаны алмастырады, 20 мамырдағы алдын-ала нұсқамен салыстырғанда API өзгерістерінсіз өндірістік деңгейдегі сенімділікті қамтамасыз етеді.
  • Preview-дің қолданыстан шығуы: Preview соңғы нүктелерін 2025 жылғы 15 шілдеде тоқтату жоспарланды; пайдаланушылар осы күнге дейін GA соңғы нүктесіне көшуі тиіс.

2025 жылдың шілдесінен бастап Gemini 2.5 Flash жалпыға қолжетімді және тұрақты (gemini-2.5-flash-preview-05-20 нұсқасынан өзгерістер жоқ). Егер сіз gemini-2.5-flash-preview-04-17 қолдансаңыз, қолданыстағы preview бағалары 2025 жылғы 15 шілдеде модельдің соңғы нүктесі жоспарлы түрде тоқтатылғанға дейін сақталады. Сіз жалпы қолжетімді модель "gemini-2.5-flash" нұсқасына көше аласыз.

Жылдамырақ, арзанырақ, ақылдырақ:

  • Дизайн мақсаттары: төмен кідіріс + жоғары өткізу қабілеті + төмен құн;
  • Пайымдау, көпмодальды өңдеу және ұзын мәтіндермен жұмыс бойынша жалпы жылдамдықтың артуы;
  • Токен тұтынуы 20–30% азайып, пайымдау құнын едәуір төмендетеді.

Техникалық сипаттамалар

Енгізудің контексттік терезесі: 1 миллион токенге дейін, бұл контексті кең көлемде сақтауға мүмкіндік береді.

Шығыс токендері: бір жауапта 8,192 токенге дейін генерациялай алады.

Қолданылатын модальдылықтар: мәтін, кескіндер, аудио және бейне.

Интеграция платформалары: Google AI Studio және Vertex AI арқылы қолжетімді.

Бағалар: Қолайлы, токенге негізделген баға үлгісі, тиімді енгізуді жеңілдетеді.


Техникалық мәліметтер

Ішкі архитектура жағынан, Gemini 2.5 Flash веб, код, кескін және бейне деректерінің қоспасында оқытылған transformer-негізіндегі ірі тілдік модель. Негізгі техникалық сипаттамалар:

Көпмодальды оқыту: Бірнеше модальдылықты қиыстыруға үйретілгендіктен, Flash мәтінді кескіндермен, бейнемен немесе аудиомен еш кедергісіз араластыра алады; бұл бейнені қысқаша мазмұндау немесе аудиоға сипаттама жасау сияқты тапсырмаларға пайдалы.

Динамикалық ойлау үдерісі: Модель қорытынды нәтижені шығармай тұрып, күрделі нұсқауларды жоспарлап, кезеңдерге бөлетін ішкі пайымдау циклін іске асырады.

Бапталатын ойлау бюджеті: thinking_budget мәнін 0 (пайымдау жоқ) мен 24,576 токен аралығында орнатуға болады, бұл кідіру мен жауап сапасы арасында теңгерім жасауға мүмкіндік береді.

Құралдармен интеграция: Grounding with Google Search, Code Execution, URL Context және Function Calling қолдауын ұсынады, бұл табиғи тілдегі нұсқаулардан тікелей шынайы әрекеттер орындауға мүмкіндік береді.


Бенчмарк нәтижелері

Қатал бағалау кезінде Gemini 2.5 Flash салалық деңгейдегі үздік өнімділікті көрсетеді:

  • LMArena Hard Prompts: Қиын Hard Prompts бенчмаркі бойынша тек 2.5 Pro-дан кейінгі екінші орын, көпқадамды пайымдау қабілетінің жоғары екенін көрсетеді.
  • MMLU көрсеткіші 0.809: 0.809 MMLU дәлдігімен орташа модель өнімділігінен жоғары, кең сала білімі мен пайымдау қабілетін айқындайды.
  • Кідіру және өткізу қабілеті: 271.4 токен/с декодтау жылдамдығына және 0.29 с бірінші токенге дейінгі уақытқа жетеді, бұл кідіріс сезімтал жұмыс жүктемелері үшін оңтайлы.
  • Баға/өнімділік бойынша көшбасшы: \ $0.26/1 M токен деңгейінде, Flash көптеген бәсекелестерден арзанырақ болып, негізгі бенчмарктерде олармен теңеседі немесе асып түседі.

Бұл нәтижелер Gemini 2.5 Flash-тың пайымдау, ғылыми түсінік, математикалық есептерді шешу, код жазу, визуалды интерпретация және көптілді мүмкіндіктер бойынша бәсекелік артықшылығын көрсетеді:


Шектеулер

Қуатты болғанымен, Gemini 2.5 Flash кейбір шектеулерге ие:

  • Қауіпсіздік тәуекелдері: Модель кейде "ақылгөйсіген" реңкке ие болуы мүмкін және әсіресе шеткі жағдайлардағы сұрауларда шындыққа ұқсас, бірақ қате немесе біржақты нәтижелер (галлюцинациялар) тудыруы ықтимал. Қатаң адамдық бақылау әлі де маңызды.
  • Жиілік шектеулері: API пайдалану жиілік шектеулерімен шектеледі (әдепкі деңгейлерде 10 RPM, 250,000 TPM, 250 RPD), бұл топтамалық өңдеуге немесе жоғары жүктемелі қолданбаларға әсер етуі мүмкін.
  • Интеллект шегі: Flash моделіне тән ерекше қабілеттеріне қарамастан, күрделі код жазу немесе көп агентті үйлестіру сияқты ең талапшыл агенттік тапсырмаларда 2.5 Pro-ға қарағанда дәлдігі төмендеу.
  • Құндық теңгерімдер: Баға/өнімділік жағынан үздік болғанымен, ойлау режимін кеңінен пайдалану жалпы токен тұтынуын арттырып, терең пайымдауды қажет ететін нұсқаулар үшін шығынды көбейтеді.

Gemini 2.5 Flash үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

Gemini 2.5 Flash үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Gemini 2.5 Flash үшін үлгі код және API

Gemini 2.5 Flash API — Google-дың ең жаңа көпмодальды жасанды интеллект моделі; ол жоғары жылдамдықты, шығын тұрғысынан тиімді тапсырмаларға арналған, басқарылатын пайымдау мүмкіндіктеріне ие және әзірлеушілерге Gemini API арқылы кеңейтілген "ойлану" функцияларын қосып немесе өшіруге мүмкіндік береді.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Gemini 2.5 Flash нұсқалары

Gemini 2.5 Flash бірнеше снупшоттарының болуының себептеріне мыналар жатады: жаңартулардан кейінгі шығыстардың өзгеруі, бұрынғы снупшоттарды тұрақтылықты сақтау үшін қолдану, әзірлеушілерге бейімделу және көшіру үшін өту кезеңін ұсыну, сондай-ақ әртүрлі снупшоттардың жаһалдық немесе аймақтық эндпоинттерге сәйкес келуі арқылы пайдаланушы тәжірибесін оңтайландыру. Нұсқалар арасындағы егжей-тегжейлі айырмашылықтар үшін ресми құжаттамаға жүгініңіз.
version
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-image
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-lite-thinking
gemini-2.5-flash
gemini-2.5-flash-image-preview
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-09-2025
gemini-2.5-flash-thinking

Көбірек модельдер

C

Claude Opus 4.7

Енгізу:$3/M
Шығыс:$15/M
Агенттер мен кодтауға арналған ең ақылды модель
A

Claude Sonnet 4.6

Енгізу:$2.4/M
Шығыс:$12/M
Claude Sonnet 4.6 — әзірге біздің ең қабілетті Sonnet моделіміз. Ол кодтау, компьютерді пайдалану, ұзақ контекст бойынша пайымдау, агенттік жоспарлау, білімге негізделген жұмыс және дизайн бойынша модельдің дағдыларын толық жаңартуды қамтиды. Sonnet 4.6 сондай-ақ бета нұсқасында 1M токендік контекст терезесін ұсынады.
O

GPT 5.5 Pro

Енгізу:$24/M
Шығыс:$144/M
Аса күрделі логика мен кәсіби талаптарға арнап жобаланған, терең пайымдау мен дәл аналитикалық мүмкіндіктердің ең жоғары стандартын танытатын жетілдірілген модель.
O

GPT 5.5

Енгізу:$4/M
Шығыс:$24/M
Ерекше өнімділікті тиімді әрі жедел жауап берумен үйлестіретін, жан-жақты және тұрақты жалпы мақсаттағы жасанды интеллект қызметтерін ұсынуға арналған келесі буын көпмодальды флагмандық модель.
O

GPT Image 2 ALL

Сұраным бойынша:$0.04
GPT Image 2 — OpenAI-дің ең озық кескін генерациялау моделі, жылдам әрі жоғары сапалы кескіндерді жасау және өңдеуге арналған. Ол икемді кескін өлшемдерін және жоғары дәлдіктегі кескін кірістерін қолдайды.
O

GPT 5.5 ALL

Енгізу:$4/M
Шығыс:$24/M
GPT-5.5 код жазу, онлайн зерттеу, деректерді талдау және құралдар арасындағы операцияларда үздік нәтиже көрсетеді. Модель күрделі көпқадамды тапсырмаларды орындаудағы дербестігін ғана арттырып қоймай, алдыңғы нұсқасымен бірдей кідірісті сақтай отырып, пайымдау қабілеттері мен орындау тиімділігін айтарлықтай жақсартады, бұл AI саласында кеңсе жұмыстарының автоматтандырылуына қарай маңызды қадам болып табылады.

Байланысты блогтар

Nano Banana 2 Flash Жақында – AI кескін генерациясының жоғары жылдамдықты эволюциясы
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash Жақында – AI кескін генерациясының жоғары жылдамдықты эволюциясы

Google генеративті жасанды интеллект ландшафтына тағы да түбегейлі өзгеріс енгізді жақында шығады Nano Banana 2 Flash арқылы, ол оның кеңінен мойындалған "Nano Banana" сурет генерациясы отбасындағы ең соңғы толықтыру болып табылады. Өткен жылдың соңында Nano Banana Pro (Gemini 3 Pro Image) үлкен табысқа жеткеннен кейін, бұл жаңа итерация Gemini 3 архитектурасының алдыңғы қатарлы интеллектін бұрын-соңды болмаған жылдамдық пен тиімділікпен ұштастыра отырып, кәсіби деңгейдегі визуалды синтезді баршаға қолжетімді етуді уәде етеді.
Nano Banana жеңілдіктері: 2026 жылы әзірлеушілерге шынымен ақша үнемдеуге көмектеседі
Dec 25, 2025
nano-banana-pro

Nano Banana жеңілдіктері: 2026 жылы әзірлеушілерге шынымен ақша үнемдеуге көмектеседі

Қорытынды: Ресми Nano Banana API Рождествоға, Жаңа жылға немесе өзге мерекелерге ешқандай жеңілдіктер ұсынбайды. Бұл — 2026 жылы Nano Banana-ны (Nano Banana Pro қоса алғанда) кескін генерациясы, контент жасау немесе өнімге біріктіру үшін пайдалануды жоспарлаған барлық әзірлеушілер түсінуі тиіс факт. Google Nano Banana API үшін маусымдық жеңілдіктер ұсынбайды, мейлі ол Рождество, Қара жұма немесе Жаңа жыл болсын. Ресми API-дің баға белгілеу жүйесі үнемі тұрақты әрі ашық, дерлік жеңілдіктерге орын қалдырмайды. Ендеше сұрақ мынада: егер сіз әзірлеуші болсаңыз және Рождество немесе Жаңа жыл кезінде ауқымды кескін генерациясын, модельді сынауды немесе өнімді итерациялауды жоспарласаңыз, Nano Banana пайдалану құнын азайтудың қандай да бір жолы бар ма?
Тегін Gemini 2.5 Pro API істен шықты ма? 2025 жылғы тегін квотадағы өзгерістер
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Тегін Gemini 2.5 Pro API істен шықты ма? 2025 жылғы тегін квотадағы өзгерістер

Google Gemini API үшін тегін деңгейді айтарлықтай қатаңдатты: Gemini 2.5 Pro тегін деңгейден алынып тасталды, ал Gemini 2.5 Flash үшін күнделікті тегін сұраулар саны күрт қысқартылды (есептер: ~250 → ~20/күн). Бұл модельді тәжірибелер үшін мәңгілікке "өлі" дегенді білдірмейді — бірақ бұл көптеген нақты қолдану жағдайлары үшін тегін қолжетімділіктің іс жүзінде қатты шектелгенін білдіреді.
Нано-бананға арналған түпкілікті нұсқаулық: қалай пайдалану және ең жақсысын сұрау
Sep 8, 2025
gemini-2-5-flash-image

Нано-бананға арналған түпкілікті нұсқаулық: қалай пайдалану және ең жақсысын сұрау

Google-дың жуырда шығарған Gemini 2.5 Flash Image — лақап аты — «Нано-Банан» тез сөйлесу кескінін өңдеуге айналды: ол ұқсастықтарды сақтайды.
API арқылы Nano Banana қалай пайдалануға болады? (Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

API арқылы Nano Banana қалай пайдалануға болады? (Gemini-2-5-flash-image)

Nano Banana — Google Gemini 2.5 Flash Image үшін қауымдастықтың лақап аты (және ішкі стенографиясы) — жоғары сапалы, аз кідіріспен мультимодальды кескін жасау +