Gemini 2.5 Flash

Google
gemini-2.5-flash-preview-09-2025
Енгізу:$0.24/M
Шығыс:$2.00/M
Контекст:1M
Максималды шығыс:65K
Gemini 2.5 Flash — Google әзірлеген жасанды интеллект моделі, ол әзірлеушілерге, әсіресе инференс мүмкіндіктерін күшейтуді талап ететін қолданбалар үшін, жылдам әрі үнемді шешімдер ұсыну үшін жасалған. Gemini 2.5 Flash алдын ала қарау туралы хабарландыруға сәйкес, модель 2025 жылғы 17 сәуірде алдын ала нұсқада шығарылды, көпмодальды енгізуді қолдайды және 1 миллион токендік контекст терезесіне ие. Бұл модель ең көбі 65,536 токендік контекст ұзындығын қолдайды.

Gemini 2.5 Flash шығыс сапасын төмендетпей, жылдам жауап беру үшін әзірленген. Ол мәтін, кескіндер, аудио және бейне сияқты мультимодальды кірістерді қолдайды, бұл оны әртүрлі қолданбаларға жарамды етеді. Модель Google AI Studio және Vertex AI сияқты платформалар арқылы қолжетімді, әзірлеушілерге оны түрлі жүйелерге оңтайлы кіріктіруге қажетті құралдарды ұсынады.


Негізгі ақпарат (Мүмкіндіктер)

Gemini 2.5 Flash Gemini 2.5 отбасында оны ерекшелендіретін бірқатар айрықша мүмкіндіктерді ұсынады:

  • Гибридті пайымдау: Әзірлеушілер модельдің шығару алдында ішкі пайымдауға қанша токен бөлетінін дәл реттеу үшін thinking_budget параметрін қоя алады.
  • Парето шебі: оңтайлы құн–өнімділік нүктесінде орналасқан Flash 2.5 үлгілерінің ішінде баға мен интеллект теңгерімі бойынша ең үздік қатынасты ұсынады.
  • Мультимодальды қолдау: Туған күйінде мәтін, кескіндер, бейне және аудионы өңдейді, бұл сөйлесімдік және талдамалық мүмкіндіктерді байытады.
  • 1 миллион токендік контекст: Бір сұранымда терең талдауға және ұзын құжатты түсінуге мүмкіндік беретін теңдессіз контекст ұзындығы.

Модель нұсқалау

Gemini 2.5 Flash келесі негізгі нұсқалардан өтті:

  • gemini-2.5-flash-lite-preview-09-2025: Құралды пайдалану ыңғайлылығы артты: күрделі, көпқадамды тапсырмаларда өнімділік жақсарды, SWE-Bench Verified көрсеткіші 5% өсті (48.9%-дан 54%-ға). Тиімділік жақсарды: reasoning іске қосылғанда, жоғары сапалы шығыс аз токенмен алынады, кідіріс пен шығындарды азайтады.
  • Preview 04-17: “thinking” қабілеті бар ерте қолжетімділік шығарылымы, gemini-2.5-flash-preview-04-17 арқылы қолжетімді.
  • Stable General Availability (GA): 2025 жылғы 17 маусымнан бастап тұрақты соңғы нүкте gemini-2.5-flash алдын ала нұсқаны алмастырады, мамандандырылған сенімділікті қамтамасыз етеді және 20 мамырдағы алдын ала нұсқадан API өзгерістері жоқ.
  • Preview қолданыстан шығару: Preview соңғы нүктелері 2025 жылғы 15 шілдеде тоқтатуға жоспарланған; пайдаланушылар осы күнге дейін GA соңғы нүктесіне көшуі тиіс.

2025 жылғы шілдедегі жағдай бойынша Gemini 2.5 Flash енді көпшілікке қолжетімді және тұрақты ( gemini-2.5-flash-preview-05-20 нұсқасынан өзгерістер жоқ). Егер сіз gemini-2.5-flash-preview-04-17 пайдаланып жүрсеңіз, бар preview бағасы модельдің соңғы нүктесі 2025 жылғы 15 шілдеде тоқтатылғанға дейін күшінде қалады. Сіз жалпы қолжетімді модельге "gemini-2.5-flash" көше аласыз.

Жылдамырақ, арзанырақ, ақылдырақ:

  • Дизайн мақсаттары: төмен кідіріс + жоғары өткізу қабілеті + төмен құн;
  • Пайымдау, мультимодальды өңдеу және ұзын мәтіндік тапсырмаларда жалпы жылдамдық артуы;
  • Токен тұтынуы 20–30% азаяды, пайымдау құнын айтарлықтай төмендетеді.

Техникалық сипаттамалар

Кіріс контекст терезесі: 1 миллион токенге дейін, кең контексті сақтауға мүмкіндік береді.

Шығыс токендері: Бір жауапта 8,192 токенге дейін генерациялай алады.

Қолданылатын модалдылықтар: Мәтін, кескіндер, аудио және бейне.

Интеграция платформалары: Google AI Studio және Vertex AI арқылы қолжетімді.

Баға белгілеу: Токенге негізделген бәсекелі баға моделі, үнемді енгізуді жеңілдетеді.


Техникалық мәліметтер

Ішкі жағында, Gemini 2.5 Flash — веб, код, кескін және бейне деректер қоспасында оқытылған трансформерлік үлкен тілдік модель. Негізгі техникалық сипаттамалар:

Көпмодальді оқыту: Бірнеше модалдылықты туралау арқылы Flash мәтінді кескіндермен, бейнемен немесе аудиомен еркін араластыра алады; бұл бейнені қысқаша мазмұндау немесе аудиоға сипаттама беру сияқты тапсырмаларға пайдалы.

Динамикалық ойлау үдерісі: Қорытынды шығарудың алдында модельдің жоспарлап, күрделі нұсқауларды бөлшектеуін қамтамасыз ететін ішкі пайымдау циклі іске асырылады.

Теңшеуге болатын ойлау бюджеті: thinking_budget мәнін 0-ден (пайымдау жоқ) 24,576 токенге дейін қоюға болады, бұл кідіріс пен жауап сапасы арасында теңгерім жасауға мүмкіндік береді.

Құралдармен интеграция: Grounding with Google Search, Code Execution, URL Context және Function Calling қолдайды, табиғи тілден тікелей нақты әрекеттерді орындауға жол ашады.


Бенчмарк өнімділігі

Қатаң бағалауларда Gemini 2.5 Flash салалық деңгейдегі нәтижелер көрсетті:

  • LMArena Hard Prompts: Қиын Hard Prompts бенчмаркінде 2.5 Pro-дан кейінгі екінші орын, көпқадамды пайымдау қабілетінің мықтылығын көрсетті.
  • MMLU 0.809 ұпайы: Орташа модельден жоғары, кең домендік білім мен пайымдау қуатын көрсетеді.
  • Кідіріс және өткізу: 271.4 tokens/sec декодтау жылдамдығына және 0.29 s Time-to-First-Token көрсеткішіне қол жеткізеді, бұл кідіріс сезімтал жүктемелер үшін өте қолайлы.
  • Баға–өнімділік көшбасшысы: $0.26/1 M tokens деңгейінде, Flash көптеген бәсекелестерден арзанырақ болып, негізгі бенчмарктерде олармен теңеседі немесе озады.

Бұл нәтижелер Gemini 2.5 Flash-тың пайымдау, ғылыми түсіну, математикалық есептер, код жазу, визуалды интерпретация және көптілді мүмкіндіктердегі бәсекелік артықшылықтарын көрсетеді:

Gemini 2.5 Flash


Шектеулер

Қуатты болғанымен, Gemini 2.5 Flash белгілі бір шектеулерге ие:

  • Қауіпсіздік тәуекелдері: Модель кейде “діни уағыз айтқандай” тон көрсетуі және әсіресе шеттік сұрауларда нанымды көрінетін, бірақ қате не біржақты (галлюцинациялар) нәтижелер беруі мүмкін. Қатаң адамдық бақылау маңызды.
  • Жылдамдық шектеулері: API пайдалануы жылдамдық шектеулерімен (әдепкі деңгейде 10 RPM, 250,000 TPM, 250 RPD) шектеледі, бұл топтамалық өңдеу немесе жоғары көлемді қолдануларға әсер етуі мүмкін.
  • Интеллект шегі: flash үлгісі ретінде өте қабілетті болғанымен, ең талапты агенттік тапсырмаларда, мысалы, күрделі кодтау немесе көп агентті үйлестіруде, 2.5 Pro-дан дәлірек емес.
  • Құндық айырбас: Ең жақсы баға–өнімділік ұсынғанымен, thinking режимін кеңінен қолдану жалпы токен тұтынуын арттырады, терең пайымдауды қажет ететін нұсқаулар үшін шығынды өсіреді.