Name: Gemini 2.5 Flash Lite
Price: 0.08 USD
Availability: InStock

Техникалық мәліметтер

Адаптивті пайымдау: Gemini 2.5 Flash-Lite сұраныс бойынша ой қорытуын қолдайды, бұл әзірлеушілерге терең пайым қажет болғанда ғана есептеу ресурстарын бөлуге мүмкіндік береді.
Құралдармен интеграция: Gemini 2.5-тің жергілікті құралдарымен толық үйлесімді, соның ішінде Grounding with Google Search, Code Execution, URL Context және Function Calling, үздіксіз көпмодальды жұмыс ағындары үшін.
Model Context Protocol (MCP): Нақты уақыттағы веб деректерді алу үшін Google-дың MCP мүмкіндіктерін пайдаланады, жауаптардың өзекті әрі контекстке сай болуын қамтамасыз етеді.
Орналастыру опциялары: CometAPI, Gemini API, Vertex AI және Google AI Studio арқылы қолжетімді; ерте пайдаланушыларға тәжірибе жасап, кері байланыс беруге арналған алдын ала қарау арнасы бар.

`Gemini 2.5 Flash-Lite` бенчмарк көрсеткіштері

Кідіріс: Gemini 2.5 Flash-пен салыстырғанда медианалық жауап уақытын 50%-ға дейін қысқартады; стандартты жіктеу және түйіндеу бенчмарктерінде әдетте 100 мс-тан төмен кідіріс көрсетеді.
Өткізу қабілеті: Көлемі жоғары жүктемелер үшін оңтайландырылған, өнімділікті төмендетпестен минутына он мыңдаған сұрауды қолдайды.
Баға–өнімділік: Flash нұсқасымен салыстырғанда 1 000 токенге шаққандағы құнын 25%-ға азайтады, бұл оны шығынға сезімтал орнатулар үшін Парето-оңтайлы таңдауға айналдырады.
Салада қабылдануы: Ерте пайдаланушылар өндірістік пайплайндарға кедергісіз интеграцияланғанын хабарлайды; өнімділік метрикалары бастапқы болжамдарға сәйкес келеді немесе олардан асады.

Gemini 2.5 Flash Lite

Жиілігі жоғары, күрделілігі төмен тапсырмалар: Автоматтандырылған тегтеу, сентимент талдауы және жаппай аудару
Құнына сезімтал пайплайндар: Ірі құжат корпустарынан деректерді шығару, мерзімді топтық түйіндеу
Edge және мобильді сценарийлер: Кідіріс шешуші болғанымен, ресурстар бюджеті шектеулі жағдайлар

Превью күйі: GA-ға дейін API өзгерістері болуы мүмкін; интеграциялар ықтимал нұсқа жаңартуларын ескеруі тиіс.
Жедел fine-tuning жоқ: Пайдаланушының жеке салмақтарын жүктеу мүмкін емес; prompt engineering пен жүйелік хабарламаларға сүйену қажет.
Шығармашылық төмендетілген: Детерминирленген, жоғары өнімді тапсырмаларға бапталған; еркін генерация немесе "креативті" жазу үшін азырақ жарамды.
Ресурс шегі: Тек ~16 vCPU-ге дейін сызықты масштабталады; одан әрі өткізу қабілеті өсімі төмендейді.
Көпмодальды шектеулер: Сурет/аудио енгізулерін қолдайды, бірақ дәлдігі шектеулі; ауыр көру немесе аудио транскрипция тапсырмалары үшін қолайлы емес.
Контекст терезесінің ымырасы: 1 M токенге дейін қабылдағанымен, осындай ауқымда практикалық инференс өткізу қабілетінің төмендеуін көрсетуі мүмкін.

model name	Input ($/1M)	Output ($/1M)
gemini-2.5-flash-lite	0.08	0.32
gemini-2.5-flash-lite-preview-06-17	0.08	0.32
gemini-2.5-flash-lite-thinking	0.08	0.32
gemini-2.5-flash-lite-preview-06-17-thinking	0.08	0.32
gemini-2.5-flash-lite-preview-09-2025	0.08	0.32