The Gemini 2.5 Flash-Lite API жеткізуге арналған гибридті пайымдау үлгілерінің отбасындағы Google-дың соңғы ұсынысын білдіреді теңдесі жоқ үнемділік және өте төмен кідіріс жоғары көлемді, кешігуге сезімтал қолданбалар үшін.
Негізгі ақпарат және мүмкіндіктер
17 жылдың 2025 маусымында алдын ала қарау шығарылымында жарияланған Flash-Lite, әзірлеушілерге оңтайландырылған опцияны ұсына отырып, Gemini 2.5 желісін (Flash және Pro-мен бірге) аяқтайды. жылдамдық, баға-өнімділік, және адаптивті ойлау мүмкіндіктері.
Кодта “gemini-2.5-flash-lite” көрсету арқылы Gemini 2.5 Flash-Lite пайдалануды бастауға болады. Алдын ала қарау нұсқасын пайдаланып жатсаңыз, алдын ала қарау нұсқасымен бірдей «gemini-2.5-flash-lite» нұсқасына ауысуға болады. Google 25 тамызда Flash-Lite үшін алдын ала қарау бүркеншік атын жоюды жоспарлап отыр.
| тұрақтылық | моделі | дата |
| Тұрақты (GA) | gemini-2.5-flash-lite | Шілде 22, 2025 |
| Эксперименттік алдын ала қарау | gemini-2.5-flash-lite-06-17 | Қол жетімділік терезесі: 17 жылғы 25 маусым – 2025 тамыз |
| соңғы нұсқасы | gemini-2.5-flash-lite-preview-09-2025 | 09-2025 |
- Ойлауды бақылау: жүзеге асырады a динамикалық ойлау бюджеті API параметрі арқылы ойлау арқылы әдепкі бойынша өшірілген жылдамдығын арттыру және шығындарды азайту.
- Төмен кідіріс: а үшін әзірленген бірінші белгіге дейінгі жылдам уақыт, Flash-Lite стандартты Google Cloud инфрақұрылымында 100 мс-тен төмен кідірістерге қол жеткізе отырып, іске қосу шығындарын азайтады.
- Өнімділігі жоғары: Қолайлы декодтау құбырларымен ол қолдау көрсетеді секундына жүздеген белгілер, чат-боттар мен ағындық қолданбалардағы нақты уақыттағы пайдаланушы тәжірибесінің құлпын ашу.
- Көпмодальды қолдау: Негізінен мәтін үшін оңтайландырылғанымен, Flash-Lite да қабылдайды суреттер, аудио, және Бейне Gemini API арқылы енгізулер, құжатты қорытындылаудан жеңіл көру тапсырмаларына дейін жан-жақты пайдалану жағдайларына мүмкіндік береді.
Техникалық Толығырақ
- Бейімделуші пайымдау:
Gemini 2.5 Flash-Liteсұраныс бойынша қолдайды ойлау, әзірлеушілерге тереңірек дәлелдеу қажет болғанда ғана есептеу ресурстарын бөлуге мүмкіндік береді. - Құралдар интеграциялары: Gemini 2.5-тің жергілікті құралдарымен толық үйлесімділік, соның ішінде Google Search арқылы жерге қосу, Кодтың орындалуы, URL мәтінмәні, және Функция шақыру үздіксіз мультимодальды жұмыс процестері үшін.
- Мәтінмәндік протокол үлгісі (MCP): Нақты уақыттағы веб-деректерді алу үшін Google-дың MCP мүмкіндігін пайдаланады, бұл жауаптардың болуын қамтамасыз етеді бүгінгі күнге дейін және контекстік тұрғыдан маңызды.
- Қолдану параметрлері: арқылы қол жетімді CometAPI, Gemini API, Vertex AI, және Google AI Studio, эксперимент және кері байланыс қамтамасыз ету үшін ерте қабылдаушыларға алдын ала қарау трекпен.
Эталондық өнімділік Gemini 2.5 Flash-Lite
- Кідіріс: дейін жетеді Орташа жауап беру уақыты 50% төмен Gemini 2.5 Flash-пен салыстырғанда, әдеттегі кіші 100 мс стандартты жіктеу және қорытындылау эталондары бойынша кідіріс.
- Өткізу қабілеті: үшін оңтайландырылған жоғары көлемді өнімділікті төмендетпей минутына ондаған мың сұраныстарды қамтамасыз ететін жұмыс жүктемелері.
- Баға-өнімділік: көрсетеді a 25 токеннің құнын 1,000% төмендету оның Flash аналогына қарсы, бұл оны жасайды Парето-оңтайлы шығынды қажет ететін орналастырулар үшін таңдау.
- Өнеркәсіпті қабылдау: Алғашқы пайдаланушылар өнімділік көрсеткіштері бастапқы болжамдарға сәйкес келетін немесе одан асатын өндіріс құбырларына үздіксіз интеграция туралы есеп береді.

Идеал пайдалану жағдайлары
- Жоғары жиілікті, күрделілігі төмен тапсырмалар: Автоматтандырылған тегтеу, көңіл-күйді талдау және жаппай аудару
- Шығынға сезімтал құбырлар: Үлкен құжат корпусынан деректерді алу, мерзімді топтаманы қорытындылау
- Edge және мобильді сценарийлер: Кідіріс маңызды болған кезде, бірақ ресурстар бюджеттері шектеулі
Шектеу Gemini 2.5 Flash-Lite
- Алдын ала қарау күйі: GA алдында API өзгерістеріне ұшырауы мүмкін; Интеграциялар нұсқалардың ықтимал ақауларын есепке алуы керек.
- Ұзақ уақытты дәл баптау жоқ: реттелетін салмақтарды жүктеп салу мүмкін емес; жедел инженерлік және жүйелік хабарламаларға сүйеніңіз.
- Шығармашылықтың төмендеуі: Детерминирленген, өнімділігі жоғары тапсырмалар үшін бапталған; ашық ұрпақ немесе «шығармашылық» жазу үшін аз қолайлы.
- Ресурс төбесі: ~16 vCPU-ге дейін ғана сызықтық масштабталады; одан жоғары өткізу қабілеттілігі төмендейді.
- Көпмодальды шектеулер: кескін/аудио кірістерін қолдайды, бірақ дәлдігі шектеулі; ауыр көру немесе аудио транскрипция тапсырмалары үшін өте қолайлы емес.
- Мәтінмәндік-терезе айырбастау : Ол 1 миллион токенге дейін қабылдаса да, сол шкаладағы практикалық қорытынды өткізу қабілетінің нашарлауын көрсетуі мүмкін.
Қалай қоңырау шалуға болады Gemini 2.5 Flash-Lite CometAPI ұсынған API
Gemini 2.5 Flash-Lite CometAPI ішіндегі API бағасы, ресми бағадан 20% жеңілдік:
- Енгізу токендері: $0.08/ M токендер
- Шығару таңбалауыштары: $0.32/ M токендер
Қажетті қадамдар
- Жүйеге кіріңіз cometapi.com. Егер сіз әлі біздің пайдаланушы болмасаңыз, алдымен тіркеліңіз
- Интерфейстің кіру тіркелгі деректерінің API кілтін алыңыз. Жеке орталықтағы API токеніндегі «Токенді қосу» түймесін басыңыз, таңбалауыш кілтін алыңыз: sk-xxxxx және жіберіңіз.
- Осы сайттың URL мекенжайын алыңыз: https://api.cometapi.com/
Қолдану әдістері
- “
gemini-2.5-flash-lite” API сұрауын жіберуге және сұраудың негізгі бөлігін орнатуға арналған соңғы нүкте. Сұрау әдісі мен сұрау мәтіні біздің веб-сайт API құжатынан алынған. Біздің веб-сайт сізге ыңғайлы болу үшін Apifox сынағын да ұсынады. - Ауыстыру тіркелгіңізден нақты CometAPI кілтімен.
- Мазмұн өрісіне сұрағыңызды немесе сұрауыңызды енгізіңіз — үлгі осыған жауап береді.
- . Жасалған жауапты алу үшін API жауабын өңдеңіз.
CometAPI үздіксіз тасымалдау үшін толық үйлесімді REST API қамтамасыз етеді. Негізгі мәліметтер API құжаты:
- Негізгі URL: https://api.cometapi.com/v1/chat/completions
- Модель атаулары: «
gemini-2.5-flash-lite« - Түпнұсқалық растама:
Bearer YOUR_CometAPI_API_KEYтақырып
Сондай-ақ, қараңыз Gemini 2.5 Pro
