Google запускает новую модель Gemini 2.5 Flash-Lite

Google DeepMind сегодня объявила о значительном расширении своего семейства Gemini 2.5, представив стабильные версии Gemini 2.5 Pro и Gemini 2.5 Flash, а также предварительную версию совершенно новой модели Gemini 2.5 Flash‑Lite. Эти обновления отражают неизменную приверженность Google предложению спектра моделей ИИ, которые обеспечивают баланс между стоимостью, скоростью и производительностью для различных рабочих нагрузок.

Стабильные версии: Gemini 2.5 Pro и Flash

17 июня 2025 года Google отметила общедоступность Gemini 2.5 Pro и Gemini 2.5 Flash. Вариант Pro обеспечивает максимальную мощность рассуждений и предназначен для сложных задач, таких как расширенная генерация кода, научный анализ и крупномасштабный синтез данных. Напротив, Gemini 2.5 Flash предлагает вариант среднего уровня, оптимизированный для повседневного использования, требующего низкой задержки — идеально подходит для чат-ботов, реферирования и создания контента в масштабе.

Обзор: три модели семейства Gemini -2.5

Модель	Статус	Сильные стороны	Идеальные варианты использования
Gemini 2.5 Flash‑Lite (Предварительный просмотр)	предварительный просмотр	Самый быстрый и дешевый; мультимодальный; контролируемое рассуждение; поддерживается инструментами	Задачи большого объема, такие как чат-боты, обобщение, поиск
Близнецы 2.5 Флэш	Стабильный	Сбалансированный: низкая задержка, хорошая аргументация, мультимодальный	Общение в реальном времени, поддержка клиентов
Близнецы 2.5 Про	Стабильный	Наиболее способный: глубокое рассуждение, огромный контекст, мультимодальный	Исследования, сложное кодирование, научные задачи

Google запускает новую модель Gemini 2.5 Flash-Lite

Gemini 2.5 Flash‑Lite: основные моменты предварительного просмотра

Сверхнизкая задержка и экономия средств: Разработано для приложений с большим объемом данных в режиме реального времени, таких как перевод, классификация и резюмирование. Отличается более быстрым выводом и более низкой стоимостью вызова по сравнению с 2.0 Flash‑Lite и полной версией Flash.

Улучшение основных характеристик: превосходит более ранние модели Flash‑Lite по показателям генерации кода, логики, математики, мультимодального мышления и науки.

Стоимость и эффективность: Цены на Flash‑Lite (предварительный просмотр): ~$0.10 за 1 млн входных токенов и ~$0.40 за 1 млн выходных токенов — значительно дешевле, чем Flash ($0.30/$2.50) и Pro ($1.25/$10).

Полные возможности Gemini -2.5:

Управляемое мышление: Пользователи могут устанавливать «бюджеты мышления» (лимиты токенов), чтобы обменивать скорость на глубину — Flash‑Lite может включать эту функцию по мере необходимости.
Мультимодальный ввод: поддерживает текст, изображения, аудио и видео (включая часовые клипы), с возможностью анализа диаграмм, пользовательского интерфейса, сцен, сводок событий.
Интеграция инструментов: Включает поиск Google, выполнение кода и контекстное окно на миллион токенов, что соответствует возможностям Flash и Pro.

Позиционирование на кривой цена-производительность

Google позиционирует Flash‑Lite как высокоскоростной и недорогой Граница Парето, что означает, что это одна из самых экономически эффективных и в то же время эффективных моделей в мире (). В сравнительных оценках, Flash‑Lite представляет собой лучшее соотношение цены и качества: умный, но доступный.

О Flash и Pro

Близнецы 2.5 Флэш: Стабильная, малозамедленная, многомодальная модель мышления. Позиционируется ниже Pro, но примерно на одном уровне с GPT-4o по возможностям, с превосходной скоростью и экономической эффективностью ().
Близнецы 2.5 Про: Самая передовая модель Google. Известна обработкой многочасовых видео/аудио, сложного кода и математики, а также рассуждений в огромном контексте. Также вводит выборочные «бюджеты мышления» и улучшенное качество кода, чтобы служить долгосрочным стабильным флагманским ИИ.

Развертывание и ценообразование

Доступность: Все три модели доступны через Google AI-студия, Google Cloud Vertex AI, и Приложение Близнецы .
Структура затрат (Цены на Vertex AI с 16 июня 2025 г.):
Pro: $1.25/1M вход, $10/1M выход (выше 200K токенов)
Flash: $0.15/1M вход, $3.50/1M выход в режиме «мышления» — и включает 1,500 бесплатных обоснованных подсказок ежедневно ()
Flash-Lite (предварительный просмотр): ~$0.10/$0.40 за 1 млн токенов

Первые шаги

CometAPI предоставляет унифицированный интерфейс REST, который объединяет сотни моделей ИИ — в рамках единой конечной точки, со встроенным управлением ключами API, квотами использования и панелями выставления счетов. Вместо жонглирования несколькими URL-адресами поставщиков и учетными данными.

Разработчики могут получить доступ API Gemini 2.5 Flash-Lite (предварительная версия) через CometAPI, последние модели указаны на дату публикации статьи. Для начала изучите возможности модели в Детская Площадка и проконсультируйтесь с API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.