Google DeepMind сегодня объявила о значительном расширении своего семейства Gemini 2.5, представив стабильные версии Gemini 2.5 Pro и Gemini 2.5 Flash, а также предварительную версию совершенно новой модели Gemini 2.5 Flash‑Lite. Эти обновления отражают неизменную приверженность Google предложению спектра моделей ИИ, которые обеспечивают баланс между стоимостью, скоростью и производительностью для различных рабочих нагрузок.
Стабильные версии: Gemini 2.5 Pro и Flash
17 июня 2025 года Google отметила общедоступность Gemini 2.5 Pro и Gemini 2.5 Flash. Вариант Pro обеспечивает максимальную мощность рассуждений и предназначен для сложных задач, таких как расширенная генерация кода, научный анализ и крупномасштабный синтез данных. Напротив, Gemini 2.5 Flash предлагает вариант среднего уровня, оптимизированный для повседневного использования, требующего низкой задержки — идеально подходит для чат-ботов, реферирования и создания контента в масштабе.
Обзор: три модели семейства Gemini -2.5
| Модель | Статус | Сильные стороны | Идеальные варианты использования |
|---|---|---|---|
| Gemini 2.5 Flash‑Lite (Предварительный просмотр) | предварительный просмотр | Самый быстрый и дешевый; мультимодальный; контролируемое рассуждение; поддерживается инструментами | Задачи большого объема, такие как чат-боты, обобщение, поиск |
| Близнецы 2.5 Флэш | Стабильный | Сбалансированный: низкая задержка, хорошая аргументация, мультимодальный | Общение в реальном времени, поддержка клиентов |
| Близнецы 2.5 Про | Стабильный | Наиболее способный: глубокое рассуждение, огромный контекст, мультимодальный | Исследования, сложное кодирование, научные задачи |

Gemini 2.5 Flash‑Lite: основные моменты предварительного просмотра
Сверхнизкая задержка и экономия средств: Разработано для приложений с большим объемом данных в режиме реального времени, таких как перевод, классификация и резюмирование. Отличается более быстрым выводом и более низкой стоимостью вызова по сравнению с 2.0 Flash‑Lite и полной версией Flash.
Улучшение основных характеристик: превосходит более ранние модели Flash‑Lite по показателям генерации кода, логики, математики, мультимодального мышления и науки.
Стоимость и эффективность: Цены на Flash‑Lite (предварительный просмотр): ~$0.10 за 1 млн входных токенов и ~$0.40 за 1 млн выходных токенов — значительно дешевле, чем Flash ($0.30/$2.50) и Pro ($1.25/$10).
Полные возможности Gemini -2.5:
- Управляемое мышление: Пользователи могут устанавливать «бюджеты мышления» (лимиты токенов), чтобы обменивать скорость на глубину — Flash‑Lite может включать эту функцию по мере необходимости.
- Мультимодальный ввод: поддерживает текст, изображения, аудио и видео (включая часовые клипы), с возможностью анализа диаграмм, пользовательского интерфейса, сцен, сводок событий.
- Интеграция инструментов: Включает поиск Google, выполнение кода и контекстное окно на миллион токенов, что соответствует возможностям Flash и Pro.
Позиционирование на кривой цена-производительность
Google позиционирует Flash‑Lite как высокоскоростной и недорогой Граница Парето, что означает, что это одна из самых экономически эффективных и в то же время эффективных моделей в мире (). В сравнительных оценках, Flash‑Lite представляет собой лучшее соотношение цены и качества: умный, но доступный.
О Flash и Pro
- Близнецы 2.5 Флэш: Стабильная, малозамедленная, многомодальная модель мышления. Позиционируется ниже Pro, но примерно на одном уровне с GPT-4o по возможностям, с превосходной скоростью и экономической эффективностью ().
- Близнецы 2.5 Про: Самая передовая модель Google. Известна обработкой многочасовых видео/аудио, сложного кода и математики, а также рассуждений в огромном контексте. Также вводит выборочные «бюджеты мышления» и улучшенное качество кода, чтобы служить долгосрочным стабильным флагманским ИИ.
Развертывание и ценообразование
- Доступность: Все три модели доступны через Google AI-студия, Google Cloud Vertex AI, и Приложение Близнецы .
- Структура затрат (Цены на Vertex AI с 16 июня 2025 г.):
- Pro: $1.25/1M вход, $10/1M выход (выше 200K токенов)
- Flash: $0.15/1M вход, $3.50/1M выход в режиме «мышления» — и включает 1,500 бесплатных обоснованных подсказок ежедневно ()
- Flash-Lite (предварительный просмотр): ~$0.10/$0.40 за 1 млн токенов
Первые шаги
CometAPI предоставляет унифицированный интерфейс REST, который объединяет сотни моделей ИИ — в рамках единой конечной точки, со встроенным управлением ключами API, квотами использования и панелями выставления счетов. Вместо жонглирования несколькими URL-адресами поставщиков и учетными данными.
Разработчики могут получить доступ API Gemini 2.5 Flash-Lite (предварительная версия) через CometAPI, последние модели указаны на дату публикации статьи. Для начала изучите возможности модели в Детская Площадка и проконсультируйтесь с API-руководство для получения подробных инструкций. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.
