Google представила Gemini 3.5 Flash 19 мая 2026 года на I/O, позиционируя её как модель с высоким уровнем интеллекта, оптимизированную по скорости для устойчивой передовой производительности в агентных рабочих процессах, программировании и мультимодальных задачах. Она основана на Gemini 3 Flash и получила улучшенные «уровни размышления», позволяющие балансировать качество, стоимость и задержку.
Это всеобъемлющее руководство охватывает всё: что такое Gemini 3.5 Flash, её ключевые возможности, детальные результаты бенчмарков, цены, сравнения с GPT-5.5, Claude 4.7/4.6 и другими. Как ведущий агрегатор AI API, CometAPI помогает разработчикам получать доступ к Gemini 3.5 Flash (и конкурентам) с унифицированными ценами, упрощённой интеграцией и инструментами оптимизации затрат.
Что такое Gemini 3.5 Flash?
Gemini 3.5 Flash основана на базе рассуждений Gemini 3 Flash с улучшенными «уровнями размышления» (минимальный, низкий, средний/по умолчанию, высокий) для тонкой настройки баланса качество–задержка–стоимость. Это изначально мультимодальная модель с поддержкой текста, изображений, видео, аудио и документов (включая PDF), с контекстным окном 1M токенов и до 65K выходных токенов. Отсечка знаний — январь 2025 года.
Ключевые отличия от предыдущих моделей Flash:
- Устойчивая производительность на передовом уровне в агентных задачах, кодинге и задачах с длинным горизонтом.
- Сохранение хода рассуждений: автоматически поддерживает промежуточные размышления в многотуровых диалогах без дополнительных изменений API.
- Оптимизация для масштабирования: спроектирована для параллельного агентного выполнения, итеративного кодинга и многошаговых корпоративных процессов.
- Нет поддержки Computer Use (пока), но существенные улучшения в использовании инструментов и вызове функций.
Google позиционирует её как «самую интеллектуальную модель Flash» для продакшена, превосходящую предыдущую Gemini 3.1 Pro во многих агентных и кодинговых бенчмарках, при этом обеспечивая скорость уровня Flash (в тестах часто >280 выходных токенов/сек).
Gemini 3.5 Flash превосходит в агентных рабочих процессах и кодинге с интеллектом, близким к Pro, при оптимизированной задержке и стоимости, достигая, например, 76.2% на Terminal-bench 2.1 и 83.6% на многошаговых задачах MCP Atlas.
Прорыв в результатах бенчмарков
Независимые тесты подтверждают, что она обеспечивает уровень Pro и выше на задачах кодинга/агентных сценариях при большей скорости, хотя совокупные затраты на прогоны бенчмарков растут из‑за большего числа токенов в сложных агентных петлях и 3‑кратного роста цены по сравнению с ранними моделями Flash.
Gemini 3.5 Flash демонстрирует заметный прогресс по сравнению с предшественниками, особенно в агентной и кодинговой областях. Ниже ключевые результаты из карточки модели Google DeepMind и независимых оценок (по состоянию на май 2026 года):
Выбранные бенчмарки (Gemini 3.5 Flash vs. конкуренты):
Кодирование:
- Terminal-bench 2.1 (агентное программирование в терминале): 76.2% (против Gemini 3 Flash 58.0%, Gemini 3.1 Pro 70.3%, GPT-5.5 78.2%)
- SWE-Bench Pro (публичный, разноплановый агентный код): 55.1% (против 49.6% у 3 Flash, 54.2% у 3.1 Pro)
Агентное использование инструментов:
- MCP Atlas (многошаговые процессы): 83.6% (уверенное лидерство)
- Toolathlon (общее использование инструментов в реальных задачах): 56.5%
- Finance Agent v2: 57.9% (+15.3% к 3 Flash)
Мультимодальность:
- CharXiv (рассуждение по диаграммам): 84.2%
- MMMU-Pro: 83.6% (опережает многих конкурентов)
Рассуждение и длинный контекст:
- Humanity’s Last Exam: 40.2%
- ARC-AGI-2: 72.1%
- MRCR v2 (128k): 77.3%; на 1M контексте сильный результат — 26.6% поэлементно.

Artificial Analysis Intelligence Index: у Gemini 3.5 Flash 55 (высокий уровень размышления), на 9 пунктов выше, чем у Gemini 3 Flash. Она лидирует на Парето‑фронтире «интеллект против скорости», показывая рост в агентных задачах и снижение галлюцинаций (до 61% уровня галлюцинаций). Достигает >280 выходных токенов/сек, но в агентных петлях использует больше токенов.
Она особенно сильна в длинном контексте (высокие MRCR v2 и 1M поэлементно), лидерстве в мультимодальности (диаграммы, документы) и устойчивой агентной продуктивности с уменьшением «токенного» перерасхода в некоторых процессах (например, на кибер-бенчмарке на 42% лучше при 72% меньшем числе токенов).
Баланс скорости и агентных возможностей
Gemini 3.5 Flash выделяется в компромиссе скорость–интеллект. Она достигает высокой пропускной способности (>280 токенов/с), поддерживая при этом продвинутые агентные поведения, такие как запуск субагентов, параллельное выполнение и быстрая итерация.
Значение усилия «размышления» по умолчанию теперь — medium, изменено с high в Gemini 3 Flash Preview.
Уровни размышления позволяют точный контроль:
- Средний (по умолчанию): лучший баланс для большинства сложных задач по коду и агентных сценариев.
- Высокий: максимальная глубина рассуждений для самых сложных задач.
- Низкий/минимальный: ультранизкая задержка для простых запросов.
Google сообщает о значительной эффективности по токенам в реальных агентных сценариях (например, сокращение на 72% в некоторых кибер-бенчмарках по сравнению с предыдущими версиями), что делает модель пригодной для устойчивых, длительных рабочих процессов.
Компромиссы: Более высокая цена по сравнению с прежними моделями Flash ведёт к росту общих затрат в сценариях с большим числом токенов в агентных циклах (стоимость «индекса интеллекта» 5.5x относительно Gemini 3 Flash из‑за цен и увеличенного расхода).
Расширенные возможности интеллектуальных агентов
Gemini 3.5 Flash продвигает «эпоху агентной Gemini». Ключевые улучшения включают:
- Параллельные агентные циклы выполнения: запуск нескольких субагентов для решения сложных задач.
- Итеративный кодинг и прототипирование: быстрый поиск решений с динамическим использованием инструментов.
- Длинные многошаговые процессы: обработка расширенных корпоративных сценариев с сохранением хода рассуждений.
- Улучшения использования инструментов: строгое соответствие ответов формату функций, мультимодальные ответы функций и сокращение лишних вызовов благодаря лучшим подсказкам и меньшим уровням размышления. Сильные результаты на OSWorld и задачах UI.
Модель лежит в основе новых информационных агентов Google, автономных исследований и кодинговых конвейеров. Во внутренних тестах она превосходно справляется с построением сложных систем и управлением исследовательскими проектами.
Для разработчиков новый Interactions API (бета) упрощает управление историей на стороне сервера, аналогично продвинутым паттернам в других экосистемах.
Рекомендация CometAPI: используйте наш унифицированный API, чтобы связать Gemini 3.5 Flash со специализированными моделями (например, Claude для глубокого ревью кода или GPT для креатива) в агентных системах. Наши функции маршрутизации и фолбэка обеспечивают надёжность и экономию.
Лидерство в мультимодальности
Google сохраняет лидерство в мультимодальном понимании. Gemini 3.5 Flash изначально обрабатывает и рассуждает по тексту + изображениям + видео + аудио + документам. Она лидирует или близка к лидерам на бенчмарках вроде CharXiv, MMMU-Pro и задачах понимания видео.
Сценарии использования: синтез графиков/данных, видеоанализ, мультимодальный вызов функций (например, обработка изображений в ответах инструментов) и агенты для богатых медиа. Это делает её оптимальной для e-commerce, контент‑производства, научной визуализации и др.
Цены: сколько стоит Gemini 3.5 Flash?
Цены Gemini API (за 1M токенов, приблизительные глобальные ставки):
- Ввод (текст/изображение/видео/аудио): $1.50
- Вывод: $9.00
- Кэширование контекста: $0.15 (значительная экономия при повторяющихся подсказках)
Это примерно в 3 раза выше, чем у Gemini 3 Flash Preview ($0.50/$3), но остаётся конкурентоспособным на фоне роста возможностей. Стоимость приближается к Gemini 3.1 Pro ($2/$12), при этом во многих задачах скорость лучше.
Это примерно в 3 раза выше, чем у Gemini 3 Flash Preview ($0.50/$3), но остаётся конкурентоспособным на фоне роста возможностей. Стоимость приближается к Gemini 3.1 Pro ($2/$12), при этом во многих задачах скорость лучше.
Бесплатный уровень: ограниченный доступ через Google AI Studio/Gemini; для продакшена — платный.
Преимущество CometAPI: доступ к Gemini 3.5 Flash API наряду с 100+ моделями по конкурентным ставкам, аналитикой использования и инструментами оптимизации для снижения токен‑расходов. На нашей платформе эффективные цены часто лучше благодаря умной маршрутизации и батчингу. Цены API обычно на 20% ниже официальных.
Gemini 3.5 Flash vs. GPT-5.5, Claude 4.7/4.6 и другие
Сильные стороны Gemini 3.5 Flash:
- Скорость + агентный баланс: быстрее большинства передовых моделей, сокращая разрыв в интеллекте.
- Мультимодальность и длинный контекст: нативный 1M контекст и лидерство в зрении.
- Стоимость для больших объёмов: дешевле за токен, чем топовые Claude/GPT во многих задачах, особенно с кешированием.
- Экосистема Google: бесшовная интеграция с Search, Workspace, Cloud.
Где конкуренты имеют преимущество:
- GPT-5.5 часто лидирует в «сыром» рассуждении (например, ARC-AGI) и может быть сильнее в креативе/общих способностях.
- Claude Opus 4.7/Sonnet 4.6 превосходят в аккуратном кодинге (выше SWE-Bench в ряде случаев) и нюансированной письменной речи/безопасности.
- Эффективность по токенам варьируется; агентные петли могут сделать 3.5 Flash дороже в целом.
Сравнение на высоком уровне (примерно/выборочно; всегда проверяйте актуальные лидерборды):
| Бенчмарк / Метрика | Gemini 3.5 Flash | GPT-5.5 | Claude Opus 4.7 / Sonnet 4.6 | Gemini 3.1 Pro | Примечания |
|---|---|---|---|---|---|
| Terminal-bench 2.1 (Кодинг) | 76.2% | 78.2% | ~66% | 70.3% | Агентное программирование |
| MCP Atlas (Агентные) | 83.6% | 75.3% | 79.1% / 69.5% | 78.2% | Многошаговые процессы |
| GDPval-AA (агентные знания) | 1656 Elo | 1769 | 1753 | 1314 | Экономическая ценность |
| MMMU-Pro (Мультимодальный) | 83.6% | 81.2% | ~75% | 80.5% | Уверенное лидерство Gemini |
| Индекс интеллекта (AA) | 55 | Высокий (varies) | Конкурентоспособный | Ниже | Парето: скорость/интеллект |
| Скорость (токенов/с) | >280 | Ниже | Переменная | Медленнее | Преимущество Flash |
| Цена ввода/вывода ($/1M) | 1.50 / 9.00 | Выше | Выше (особенно Opus) | 2/12 | Эффективность по стоимости |
| Окно контекста | 1M | Конкурентоспособный | Сильный | 1M+ | Уровень передовых |
Итоги компромиссов:
- Gemini 3.5 Flash выигрывает по скорости + мультимодальности + эффективности агентных сценариев на масштабе.
- GPT-5.5 часто чуть опережает в пиковом «сыром» рассуждении/кодинге.
- Claude 4.7 Opus силён в аккуратном, высоконадёжном кодинге, но дороже/медленнее.
Gemini часто лидирует или делит лидерство в мультимодальных и специфических агентных наборах, оставаясь быстрее и доступнее для высоких объёмов.
Как получить доступ и интегрировать Gemini 3.5 Flash
Доступ возможен через:
- Gemini App / Google AI Studio
- Gemini API (
gemini-3.5-flash) - Google Cloud Vertex AI / Enterprise Agent Platform
- Сторонних агрегаторов для мультипровайдерной гибкости.
Рекомендация CometAPI: для продакшена на Cometapi.com интегрируйтесь один раз с одним API‑ключом, чтобы получить доступ к Gemini 3.5 Flash (и 500+ моделям от OpenAI, Anthropic, xAI и др.) с на 20–40% более низкой эффективной ценой, без vendor lock‑in и простым свопом моделей.
Преимущества для ваших проектов:
- Тестируйте Gemini 3.5 Flash против GPT-5.5 или Claude 4.7 мгновенно, просто меняя имя модели.
- Единый биллинг, маршрутизация фолбэков и оптимизированная задержка.
- Идеально для агентных приложений, требующих надёжности между провайдерами.
- Бесплатная регистрация ключа API с щедрыми лимитами тестирования.
Пример интеграции прост как с официальными SDK, так и с унифицированной конечной точкой CometAPI — отлично подходит для масштабирования разработки.
Сценарии и лучшие практики
- Агентная автоматизация: стройте надёжные мультиагентные системы для исследований, анализа данных и поддержки клиентов.
- Кодинг и разработка: итеративное прототипирование, отладка и генерация конвейеров целиком в Antigravity или IDE.
- Мультимодальные приложения: анализ изображений/видео, понимание диаграмм, генерация контента.
- Корпоративные процессы: длинные многошаговые цепочки с контролем стоимости через кеширование и уровни размышления.
Советы: используйте полную историю диалога для сохранения хода рассуждений. Начинайте с medium. Оптимизируйте подсказки, чтобы уменьшить вызовы инструментов. Отслеживайте использование токенов для эффективности по стоимости.
Ограничения и соображения
- Рост цены требует тщательной оптимизации для высокообъёмных приложений.
- Пока нет Computer Use (следите за обновлениями).
- Оценки безопасности показывают хорошую динамику и улучшения тона, хотя автоматические метрики варьируются.
- Снижение галлюцинаций заметно, но критичные ответы всегда валидируйте.
- Рост цены: выше, чем у предыдущих моделей Flash; оптимизируйте уровнями размышления и кешированием.
- Отсечка знаний: январь 2025 — используйте привязку к источникам/поиск для текущих событий.
Заключение: стоит ли Gemini 3.5 Flash?
Да — для разработчиков и предприятий, которые ставят в приоритет скорость, надёжность агентных сценариев, мультимодальные возможности и масштабируемую производительность. Она расширяет Парето‑фронтир, делая передовой ИИ доступнее для продакшен‑нагрузок.
Готовы строить? Перейдите на CometAPI, чтобы протестировать Gemini 3.5 Flash вместе с другими топ‑моделями в одной панели. Оптимизируйте свой AI‑стек, снижайте затраты и выпускайте быстрее.
