Google Gemini 3.5(Snow Bunny) утекла: всё, что вам нужно знать

CometAPI
AnnaJan 30, 2026
Google Gemini 3.5(Snow Bunny) утекла: всё, что вам нужно знать

Google тихо тестирует новую внутреннюю итерацию семейства Gemini — фигурирующую под названиями «Gemini 3.5» и под интригующим внутренним кодовым именем «Snow Bunny». Под кодовым названием «Snow Bunny» эта внутренняя контрольная версия, по сообщениям, разгромила существующие бенчмарки, продемонстрировав беспрецедентную способность генерировать целые программные приложения — до 3,000 строк функционального кода — по одному запросу.

Пока Силиконовая долина спешит верифицировать данные, ранние сообщения указывают, что Google достиг прорыва в рассуждении «System 2», позволяя Gemini 3.5 делать паузы, размышлять и проектировать сложные системы с такой мастерством, которое затмевает текущих лидеров, таких как GPT-5.2 и Claude Opus 4.5.

Что такое Gemini 3.5 «Snow Bunny»?

Gemini 3.5, именуемый внутри компании кодовым названием «Snow Bunny», по‑видимому, является прямым ответом Google на стагнацию способностей к рассуждению у моделей, наблюдавшуюся в конце 2025 года. В отличие от предшественников, которые уделяли особое внимание мультимодальному пониманию и размеру контекстного окна, Gemini 3.5 представляет собой смену парадигмы в сторону расширенных когнитивных горизонтов и автономной архитектуры ПО.

Архитектура «Snow Bunny»

Название «Snow Bunny», по сообщениям, относится к конкретной высокопроизводительной контрольной версии модели, которая проходит A/B‑тестирование на платформах Vertex AI и AI Studio от Google. Утечка предполагает, что это не просто обновление уровня «Pro» или «Ultra», а фундаментальный архитектурный апгрейд с интеграцией возможностей «Deep Think».

Специализированные варианты модели

Утечки указывают, что «Snow Bunny» может быть семейством специализированных моделей, а не монолитом. В слитой документации обозначены два конкретных варианта:

  • Fierce Falcon: вариант, оптимизированный под чистую вычислительную скорость и логическое дедуцирование, вероятно нацеленный на соревновательное программирование и быстрый анализ данных.
  • Ghost Falcon: творческая мощь, предназначенная для «vibe coding», способная обрабатывать дизайн UI/UX, генерацию SVG, синтез аудио и визуальные эффекты с высокой точностью.

Рассуждение «System 2»: режим «Deep Think»

Определяющей особенностью Gemini 3.5 считается его движок рассуждения «System 2». Вдохновляясь когнитивной психологией человека, система позволяет модели «поставить на паузу» ответ на сложные запросы. Вместо немедленного предсказания следующего токена модель вступает в скрытый процесс chain‑of‑thought, оценивая несколько путей выполнения для кода или логических задач. По сообщениям, этот переключатель «Deep Think» вытолкнул её показатели бенчмарков на неизведанную территорию.


Кто сообщил эту новость?

Существование Gemini 3.5 стало известно благодаря серии скоординированных утечек в соцсети X (ранее Twitter) и на технических блогах в конце января 2026 года.

  • Первичный источник: первый мощный вброс сделал техноблогер и инсайдер Pankaj Kumar, опубликовав скриншоты и логи работы модели «Snow Bunny». В его постах детализировалась способность модели «в одну попытку» выполнять сложные инженерные задачи.
  • Валидация бенчмарков: пользователь под ником «Leo», поддерживающий бенчмарк латерального мышления Hieroglyph, подтвердил утечки. Он выложил результаты, показывающие, что вариант «Snow Bunny» достигает 80–88% успеха на задачах латерального мышления — тесте, где большинство моделей, включая GPT-5.2, с трудом преодолевают 55%.
  • Техническое подтверждение: дополнительную достоверность придало появление переменных «gemini-for-google-3.5» в бэкенд‑коде API‑сервисов Google, что намекает на готовую инфраструктуру для публичного запуска.

Google Gemini 3.5(Snow Bunny) утекла: всё, что вам нужно знать

Чем 3.5 будет отличаться от 3.0 / 3 Flash?

Согласно сообщениям об утечке, ключевые отличия таковы:

  • Крупномасштабный, системный синтез кода: способность поддерживать глобальное состояние и архитектуру на тысячах строк (а не лишь генерировать изолированные функции).
  • Единый мультимодальный выпуск артефактов: в одной сессии порождаются код, векторная графика и нативный звук в едином согласованном процессе.
  • Тонкая настройка рассуждения: экспериментальные переключатели (например, «Deep Think» / «System2»), позволяющие менять задержку в обмен на более глубокий внутренний поиск в стиле chain‑of‑thought.

Это звучит как итеративные инженерные улучшения, а не радикально другая архитектура, но при валидации в масштабе они изменят то, как команды прототипируют и выпускают продуктовые артефакты.

Как сравниваются возможности и производительность?

Слитые метрики рисуют картину модели, которая существенно более способна и быстра по сравнению с современниками. 

Чудо 3,000 строк кода

Самое вирусное утверждение из утечки — способность Gemini 3.5 генерировать 3,000 строк исполняемого кода по одному, высокоуровневому запросу. В качестве конкретного примера упоминался пользовательский запрос построить эмулятор Nintendo Game Boy.

В стандартном рабочем процессе с GPT-4 или Gemini 1.5 такая задача потребовала бы десятки запросов: разбор архитектуры ЦПУ, определение карты памяти, обработка графического рендеринга и итеративная отладка. По сообщениям, Gemini 3.5 «Snow Bunny» вывел целую кодовую базу — включая набор инструкций CPU, эмуляцию GPU и управление памятью — единым непрерывным потоком, после чего потребовались лишь незначительные ручные поправки, чтобы загружать реальные ROM.

Результаты производительности: Gemini 3.5 vs GPT-5.2 vs Claude Opus 4.5

БенчмаркGemini 3.5 «Snow Bunny»GPT-5.2 (оцен.)Claude Opus 4.5
Hieroglyph (латеральное мышление)80% - 88%55%~50%
GPQA Diamond (научные задачи уровня PhD)>90%~85%~80%
Скорость генерации токенов~218 токенов/с~80 токенов/с~60 токенов/с

Скорость 218 токенов в секунду особенно тревожит конкурентов. 

Для модели такой глубины рассуждения работать с такой высокой скоростью означает либо мощную оптимизацию инфраструктуры TPU v6 от Google, либо прорыв в разреженной архитектуре моделей.

Пример кода: возможность «one-shot»

Чтобы проиллюстрировать сложность того, что подразумевается под «3,000 строк кода», учтите, что модель пишет не просто скрипт. Она проектирует систему. 

Ниже — концептуальный фрагмент того, как Gemini 3.5 может структурировать блок управления памятью (MMU) утёкшего эмулятора Game Boy в одном проходе.

Примечание: ниже приведён репрезентативный фрагмент того типа низкоуровневой логики, которую «Snow Bunny» генерирует автономно.

python

class GameBoyMMU:
    def __init__(self, bios_path):
        self.bios = self.load_bios(bios_path)
        self.rom = bytearray(0x8000)  # 32k Cartridge
        self.vram = bytearray(0x2000) # 8k Video RAM
        self.wram = bytearray(0x2000) # 8k Working RAM
        self.zram = bytearray(0x80)   # Zero-page RAM
        self.in_bios = True

    def load_bios(self, path):
        try:
            with open(path, 'rb') as f:
                return bytearray(f.read())
        except FileNotFoundError:
            return bytearray(256)

    def read_byte(self, address):
        # BIOS Mapping
        if self.in_bios and address < 0x0100:
            return self.bios[address]
        elif address == 0x0100:
            self.in_bios = False
        
        # Memory Map Routing
        if 0x0000 <= address < 0x8000:
            return self.rom[address]
        elif 0x8000 <= address < 0xA000:
            return self.vram[address - 0x8000]
        elif 0xC000 <= address < 0xE000:
            return self.wram[address - 0xC000]
        elif 0xFF80 <= address < 0xFFFF:
            return self.zram[address - 0xFF80]
        # ... (Extended handling for I/O registers, Interrupts, Echo RAM)
        return 0xFF

    def write_byte(self, address, value):
        # VRAM Write (Block during rendering modes if necessary)
        if 0x8000 <= address < 0xA000:
            self.vram[address - 0x8000] = value
        # DMA Transfer Trigger
        elif address == 0xFF46:
            self.dma_transfer(value)
        # ... (Complex logic for banking, timer controls, audio registers)
        
    def dma_transfer(self, source_high):
        # Direct Memory Access implementation simulating 160ms cycle
        source_addr = source_high << 8
        for i in range(0xA0):
            byte = self.read_byte(source_addr + i)
            self.write_byte(0xFE00 + i, byte) # Write to OAM

В типичном взаимодействии пользователь просто формулирует запрос: «Создай полностью функциональный эмулятор Game Boy на Python, который обрабатывает загрузку BIOS, отображение памяти и базовые опкоды CPU.» Затем Gemini 3.5 генерирует приведённый выше класс вместе с классом CPU, PPU (Pixel Processing Unit) и основным циклом выполнения, поддерживая согласованность на тысячах строк.

Когда будет релиз?

Хотя Google официально не объявлял дату релиза, конвергенция утечек говорит о скором анонсе. 

  • Сроки: внутренние тестовые переменные и контрольная версия «Snow Bunny» находятся на поздней стадии валидации. Ходят слухи о возможном «скрытом релизе» или крупном анонсе в феврале 2026 года, возможно, чтобы опередить релизы конкурентов.
  • Текущий статус: модель находится в закрытой бетe, доступной только избранным доверенным тестерам и корпоративным партнёрам через Vertex AI.

Какова стоимость и цены?

Ценообразование остаётся одной из самых агрессивных частей стратегии Gemini. Слухи указывают, что Google намерен существенно демпинговать рынок, используя вертикальную интеграцию аппаратного (TPU) и программного обеспечения.

  • Gemini 3.5 Flash: согласно утечкам, примерно $0.50 за 1 миллион входных токенов. Это примерно на 70% дешевле сопоставимых «умных» моделей конкурентов.
  • Gemini 3.5 Pro/Ultra: ожидается конкурентная цена, возможно с введением многоуровневой подписки для возможностей «Deep Think».
  • Доплата за Deep Think: есть предположение, что режим рассуждения «System 2» может стоить дороже за токен из‑за увеличенного вычислительного времени, необходимого модели, чтобы «подумать» перед генерацией ответа.

Заключение

Если утечки о «Snow Bunny» подтвердятся, Google Gemini 3.5 — это не просто инкрементальное обновление; это мощная декларация доминирования. Решив проблему «ленивого кода» и обеспечив массовую, согласованную генерацию кода, Google может превратить разработчиков из писателей кода в архитекторов систем. Пока мы ждём официального кейнота, ясно одно: гонка вооружений в области ИИ ускорилась до гиперзвука.

Разработчики могут получить доступ к Gemini 3 Flash и Gemini 3 Pro CometAPI, последние модели указаны на дату публикации статьи. Для начала изучите возможности модели в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом, пожалуйста, убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы помочь вам с интеграцией.

Готовы начать?→ Зарегистрируйтесь в Gemini 3 уже сегодня!

Если вы хотите узнавать больше советов, гайдов и новостей об ИИ, следите за нами в VK, X и Discord!

Читать далее

500+ моделей в одном API

Скидка до 20%