Google는 Gemini 제품군의 새로운 내부 반복 버전을 조용히 테스트하고 있으며, 업계에서는 이를 “Gemini 3.5” 또는 흥미로운 내부 코드명 **“Snow Bunny”**로 보고하고 있습니다. 코드명 **"Snow Bunny"**인 이 내부 체크포인트는 기존 벤치마크를 깨뜨렸다고 전해지며, 단일 프롬프트로 최대 3,000줄의 동작 가능한 코드를 생성해 전체 소프트웨어 애플리케이션을 만들어내는 전례 없는 능력을 보여준 것으로 알려졌습니다.
실리콘밸리가 데이터를 검증하기 위해 분주한 가운데, 초기 보고에 따르면 Google이 "System 2" 추론에서 돌파구를 마련했으며, Gemini 3.5는 응답 전에 멈춰 사고하고 복잡한 시스템을 설계하는 능력에서 GPT-5.2와 Claude Opus 4.5 같은 현재의 리더들을 뛰어넘는 숙련도를 보여준다고 합니다.
Gemini 3.5 "Snow Bunny"란 무엇인가?
내부적으로 "Snow Bunny"라는 코드명으로 불리는 Gemini 3.5는 2025년 말에 관찰된 모델 추론 능력의 정체에 대한 Google의 직접적인 해답으로 보입니다. 이전 모델들이 다중모달 이해와 컨텍스트 윈도우 크기에 크게 집중했던 것과 달리, Gemini 3.5는 확장된 인지 지평과 자율 소프트웨어 아키텍처로의 패러다임 전환을 의미합니다.
"Snow Bunny" 아키텍처
"Snow Bunny"라는 명칭은 현재 Google의 Vertex AI와 AI Studio 플랫폼에서 A/B 테스트 중인 모델의 특정 고성능 체크포인트를 가리킨다고 전해집니다. 유출 정보에 따르면, 이는 단순한 "Pro" 또는 "Ultra" 리프레시가 아니라 "Deep Think" 기능을 통합한 근본적인 아키텍처 업그레이드라고 합니다.
특화된 모델 변형
유출에 따르면 "Snow Bunny"는 단일 모놀리식 모델이 아니라 특화된 모델들의 패밀리일 가능성이 있습니다. 유출 문서에서 두 가지 구체적인 변형이 확인되었습니다:
- Fierce Falcon: 원시 계산 속도와 논리적 추론에 최적화된 변형으로, 경쟁 프로그래밍과 신속한 데이터 분석을 겨냥한 것으로 보입니다.
- Ghost Falcon: "vibe coding"에 특화된 창의적 파워하우스로, UI/UX 디자인, SVG 생성, 오디오 합성, 시각 효과를 높은 충실도로 처리합니다.
System 2 추론: "Deep Think" 모드
Gemini 3.5의 결정적 특징은 소문으로 전해지는 "System 2" 추論 엔진입니다. 인간 인지 심리학에서 영감을 받아, 이 시스템은 모델이 복잡한 질의에 응답하기 전에 "멈춰" 생각할 수 있게 합니다. 다음 토큰을 즉시 예측하는 대신, 모델은 숨겨진 chain-of-thought 프로세스에 들어가 코드나 논리 퍼즐에 대한 여러 실행 경로를 평가합니다. 이 "Deep Think" 토글은 벤치마크 점수를 미지의 영역으로 끌어올렸다고 전해집니다.
누가 이 소식을 전했나?
Gemini 3.5의 존재는 2026년 1월 말 X(구 Twitter)와 기술 블로그에서의 일련의 조직적 유출을 통해 드러났습니다.
- 주요 출처: 기술 블로거이자 인사이더인 Pankaj Kumar가 "Snow Bunny" 모델의 작동 스크린샷과 로그를 공유하며 첫 폭탄을 던졌습니다. 그의 게시물은 모델이 복잡한 엔지니어링 과제를 "원샷"으로 해결하는 능력을 자세히 설명했습니다.
- 벤치마크 검증: Hieroglyph 측면 추론 벤치마크를 유지하는 "Leo"라는 사용자가 유출을 입증했습니다. 그는 "Snow Bunny" 변형이 측면 사고 과제에서 80~88%의 성공률을 달성한 결과를 게시했는데, 대부분의 모델(예: GPT-5.2)은 55%를 넘기기 힘든 테스트입니다.
- 기술적 확인: Google의 API 서비스 백엔드 코드에 "gemini-for-google-3.5" 변수가 등장하면서 추가적인 신뢰도가 더해졌습니다. 이는 공개 출시를 위한 인프라가 이미 갖춰져 있음을 시사합니다.

3.5는 3.0 / 3 Flash와 무엇이 다른가?
유출 보고에 따르면, 주요 차별점은:
- 대규모, 시스템 수준 코드 합성: (개별 함수 생성에 그치지 않고) 수천 줄에 걸쳐 전역 상태와 아키텍처를 유지하는 능력.
- 통합된 다중모달 산출물 생성: 동일한 세션에서 코드, 벡터 그래픽, 네이티브 오디오를 단일 일관된 워크플로로 생성.
- 미세 조정 가능한 추론 제어: 지연 시간을 더 깊은 chain-of-thought 스타일의 내부 탐색으로 교환하는 실험적 토글(예: “Deep Think” / “System2”).
이들은 급진적으로 다른 아키텍처라기보다는 점진적 엔지니어링 개선처럼 들리지만, 대규모 검증이 이루어진다면 팀이 제품 산출물을 프로토타입하고 출하하는 방식이 바뀔 수 있습니다.
기능과 성능은 어떻게 비교되나?
유출된 지표는 동시대 모델보다 훨씬 더 유능하고 빠르다는 그림을 그립니다.
3,000줄 코딩의 기적
유출에서 가장 바이럴한 주장은 Gemini 3.5가 단일 고수준 프롬프트에서 3,000줄의 실행 가능한 코드를 생성한다는 것입니다. 언급된 구체적 예시는 사용자가 모델에 Nintendo Game Boy 에뮬레이터를 구축해 달라고 요청한 경우였습니다.
일반적인 워크플로에서 GPT-4 또는 Gemini 1.5로 이 작업을 수행하려면 CPU 아키텍처 분해, 메모리 맵 정의, 그래픽 렌더링 처리, 반복적인 디버깅 등 수십 개의 프롬프트가 필요합니다. 반면 Gemini 3.5 "Snow Bunny"는 CPU 명령 집합, GPU 에뮬레이션, 메모리 처리 등을 포함한 전체 코드베이스를 하나의 연속 스트림으로 출력했으며, 실제 ROM을 부팅하기 위한 약간의 수동 수정만 필요했다고 합니다.
성능 벤치마크: Gemini 3.5 vs GPT-5.2 vs Claude Opus 4.5
| 벤치마크 | Gemini 3.5 "Snow Bunny" | GPT-5.2 (Est.) | Claude Opus 4.5 |
|---|---|---|---|
| Hieroglyph (측면 추론) | 80% - 88% | 55% | ~50% |
| GPQA Diamond (박사급 과학) | >90% | ~85% | ~80% |
| 토큰 생성 속도 | ~218 tokens/sec | ~80 tokens/sec | ~60 tokens/sec |
초당 218 토큰이라는 속도는 경쟁사들에게 특히 충격적입니다.
이 정도 추론 깊이를 가진 모델이 이렇게 높은 속도로 작동한다는 것은 Google의 TPU v6 인프라에서의 대규모 최적화 또는 희소 모델 아키텍처의 돌파를 암시합니다.
코드 예시: "원샷" 능력
"3,000줄의 코드"가 의미하는 복잡성을 설명하기 위해, 모델이 단순한 스크립트를 작성하는 것이 아니라 시스템을 설계한다는 점을 고려해 보십시오.
아래는 유출된 Game Boy 에뮬레이터의 **Memory Management Unit (MMU)**를 단일 패스에서 구조화하는 방식의 개념적 스니펫입니다.
Note: The following is a representative excerpt of the type of low-level logic "Snow Bunny" generates autonomously.
python
class GameBoyMMU:
def __init__(self, bios_path):
self.bios = self.load_bios(bios_path)
self.rom = bytearray(0x8000) # 32k Cartridge
self.vram = bytearray(0x2000) # 8k Video RAM
self.wram = bytearray(0x2000) # 8k Working RAM
self.zram = bytearray(0x80) # Zero-page RAM
self.in_bios = True
def load_bios(self, path):
try:
with open(path, 'rb') as f:
return bytearray(f.read())
except FileNotFoundError:
return bytearray(256)
def read_byte(self, address):
# BIOS Mapping
if self.in_bios and address < 0x0100:
return self.bios[address]
elif address == 0x0100:
self.in_bios = False
# Memory Map Routing
if 0x0000 <= address < 0x8000:
return self.rom[address]
elif 0x8000 <= address < 0xA000:
return self.vram[address - 0x8000]
elif 0xC000 <= address < 0xE000:
return self.wram[address - 0xC000]
elif 0xFF80 <= address < 0xFFFF:
return self.zram[address - 0xFF80]
# ... (Extended handling for I/O registers, Interrupts, Echo RAM)
return 0xFF
def write_byte(self, address, value):
# VRAM Write (Block during rendering modes if necessary)
if 0x8000 <= address < 0xA000:
self.vram[address - 0x8000] = value
# DMA Transfer Trigger
elif address == 0xFF46:
self.dma_transfer(value)
# ... (Complex logic for banking, timer controls, audio registers)
def dma_transfer(self, source_high):
# Direct Memory Access implementation simulating 160ms cycle
source_addr = source_high << 8
for i in range(0xA0):
byte = self.read_byte(source_addr + i)
self.write_byte(0xFE00 + i, byte) # Write to OAM
일반적인 상호작용에서 사용자는 단순히 다음과 같이 프롬프트할 것입니다: "BIOS 로딩, 메모리 매핑, 기본 CPU opcode를 처리하는 완전한 기능의 Python 기반 Game Boy 에뮬레이터를 만들어라." 그러면 Gemini 3.5는 위의 클래스뿐 아니라 CPU 클래스, PPU(Pixel Processing Unit), 메인 실행 루프까지 생성하며, 수천 줄에 걸쳐 일관성을 유지합니다.
출시 시기는 언제인가?
Google이 공식적으로 출시일을 확인하지는 않았지만, 유출의 수렴은 발표가 임박했음을 시사합니다.
- 타임라인: 내부 테스트 변수와 "Snow Bunny" 체크포인트는 후기 검증 단계에 있는 것으로 보입니다. 경쟁사 출시를 선제하기 위해 2026년 2월에 "섀도 드롭" 또는 대규모 공개가 이루어질 것이라는 추측이 나옵니다.
- 현재 상태: 이 모델은 현재 프라이빗 베타이며, Vertex AI를 통해 선택된 신뢰할 수 있는 테스터와 엔터프라이즈 파트너만 접근할 수 있습니다.
가격과 비용 세부 정보는?
가격은 Gemini 전략에서 가장 공격적인 측면 중 하나로 남아 있습니다. 소문에 따르면 Google은 하드웨어(TPU)와 소프트웨어의 수직 통합을 활용해 시장을 대폭 저가로 공략하려 합니다.
- Gemini 3.5 Flash: 유출된 가격은 100만 입력 토큰당 $0.50 수준으로 제시됩니다. 이는 경쟁사의 유사한 "스마트" 모델 대비 약 70% 저렴합니다.
- Gemini 3.5 Pro/Ultra: 가격은 경쟁력이 있을 것으로 예상되며, "Deep Think" 기능을 위한 계층형 구독 모델 도입 가능성이 있습니다.
- Deep Think 추가 요금: 모델이 응답 전에 "생각"하는 데 더 많은 연산 시간이 필요하므로 "System 2" 추론 모드가 토큰당 더 높은 비용을 요구할 수 있다는 추측이 있습니다.
결론
만약 "Snow Bunny" 유출이 사실이라면, Google Gemini 3.5는 단순한 점진적 업데이트가 아니라 강력한 지배 선언입니다. "게으른 코딩" 문제를 해결하고 대규모·일관된 코드 생성을 가능하게 함으로써, Google은 개발자를 코드 작성자에서 시스템 아키텍트로 변모시키는 문턱에 와 있을지도 모릅니다. 공식 키노트를 기다리는 동안 한 가지는 분명합니다. AI 무기 경쟁은 이미 극초음속으로 가속되고 있습니다.
개발자는 기사 발행 시점 기준 최신 모델인 Gemini 3 Flash와 Gemini 3 Pro를 CometAPI에서 이용할 수 있습니다. 시작하려면 Playground에서 모델의 기능을 탐색하고 자세한 지침은 API 가이드를 참고하세요. 접근하기 전에 CometAPI에 로그인해 API 키를 발급받았는지 확인하십시오. CometAPI는 통합을 돕기 위해 공식 가격보다 훨씬 낮은 가격을 제공합니다.
Ready to Go?→ 오늘 바로 Gemini 3에 가입하세요 !
