Google Gemini 3.5 (Snow Bunny) lekket: Alt du trenger å vite

CometAPI
AnnaJan 30, 2026
Google Gemini 3.5 (Snow Bunny) lekket: Alt du trenger å vite

Google tester i det stille en ny intern iterasjon av sin Gemini-familie — omtalt både som “Gemini 3.5” og under det pirrende interne kodenavnet “Snow Bunny.” Med kodenavn "Snow Bunny" skal dette interne sjekkpunktet ha knust eksisterende benchmarker og demonstrert en enestående evne til å generere hele programvareapplikasjoner—opptil 3 000 linjer med funksjonell kode—i én enkelt prompt.

Mens Silicon Valley febrilsk forsøker å verifisere dataene, antyder tidlige rapporter at Google har oppnådd et gjennombrudd i "System 2"-resonnering, som gjør at Gemini 3.5 kan pause, tenke og utforme komplekse systemer med en kompetanse som overgår dagens ledere som GPT-5.2 og Claude Opus 4.5.

Hva er Gemini 3.5 "Snow Bunny"?

Gemini 3.5, omtalt internt med kodenavnet "Snow Bunny", ser ut til å være Googles direkte svar på stagnasjonen i modellers resonneringsevner observert mot slutten av 2025. I motsetning til forgjengerne, som la stor vekt på multimodal forståelse og størrelsen på kontekstvinduet, markerer Gemini 3.5 et paradigmeskifte mot utvidede kognitive horisonter og autonom programvarearkitektur.

«Snow Bunny»-arkitekturen

Betegnelsen "Snow Bunny" skal referere til et spesifikt, høyytelses-sjekkpunkt av modellen som for tiden gjennomgår A/B-testing på Googles Vertex AI- og AI Studio-plattformer. Lekkasjonen antyder at dette ikke bare er en "Pro"- eller "Ultra"-oppfriskning, men en grunnleggende arkitektonisk oppgradering som integrerer "Deep Think"-kapabiliteter.

Spesialiserte modellvarianter

Lekkasjer indikerer at "Snow Bunny" kan være en familie av spesialiserte modeller snarere enn en enkelt monolitt. To spesifikke varianter er identifisert i den lekkede dokumentasjonen:

  • Fierce Falcon: En variant optimalisert for rå beregningshastighet og logisk deduksjon, sannsynligvis rettet mot konkurranseprogrammering og rask dataanalyse.
  • Ghost Falcon: En kreativ kraftpakke designet for "vibe coding", som håndterer UI/UX-design, SVG-generering, lydsyntese og visuelle effekter med høy presisjon.

System 2-resonnering: "Deep Think"-modus

Den definerende funksjonen i Gemini 3.5 er den ryktede "System 2"-resonneringsmotoren. Inspirert av menneskelig kognitiv psykologi gjør dette systemet at modellen kan "pause" før den svarer på komplekse spørsmål. I stedet for å forutsi neste token umiddelbart, går modellen inn i en skjult chain-of-thought-prosess, der den vurderer flere eksekveringsbaner for kode eller logiske nøtter. Denne "Deep Think"-bryteren skal ha drevet benchmark-resultatene inn i upløyd mark.


Hvem brakte nyheten?

Eksistensen av Gemini 3.5 ble brakt frem gjennom en serie koordinerte lekkasjer på sosiale medieplattformen X (tidligere Twitter) og tekniske blogger i slutten av januar 2026.

  • Primærkilde: Den første bomben kom fra teknologibloggeren og innsidere Pankaj Kumar, som delte skjermbilder og logger av "Snow Bunny"-modellen i aksjon. Innleggene hans beskrev modellens evne til å "one-shot" komplekse ingeniøroppgaver.
  • Benchmark-validering: En bruker kjent som "Leo", som vedlikeholder Hieroglyph-benchmarken for lateral resonnering, bekreftet lekkasjene. Han postet resultater som viste at en "Snow Bunny"-variant oppnådde en suksessrate på 80–88 % på laterale tenkeoppgaver—en test der de fleste modeller, inkludert GPT-5.2, sliter med å komme over 55 %.
  • Teknisk bekreftelse: Ytterligere troverdighet ble lagt til ved at "gemini-for-google-3.5"-variabler dukket opp i backend-koden til Googles API-tjenester, noe som antyder at infrastrukturen for en offentlig lansering allerede er på plass.

Google Gemini 3.5 (Snow Bunny) lekket: Alt du trenger å vite

Hva vil skille 3.5 fra 3.0 / 3 Flash?

Basert på lekkasjerapporteringen er de viktigste differensiatorene:

  • Stor-skala, systemnivå kodesyntese: evnen til å opprettholde global tilstand og arkitektur på tvers av tusenvis av linjer (ikke bare isolert funksjonsgenerering).
  • Forent multimodal artefaktgenerering: samme økt produserer kode, vektorgrafikk og nativ lyd i én sammenhengende arbeidsflyt.
  • Finkornede resonneringskontroller: eksperimentelle brytere (f.eks. "Deep Think" / "System2") for å bytte latens mot dypere internt søk i chain-of-thought-stil.

Dette høres ut som iterative ingeniørforbedringer snarere enn en radikalt annerledes arkitektur, men hvis det valideres i stor skala vil det endre hvordan team prototyper og leverer produktartefakter.

Hvordan sammenlignes funksjonene og ytelsen?

De lekkede måltallene tegner et bilde av en modell som er betydelig mer kapabel og raskere enn sine samtidige. 

Mirakelet med 3 000 kodelinjer

Det mest virale påstanden fra lekkasjen er Gemini 3.5s evne til å generere 3 000 linjer med kjørbar kode fra en enkelt, overordnet prompt. Det spesifikke eksempelet gjaldt en bruker som ba modellen bygge en Nintendo Game Boy-emulator.

I en standard arbeidsflyt med GPT-4 eller Gemini 1.5 ville denne oppgaven kreve dusinvis av prompt: å bryte ned CPU-arkitekturen, definere minnekartet, håndtere grafikkrendering og feilsøke iterativt. Gemini 3.5 "Snow Bunny" skal ha skrevet ut hele kodebasen—inkludert CPU-instruksjonssett, GPU-emulering og minnehåndtering—i én sammenhengende strøm, som kun krevde mindre manuelle rettelser for å starte ekte ROM-er.

Ytelsesbenchmarker: Gemini 3.5 vs GPT-5.2 vs Claude Opus 4.5

BenchmarkGemini 3.5 "Snow Bunny"GPT-5.2 (ansl.)Claude Opus 4.5
Hieroglyph (lateral resonnering)80% - 88%55%~50%
GPQA Diamond (PhD-vitenskap)>90%~85%~80%
Hastighet for tokengenerering~218 tokens/sek~80 tokens/sek~60 tokens/sek

Hastigheten på 218 tokens per sekund er særlig alarmerende for konkurrentene. 

 For at en modell med denne dybden i resonnering skal kjøre med så høy hastighet, innebærer det en massiv optimalisering i Googles TPU v6-infrastruktur eller et gjennombrudd i sparsom modellarkitektur.

Kodeeksempel: «One-shot»-kapabiliteten

For å illustrere kompleksiteten i hva "3 000 linjer med kode" innebærer, bør man merke seg at modellen ikke bare skriver et enkelt skript. Den arkitekterer et system. 

 Nedenfor er et konseptuelt utdrag av hvordan Gemini 3.5 kan strukturere Memory Management Unit (MMU) til den lekkede Game Boy-emulatoren i én enkelt passering.

Merk: Følgende er et representativt utdrag av typen lavnivålogikk "Snow Bunny" genererer autonomt.

python

class GameBoyMMU:
    def __init__(self, bios_path):
        self.bios = self.load_bios(bios_path)
        self.rom = bytearray(0x8000)  # 32 kB-kassett
        self.vram = bytearray(0x2000) # 8 kB videominne
        self.wram = bytearray(0x2000) # 8 kB arbeidsminne
        self.zram = bytearray(0x80)   # Nullside-RAM
        self.in_bios = True

    def load_bios(self, path):
        try:
            with open(path, 'rb') as f:
                return bytearray(f.read())
        except FileNotFoundError:
            return bytearray(256)

    def read_byte(self, address):
        # BIOS-kartlegging
        if self.in_bios and address < 0x0100:
            return self.bios[address]
        elif address == 0x0100:
            self.in_bios = False
        
        # Ruting for minnekart
        if 0x0000 <= address < 0x8000:
            return self.rom[address]
        elif 0x8000 <= address < 0xA000:
            return self.vram[address - 0x8000]
        elif 0xC000 <= address < 0xE000:
            return self.wram[address - 0xC000]
        elif 0xFF80 <= address < 0xFFFF:
            return self.zram[address - 0xFF80]
        # ... (Utvidet håndtering for I/O-registre, avbrudd, Echo RAM)
        return 0xFF

    def write_byte(self, address, value):
        # VRAM-skriving (blokker under rendermoduser om nødvendig)
        if 0x8000 <= address < 0xA000:
            self.vram[address - 0x8000] = value
        # Utløser for DMA-overføring
        elif address == 0xFF46:
            self.dma_transfer(value)
        # ... (Kompleks logikk for banking, timerkontroller, lydregistre)
        
    def dma_transfer(self, source_high):
        # Implementasjon av direkte minneaksess som simulerer en 160 ms-syklus
        source_addr = source_high << 8
        for i in range(0xA0):
            byte = self.read_byte(source_addr + i)
            self.write_byte(0xFE00 + i, byte) # Skriv til OAM

I en typisk interaksjon ville en bruker ganske enkelt prompt: "Lag en fullt fungerende Game Boy-emulator i Python som håndterer BIOS-lasting, minnekartlegging og grunnleggende CPU-opkoder." Gemini 3.5 genererer deretter klassen over, sammen med CPU-klassen, PPU-en (Pixel Processing Unit) og hovedløkken, og opprettholder sammenheng på tvers av tusenvis av linjer.

Når blir den lansert?

Selv om Google ikke offisielt har bekreftet en lanseringsdato, antyder konvergensen av lekkasjer at en kunngjøring er nært forestående. 

  • Tidslinje: Interne testvariabler og "Snow Bunny"-sjekkpunktet ser ut til å være i validering i sen fase. Spekulasjoner peker mot en potensiell "shadow drop" eller en stor avduking i februar 2026, muligens for å foregripe konkurrentlanseringer.
  • Gjeldende status: Modellen er for øyeblikket i privat beta, kun tilgjengelig for utvalgte betatestere og bedriftskunder via Vertex AI.

Hva er pris- og kostnadsdetaljene?

Prising er et av de mest aggressive aspektene ved Gemini-strategien. Rykter indikerer at Google har til hensikt å underby markedet betydelig, ved å utnytte sin vertikale integrasjon av maskinvare (TPU-er) og programvare.

  • Gemini 3.5 Flash: Lekkede priser antyder omtrent $0,50 per 1 million input-tokens. Dette er om lag 70 % billigere enn tilsvarende "smarte" modeller fra konkurrenter.
  • Gemini 3.5 Pro/Ultra: Prisingen forventes å være konkurransedyktig, og kan introdusere en nivåinndelt abonnementmodell for "Deep Think"-kapabiliteter.
  • Deep Think-tillegg: Det spekuleres i at "System 2"-resonneringsmodus kan koste mer per token på grunn av økt beregningstid som kreves for at modellen skal "tenke" før den genererer et svar.

Konklusjon

Hvis "Snow Bunny"-lekkasjene holder vann, er Google Gemini 3.5 ikke bare en inkrementell oppdatering; det er en kraftfull erklæring om dominans. Ved å løse "lat koding"-problemet og muliggjøre massiv, sammenhengende kodegenerering, kan Google være i ferd med å forvandle utviklere fra kodeforfattere til systemarkitekter. Mens vi venter på den offisielle keynoten, er én ting klar: kappløpet innen KI har akkurat akselerert til hypersoniske hastigheter.

Utviklere kan få tilgang til Gemini 3 Flash og Gemini 3 Pro CometAPI, de nyeste modellene er oppført per artikkelens publiseringsdato. For å komme i gang, utforsk modellens kapabiliteter i Playground og se API-veiledningen for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du er logget inn på CometAPI og har skaffet API-nøkkelen. CometAPI tilbyr en pris langt under den offisielle prisen for å hjelpe deg med integreringen.

Klar til å starte?→ Registrer deg for Gemini 3 i dag !

Hvis du vil ha flere tips, guider og nyheter om KI, følg oss på VK, X og Discord!

Les mer

500+ modeller i ett API

Opptil 20 % rabatt