Gemini 3 Pro (Preview) er Google/DeepMinds nyeste flaggskip innen multimodal resonneringsmodell i Gemini 3-familien. Den posisjoneres som deres «mest intelligente modell til nå», utviklet for dyptgående resonnering, agentiske arbeidsflyter, avansert koding og multimodal forståelse med lang kontekst (tekst, bilder, lyd, video, kode og verktøyintegrasjoner).
Nøkkelfunksjoner
- Modaliteter: Tekst, bilde, video, lyd, PDF-er (og strukturerte verktøyutdata).
- Agentisk/verktøy: Innebygd funksjonskalling, søk-som-verktøy, kodekjøring, URL-kontekst og støtte for orkestrering av flertrinnsagenter. En «thought-signature»-mekanisme bevarer flerstegsresonnering på tvers av kall.
- Koding og «vibe coding»: Optimalisert for front-end-generering, interaktiv UI-generering og agentisk koding (topper relevante resultatlister rapportert av Google). Markedsføres som deres sterkeste «vibe-coding»-modell til nå.
- Nye utviklerkontroller:
thinking_level(low|high) for å avveie kostnad/latens mot dybde i resonnering, ogmedia_resolutionsom styrer multimodal gjengivelseskvalitet per bilde- eller videoramme. Disse hjelper med å balansere ytelse, latens og kostnad.
Benchmark-ytelse
- Gemini3Pro oppnådde førsteplass i LMARE med en score på 1501, og overgikk Grok-4.1-thinking sine 1484 poeng; den ledet også over Claude Sonnet 4.5 og Opus 4.1.
- Den oppnådde også førsteplass i programmeringsarenaen WebDevArena med en score på 1487.
- I Humanity’s Last Exam (akademisk resonnering) oppnådde den 37.5% (uten verktøy); i GPQA Diamond (science) 91.9%; og i konkurransen MathArena Apex (matematikk) 23.4%, og satte ny rekord.
- For multimodale egenskaper oppnådde MMMU-Pro 81%; og i Video-MMMU (videoforståelse) 87.6%.
Tekniske detaljer og arkitektur
- Parameter for «thinking level»: Gemini 3 eksponerer en
thinking_level-kontroll som lar utviklere avveie dybden i intern resonnering mot latens/kostnad. Modellen behandlerthinking_levelsom en relativ kvote for intern flerstegsresonnering, ikke en streng token-garanti. Standard er typiskhighfor Pro. Dette er en eksplisitt ny kontroll for å justere flerstegs planlegging og dybde i chain-of-thought. - Strukturerte utdata og verktøy: Modellen støtter strukturerte JSON-utdata og kan kombineres med innebygde verktøy (Google Search grounding, URL-kontekst, kodekjøring osv.). Noen funksjoner for strukturerte utdata + verktøy er kun i forhåndsvisning for
gemini-3-pro-preview. - Multimodale og agentiske integrasjoner: Gemini 3 Pro er eksplisitt bygget for agentiske arbeidsflyter (verktøy + flere agenter over kode/terminaler/nettleser).
Begrensninger og kjente forbehold
- Ikke perfekt faktualitet — hallusinasjoner er fortsatt mulig. Til tross for betydelige forbedringer i faktualitet rapportert av Google, er forankret verifisering og menneskelig gjennomgang fortsatt nødvendig i situasjoner med høy risiko (juridisk, medisinsk, finans).
- Ytelse på lang kontekst varierer etter oppgave. Støtte for et 1M input-vindu er en reell kapasitet, men empirisk effektivitet kan falle på enkelte benchmarker ved ekstreme lengder (observerte punktvise fall ved 1M på noen tester for lang kontekst).
- Avveininger mellom kostnad og latens. Store kontekster og høyere
thinking_level-innstillinger øker beregning, latens og kostnad; prismodeller gjelder basert på token-volumer. Brukthinking_levelog chunking-strategier for å håndtere kostnader. - Sikkerhet og innholdsfiltre. Google fortsetter å bruke sikkerhetspolicyer og modereringslag; visst innhold og visse handlinger forblir begrenset eller vil utløse avvisningsmoduser.
Hvordan Gemini 3 Pro Preview sammenlignes med andre toppmodeller
Overordnet sammenligning (preview → kvalitativ):
Sammenlignet med Gemini 2.5 Pro: Markante forbedringer i resonnering, agentisk verktøybruk og multimodal integrasjon; langt større konteksthåndtering og bedre forståelse av lange tekster. DeepMind viser jevne gevinster på tvers av akademisk resonnering, koding og multimodale oppgaver.
Sammenlignet med GPT-5.1 og Claude Sonnet 4.5 (ifølge rapportene): I Google/DeepMinds benchmark-oversikt presenteres Gemini 3 Pro som ledende på flere agentiske, multimodale og metrikker for lang kontekst (se Terminal-Bench, MMMU-Pro, AIME). Sammenlignende resultater varierer etter oppgave.
Typiske og høyverdige bruksområder
- Oppsummering av store dokumenter/bøker og Q&A: støtte for lang kontekst gjør den attraktiv for juridiske, forsknings- og compliance-team.
- Forståelse og generering av kode i repo-skala: integrasjon med kodeverktøykjeder og forbedret resonnering hjelper ved store refaktoreringer og automatiserte kodegjennomganger.
- Multimodale produktassistenter: bilde + tekst + lyd-arbeidsflyter (kundestøtte som tar inn skjermbilder, utdrag fra samtaler og dokumenter).
- Mediegenerering og -redigering (foto → video): tidligere Gemini-funksjoner omfatter nå foto→video-funksjoner i Veo-/Flow-stil; forhåndsvisningen antyder dypere multimediagenerering for prototyper og mediearbeidsflyter.
Slik får du tilgang til Gemini 3 Pro API
Trinn 1: Registrer deg for API-nøkkel
Logg inn på cometapi.com. Hvis du ikke er bruker ennå, registrer deg først. Logg inn på din CometAPI console. Hent API-nøkkelen for grensesnittet. Klikk «Add Token» ved API-token i det personlige senteret, hent token-nøkkelen: sk-xxxxx og send inn.
Trinn 2: Send forespørsler til Gemini 3 Pro API
Velg «gemini-3-pro»-endepunktet for å sende API-forespørselen og angi forespørselskroppen. Forespørselsmetoden og forespørselskroppen finnes i API-dokumentasjonen på nettstedet vårt. Nettstedet vårt tilbyr også Apifox-test for enkelhets skyld. Erstatt <YOUR_API_KEY> med din faktiske CometAPI-nøkkel fra kontoen din. base url er Gemini Generating Content og Chat
Sett inn spørsmålet eller forespørselen din i content-feltet — det er dette modellen vil svare på. Behandle API-responsen for å hente det genererte svaret.
Trinn 3: Hent og verifiser resultater
Behandle API-responsen for å få det genererte svaret. Etter behandling svarer API-et med oppgavestatus og utdata.