Gemini 3 Pro (Preview) er Google/DeepMinds nyeste flagskibsmodel for multimodal ræsonnering i Gemini 3-familien. Den er positioneret som deres “mest intelligente model til dato”, designet til dyb ræsonnering, agentiske workflows, avanceret kodning og multimodal forståelse med lang kontekst (tekst, billeder, lyd, video, kode og værktøjsintegrationer).
Nøglefunktioner
- Modaliteter: Tekst, billede, video, lyd, PDF'er (og strukturerede værktøjsoutput).
- Agentisk/værktøjer: Indbygget funktionskald, søgning som værktøj, kodekørsel, URL-kontekst og understøttelse af orkestrering af flertrinsagenter. Thought-signature-mekanismen bevarer flertrinsræsonnering på tværs af kald.
- Kodning og “vibe coding”: Optimeret til front-end-generering, generering af interaktive brugergrænseflader og agentisk kodning (den topper relevante ranglister rapporteret af Google). Den markedsføres som deres stærkeste “vibe-coding”-model til dato.
- Nye udviklerkontroller:
thinking_level(low|high) for at afveje omkostning/forsinkelse mod ræsonneringsdybde, ogmedia_resolutionstyrer multimodal kvalitet pr. billede eller videobillede. Disse hjælper med at balancere ydeevne, forsinkelse og omkostninger.
Benchmark-ydeevne
- Gemini3Pro opnåede førstepladsen i LMARE med en score på 1501 og overgik Grok-4.1-thinking med 1484 point samt lå også foran Claude Sonnet 4.5 og Opus 4.1.
- Den opnåede også førstepladsen i WebDevArena-programmeringsarenaen med en score på 1487.
- I Humanity’s Last Exam akademisk ræsonnering opnåede den 37,5 % (uden værktøjer); i GPQA Diamond science 91,9 %; og i MathArena Apex matematik-konkurrencen 23,4 %, hvilket satte en ny rekord.
- I multimodale kapaciteter opnåede MMMU-Pro 81 %; og i Video-MMMU videoforståelse 87,6 %.
Tekniske detaljer og arkitektur
- Parameteren “Thinking level”: Gemini 3 eksponerer en
thinking_level-kontrol, som lader udviklere afveje dybden af intern ræsonnering mod forsinkelse/omkostning. Modellen behandlerthinking_levelsom en relativ tilladelse til intern flertrinsræsonnering snarere end en streng garanti for tokens. Standard er typiskhighfor Pro. Dette er en eksplicit ny kontrol for udviklere til at justere flertrinsplanlægning og dybden af chain-of-thought. - Strukturerede output og værktøjer: Modellen understøtter strukturerede JSON-output og kan kombineres med indbyggede værktøjer (Google Search grounding, URL-kontekst, kodekørsel osv.). Nogle funktioner for struktureret output + værktøjer er kun preview for
gemini-3-pro-preview. - Multimodale og agentiske integrationer: Gemini 3 Pro er eksplicit bygget til agentiske workflows (værktøjer + flere agenter over kode/terminaler/browser).
Begrænsninger og kendte forbehold
- Ikke perfekt faktuel nøjagtighed — hallucinationer er stadig mulige. På trods af stærke forbedringer i faktuel nøjagtighed, som Google hævder, er grounded verifikation og menneskelig gennemgang stadig nødvendige i højrisikosammenhænge (jura, medicin, finans).
- Ydeevne ved lang kontekst varierer efter opgave. Understøttelse af et inputvindue på 1M er en hård kapacitet, men den empiriske effektivitet kan falde på nogle benchmarks ved ekstreme længder (observerede punktvise fald ved 1M i nogle langkonteksttests).
- Afvejninger mellem omkostning og forsinkelse. Store kontekster og højere
thinking_level-indstillinger øger beregning, forsinkelse og omkostninger; prisniveauer gælder baseret på tokenmængder. Brugthinking_levelog chunking-strategier til at styre omkostninger. - Sikkerhed og indholdsfiltre. Google fortsætter med at anvende sikkerhedspolitikker og moderationslag; bestemt indhold og visse handlinger er fortsat begrænset eller vil udløse afvisningstilstande.
Hvordan Gemini 3 Pro Preview sammenlignes med andre topmodeller
Sammenligning på højt niveau (preview → kvalitativ):
Sammenlignet med Gemini 2.5 Pro: Markante forbedringer i ræsonnering, agentisk værktøjsbrug og multimodal integration; meget større konteksthåndtering og bedre forståelse af lange formater. DeepMind viser konsistente forbedringer på tværs af akademisk ræsonnering, kodning og multimodale opgaver.
Sammenlignet med GPT-5.1 og Claude Sonnet 4.5 (som rapporteret): På Google/DeepMinds benchmark-portefølje præsenteres Gemini 3 Pro som førende på flere agentiske, multimodale og langkontekst-målinger (se Terminal-Bench, MMMU-Pro, AIME). Sammenlignende resultater varierer efter opgave.
Typiske og værdifulde anvendelsestilfælde
- Opsummering og Q&A af store dokumenter / bøger: Understøttelse af lang kontekst gør den attraktiv for juridiske, forsknings- og compliance-teams.
- Kodeforståelse og -generering i repo-skala: Integration med kodningsværktøjskæder og forbedret ræsonnering hjælper ved refaktorering af store kodebaser og automatiserede workflows til kodereview.
- Multimodale produktassistenter: Billede + tekst + lyd-workflows (kundesupport, der indlæser skærmbilleder, opkaldsudsnit og dokumenter).
- Mediegenerering og -redigering (foto → video): Tidligere funktioner i Gemini-familien inkluderer nu Veo / Flow-lignende foto→video-funktioner; preview antyder dybere multimediegenerering til prototyper og medie-workflows.
Sådan får du adgang til Gemini 3 Pro API
Trin 1: Tilmeld dig for at få en API-nøgle
Log ind på cometapi.com. Hvis du endnu ikke er bruger hos os, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent API-nøglen til adgangsoplysningerne for grænsefladen. Klik på “Add Token” under API-token i det personlige center, hent token-nøglen: sk-xxxxx, og indsend den.
Trin 2: Send anmodninger til Gemini 3 Pro API
Vælg endpointet “gemini-3-pro” for at sende API-anmodningen, og angiv request body. Request method og request body fås fra vores API-dokumentation på websitet. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. Base URL er Gemini Generating Content og Chat
Indsæt dit spørgsmål eller din forespørgsel i content-feltet—det er dette, modellen vil svare på. Behandl API-svaret for at få det genererede svar.
Trin 3: Hent og verificer resultater
Behandl API-svaret for at få det genererede svar. Efter behandlingen svarer API'et med opgavestatus og outputdata.