Gemini 3 Pro (Preview) er Google/DeepMinds nyeste flagskibsmodel for multimodal ræsonnering i Gemini 3-familien. Den positioneres som deres “hidtil mest intelligente model”, designet til dyb ræsonnering, agentbaserede workflows, avanceret kodning og multimodal forståelse med lange kontekster (tekst, billeder, lyd, video, kode og værktøjsintegrationer).
Nøglefunktioner
- Modaliteter: Tekst, billede, video, lyd, PDF'er (og strukturerede værktøjs-output).
- Agentik/værktøjer: Indbygget funktionskald, søgning som værktøj, kodeeksekvering, URL-kontekst og support til at orkestrere flertrinsagenter. Thought-signature-mekanismen bevarer flertrinsræsonnering på tværs af kald.
- Kodning og “vibe coding”: Optimeret til front-end-generering, interaktiv UI-generering og agentbaseret kodning (den topper relevante ranglister rapporteret af Google). Den markedsføres som deres stærkeste “vibe-coding”-model til dato.
- Nye udviklerkontroller:
thinking_level(low|high) til at afveje omkostning/latens mod ræsonneringsdybde, ogmedia_resolutionstyrer multimodal fidelitet pr. billede eller videoframe. Disse hjælper med at balancere ydeevne, latens og omkostninger.
Benchmarkresultater
- Gemini3Pro opnåede førsteplads i LMARE med en score på 1501, og overgik Grok-4.1-thinking’s 1484 point samt førte over Claude Sonnet 4.5 og Opus 4.1.
- Den opnåede også førsteplads i WebDevArena-programmeringsarenaen med en score på 1487.
- I Humanity’s Last Exam (akademisk ræsonnering) opnåede den 37.5% (uden værktøjer); i GPQA Diamond (science) 91.9%; og i MathArena Apex (matematik) 23.4% og satte ny rekord.
- For multimodale evner opnåede MMMU-Pro 81%; og i Video-MMMU-videoforståelse 87.6%.
Tekniske detaljer og arkitektur
- “Thinking level”-parameter: Gemini 3 eksponerer en
thinking_level-kontrol, der lader udviklere afveje dybden af intern flertrinsræsonnering mod latens/omkostning. Modellen betragterthinking_levelsom en relativ tilladelse til intern flertrinsræsonnering snarere end en streng token-garanti. Standard er typiskhighfor Pro. Dette er en eksplicit ny kontrol for udviklere til at justere flertrinsplanlægning og tankekæde-dybde. - Strukturerede outputs og værktøjer: Modellen understøtter strukturerede JSON-outputs og kan kombineres med indbyggede værktøjer (Google Search grounding, URL-kontekst, kodeeksekvering osv.). Nogle structured-output+tools-funktioner er kun i preview for
gemini-3-pro-preview. - Multimodale og agentbaserede integrationer: Gemini 3 Pro er eksplicit bygget til agentbaserede workflows (værktøjer + flere agenter over kode/terminaler/browser).
Begrænsninger og kendte forbehold
- Ikke perfekt faktuel nøjagtighed — hallucinationer er stadig mulige. På trods af stærke forbedringer ifølge Google er grundet verificering og menneskelig gennemgang stadig nødvendige i højrisiko-sammenhænge (juridisk, medicinsk, finansiel).
- Ydelse på lange kontekster varierer efter opgave. Understøttelse af et 1M inputvindue er en reel kapabilitet, men den empiriske effektivitet kan falde på nogle benchmarks ved ekstreme længder (observerede punktvise fald ved 1M på visse lang-kontekst-tests).
- Afvejninger mellem omkostning og latens. Store kontekster og højere
thinking_level-indstillinger øger beregningsforbrug, latens og omkostninger; prisniveauer gælder baseret på token-volumen. Brugthinking_levelog chunking-strategier til at styre omkostninger. - Sikkerhed og indholdsfiltre. Google anvender fortsat sikkerhedspolitikker og moderationslag; visse typer indhold og handlinger forbliver begrænsede eller vil udløse afvisningstilstande.
Hvordan Gemini 3 Pro Preview sammenlignes med andre topmodeller
Sammenligning på højt niveau (preview → kvalitativ):
Sammenlignet med Gemini 2.5 Pro: Springvise forbedringer i ræsonnering, agentisk værktøjsbrug og multimodal integration; langt større konteksthåndtering og bedre forståelse af lange tekster. DeepMind viser konsistente gevinster på tværs af akademisk ræsonnering, kodning og multimodale opgaver.
Sammenlignet med GPT-5.1 og Claude Sonnet 4.5 (som rapporteret): På Google/DeepMinds benchmarkpakke præsenteres Gemini 3 Pro som førende på flere agentiske, multimodale og lang-kontekst-metrics (se Terminal-Bench, MMMU-Pro, AIME). Sammenlignende resultater varierer efter opgave.
Typiske og højværdianvendelsesområder
- Opsummering af store dokumenter/bøger og Q&A: Lang kontekststøtte gør den attraktiv for juridiske, forsknings- og compliance-teams.
- Forståelse og generering af kode i repo-skala: Integration med kodningsværktøjskæder og forbedret ræsonnering hjælper store refaktoreringer af kodebaser og automatiserede code review-workflows.
- Multimodale produktassistenter: billede + tekst + lyd-workflows (kundesupport, der indtager skærmbilleder, lydklip og dokumenter).
- Mediegenerering og -redigering (foto → video): Tidligere Gemini-familiefunktioner omfatter nu Veo-/Flow-stil foto→video-kapaciteter; preview antyder dybere multimediegenerering til prototyper og medie-workflows.
Sådan får du adgang til Gemini 3 Pro API
Trin 1: Få en API-nøgle
Log ind på cometapi.com. Hvis du endnu ikke er vores bruger, skal du først registrere dig. Log ind på din CometAPI console. Hent grænsefladens adgangslegitimations-API-nøgle. Klik “Add Token” ved API token i Personal Center, få token-nøglen: sk-xxxxx og indsend.
Trin 2: Send forespørgsler til Gemini 3 Pro API
Vælg “gemini-3-pro”-endpointet for at sende API-forespørgslen og angiv request body. Request-metode og request body fås fra vores websteds API-dokumentation. Vores websted tilbyder også Apifox-test for nemheds skyld. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. Basis-URL er Gemini Generating Content og Chat
Indsæt dit spørgsmål eller din anmodning i content-feltet—det er det, modellen vil svare på. Behandl API-svaret for at få det genererede svar.
Trin 3: Hent og verificer resultater
Behandl API-svaret for at få det genererede svar. Efter behandling svarer API'et med opgavestatus og outputdata.