Google har netop indledt Gemini 3-æraen ved at frigive Gemini 3 Pro i preview, og de første signaler er entydige: dette er et stort skridt fremad inden for multimodal ræsonnement, kodningsagenter og lang-kontekstforståelse. Modellen positioneres som Googles hidtil mest kapable ræsonnements- og multimodale model, optimeret til agentiske workflows, kodning, langkontekstopgaver og multimodal forståelse. Den leveres med en ny “Deep Think”-ræsonneringstilstand, har markante forbedringer på agentiske/kode-benchmarks (Terminal-Bench 2.0 citeret til 54,2 %), og er straks anvendelig via Google AI Studio, API (Vertex AI-integrationer) og udviklerværktøjer som Google Antigravity.
What is Gemini 3 Pro Preview?
Gemini 3 præsenteres af Google som næste generation og det mest intelligente medlem af Gemini-familien — med fokus på dybere ræsonnement, rigere multimodal forståelse (tekst, billeder, video, lyd, kode) og bedre agentisk adfærd (modeller der planlægger og handler med værktøjer).
Headline features
- Native multimodal understanding — bygget til at acceptere og ræsonnere over tekst, billeder, lyd og video sammen (inklusive lange/video-input). Fremragende til at blande dokumenter, screenshots, transkripter og video.
- Huge context window (up to ~1,000,000 tokens) — kan indlæse/bevare i kontekst ekstremt lange dokumenter, store kodebaser eller timers transkripter i én session. Dette er et kerneargument for dyb research, kodereview og syntese på tværs af flere dokumenter.
- Agentic / tool-use capability — designet til at drive autonome agenter, der kan kalde værktøjer, betjene terminaler, styre opgaveplaner og koordinere flertrins-workflows (brugt i Google Antigravity og andre IDE-integrationer). Dette gør den særligt stærk til kodning, orkestrering og flertrins-automatisering.
- Stronger reasoning & coding — Google positionerer Gemini 3 Pro som deres bedste “tænke”-model til komplekst ræsonnement, matematik og kodeopgaver (forbedrede benchmarks og terminal-/værktøjsperformance).
What’s new in Gemini 3 Pro compared with Gemini 2.5 Pro and others?
Which capabilities improved the most?
Gemini 3 Pro markedsføres som et stort skridt fremad i ræsonnement (matematisk og videnskabeligt), multimodalt rumligt/visuelt ræsonnement og værktøjsbrug. Google fremhæver klare gevinster over Gemini 2.5 Pro i benchmark-suiter og i virkelige agentiske opgaver såsom kodning og terminal-automatisering. Eksempler på nøglemetrikker, som teamet har offentliggjort, inkluderer:
| Benchmark / task | Gemini 3 Pro (reported) | Gemini 2.5 Pro (reported) | Absolute gap (pp) |
|---|---|---|---|
| Humanity’s Last Exam (akademisk ræsonnement, uden værktøjer) | 37.5% | 21.6% | +15.9. |
| GPQA Diamond (videnskabelig / faktuel QA) | 91.9% | 86.4% | +5.5. |
| AIME 2025 (matematik, uden værktøjer) | 95.0% | 88.0% | +7.0. |
| AIME med kodeeksekvering | 100.0% | (2.5 Pro: — ) | — (3 Pro opnår perfekt score med eksekvering). |
| ARC-AGI-2 (visuelle ræsonnements-gåder) | 31.1% | 4.9% | +26.2 — meget stor multimodal forbedring. |
| SimpleQA Verified (parametrisk viden) | 72.1% | 54.5% | +17.6. |
Disse tal indikerer, at Gemini 3 Pro er optimeret til multitrins-ræsonnement, kompleks værktøjsbrug og stramt integrerede multimodale opgaver (fx kombination af videoframes, diagramræsonnement og kodegenerering).
Agentic-first developer tooling: Antigravity
For at demonstrere agentiske workflows udgav Google Antigravity — et “agent-first” IDE, der bruger Gemini 3 Pro som fundament for multi-agent kodningsworkflows. Antigravity gør det muligt for agenter at interagere direkte med en editor, terminal og browser, og at producere “Artifacts” (opgavelister, screenshots, browseroptagelser), der dokumenterer agentens handlinger — hvilket adresserer sporbarhed og reproducerbarhed i agentisk udvikling. Dette gør Gemini 3 Pro langt mere praktisk til rigtige udviklerworkflows end modeller, der kun fokuserer på tekstgenerering.
Better tool use and coding
Google rapporterer markante forbedringer på et terminal-centreret benchmark (Terminal-Bench 2.0), der måler en modells evne til at betjene en computer via terminalen: Gemini 3 Pro scorer 54.2% i den test — et stort hop i forhold til tidligere Gemini-versioner — hvilket indikerer reel fremgang i autonom værktøjsbrug og kodegenerering.

ly when asked to run scripts, orchestrate tools, or manage multi-step developer tasks. I praksis betyder det færre hallucinationer, når modellen eksekverer kommandoer, bedre fejlhåndtering og forbedret evne til at komme sig efter mislykkede trin.
How does Gemini 3 Pro perform on benchmarks
Google publicerede en bred suite af benchmark-sammenligninger i Gemini 3-blogindlægget, der spænder over klassisk NLP-ræsonnement, multimodal forståelse, kodegenerering og agentisk værktøjsbrug. Centrale tal, rapporteret direkte af Google, inkluderer:
- LMArena: Gemini 3 Pro scorede 1501 Elo, en topplacering på den konkurrencedygtige rangliste (måler generelt ræsonnement/svar-kvalitet i parvise sammenligninger).
- MMMU-Pro (multimodal benchmark): 81% — en betydelig stigning vs. tidligere modeller.
- Video-MMMU: 87.6% på video-bevidste multimodale opgaver.
- SimpleQA Verified: 72.1%, hvilket indikerer forbedringer i faktuel QA for komplekse input.
- WebDev Arena: 1487 Elo (webudvikling / koderæsonnement).
- Terminal-Bench 2.0 & SWE-bench Verified: store spring i agentisk værktøjsbrug og performance for kodningsagenter.
- Deep Think: yderligere løft på de sværeste tests (fx forbedrede Humanity’s Last Exam fra 37.5% til 41.0% i Deep Think på nogle metrikker som rapporteret).

Alt dette indikerer en model tunet til dybde snarere end blot overfladisk tekstgenerering.
Så: ja, Gemini 3 Pro ligger konsekvent i den øverste liga på mange tests i dag — men om den “knuser” afhænger af opgaven. Til ren kodegenerering er nogle konkurrenter fortsat tæt på; til lang kontekst, matematik og multimodal syntese rapporteres Gemini 3 Pro ofte som best-in-class i tidlige November/November 2025-kørsler.
How can you access Gemini 3 Pro Preview?
Official entry points
Google gjorde Gemini 3 Pro tilgængelig i preview på flere flader:
- Gemini app (forbrugere / Pro-brugere): Modellen rulles ud i Gemini-appen som en del af lanceringen af “Gemini 3”-æraen.
- Google AI Studio / Gemini Developer API: Udviklere kan eksperimentere via AI Studio og Gemini Developer API. API’et har REST- og SDK-grænseflader og understøtter avancerede funktioner såsom function calling og streaming.
- Vertex AI (Google Cloud): Virksomheder og teams kan få adgang til Gemini 3 Pro via Vertex AI til produktion og MLOps-workflows. Vertex understøtter eksempler i Python, Node, Java, Go og curl.
- Third-party integrations (CometAPI): CometAPI giver adgang til Gemini 3 Pro API, hvor kaldenavnet er gemini-3-pro-preview. CometAPI tilbyder en pris langt under den officielle pris for at hjælpe dig med integrationen.
Quickstart: Python example (official SDK pattern)
Nedenfor er et minimalt, praktisk Python-eksempel tilpasset fra Googles Gemini-quickstart, der demonstrerer kald til Gemini API via Googles GenAI-klient. Erstat GEMINI_API_KEY med din API-nøgle, som du har fået fra Google AI Studio eller dit GCP-projekt.
# Example: call Gemini 3 Pro Preview using Google GenAI Python SDK
# Requires: pip install google-generativeai
import os
from google import genai
# Set API key in environment:
# export GEMINI_API_KEY="YOUR_API_KEY"
client = genai.Client() # client picks up GEMINI_API_KEY from env
# Use the preview model identifier. The exact model ID may vary; use the ID listed in the API docs.
model_id = "gemini-3-pro-preview" # or "gemini-3-pro" depending on availability
prompt = """
You are an assistant that writes a short Python function to fetch JSON from a URL,
handle HTTP errors, and return parsed JSON or None on failure.
"""
resp = client.models.generate_content(model=model_id, contents=prompt)
print("MODEL RESPONSE:\n", resp.text)
Hvis du vælger CometAPI, så erstat url med https://api.cometapi.com/v1/chat/completions og key med den nøgle, du har fået fra CometAPI.
How to get the best results — prompt patterns and tips
Use “thinking” mode for hard problems
Hvis du løser progressive ræsonnements- eller komplekse matematik-/kodeopgaver, så aktiver preview’ets “thinking”-variant (hvis tilgængelig) — den allokerer flere interne ræsonneringstrin og giver ofte mere pålidelige løsninger på flertrinsopgaver. Tjek modelnavne for et -thinking-suffiks i konsollen.
Function calling & tool orchestration
Brug deklarerede funktioner (Vertex AI/GenAI function calling) til pålidelige, strukturerede outputs og for at reducere hallucinationer. Lad modellen foreslå funktionskald og eksekvér dem deterministisk i dit miljø. Dokumentationen for function calling inkluderer eksempler på returnering af typede JSON-argumenter, som du kan køre sikkert.
Grounding when you need up-to-date facts
Hvis din app er afhængig af aktuelle webfakta, så brug web grounding, men hold øje med omkostninger og rate limits for grounded prompts. Grounding er stærkt — det lader Gemini forespørge Search eller Maps — men hver grounded prompt kan ændre din fakturering og latenskarakteristik.
How Gemini 3 Pro stacks up in real-world tasks (use cases)
Code generation & developer productivity
Gemini 3 Pro forbedrer multi-fil-ræsonnement, lang repo-kontekst og syntese af tests/dokumentation sammen med kode. Kombineret med function calling og en terminalagent kan den skitsere og validere mellemstore projekter hurtigere end ældre modeller. Community-tests viser forhøjede LiveCodeBench/Elo-kodescorer.
Research & STEM workflows
Modellens Deep Think-kapabilitet og større ræsonneringsbudget gør den velegnet til forskningsopgaver, der kræver multitrins matematiske udledninger, datasætsyntese eller sammenfatning af flere filer i en afhandling. Tidlige benchmarkresultater placerer den i toppen eller tæt på toppen for mange STEM-datasæt.
Content design, multimodal creative workflows
Gemini 3 Pros multimodale outputs og integration med Veo/Whisk/Flow gør den til et stærkt valg til workflows, der blander tekst, billeder og video — fra marketing-storyboards til automatiserede videokladder. Google bundler visse creator-værktøjer i AI Ultra for creators, der ønsker de højeste grænser.
Conclusion: does Gemini 3 Pro crush other models?
Gemini 3 Pro Preview er et stort skridt fremad. På en bred vifte af benchmarks og i tidlige tests i virkeligheden fører eller matcher den ofte de bedste tilgængelige modeller i slutningen af 2025, især inden for:
- Komplekst ræsonnement (matematik / STEM)
- Multimodal forståelse og syntese
- Agentiske workflows og function calling
Marginen varierer dog efter opgave. Til nogle snævert definerede opgaver (visse kreative skrivestile eller meget specialiseret domæneviden) kan andre konkurrerende modeller stadig være konkurrencedygtige eller foretrukne afhængigt af pris/latens og økosystem. Benchmarks og lækkede scorer antyder, at Gemini 3 Pro ofte rangerer i topklassen, men “knuser” er opgaveafhængigt — for mange enterprise- og udviklerbrugssager er Gemini 3 Pro nu den første model at evaluere.
How to get started with CometAPI
CometAPI er en samlet API-platform, der aggregerer over 500 AI-modeller fra førende udbydere — såsom OpenAI’s GPT-serie, Google’s Gemini, Anthropic’s Claude, Midjourney, Suno og flere — i en enkelt, udviklervenlig grænseflade. Ved at tilbyde konsistent autentificering, forespørgselsformat og håndtering af svar forenkler CometAPI integrationen af AI-kapabiliteter markant i dine applikationer. Uanset om du bygger chatbots, billedgeneratorer, musikkomponister eller datadrevne analysepipelines, lader CometAPI dig iterere hurtigere, kontrollere omkostninger og forblive leverandøruafhængig — samtidig med at du udnytter de nyeste gennembrud på tværs af AI-økosystemet.
Udviklere kan få adgang til Gemini 3 Pro Preview API gennem CometAPI. For at komme i gang kan du udforske modelkapabiliteterne for CometAPI i Playground og konsultere API-guiden for detaljerede instruktioner. Før adgang, sørg venligst for, at du er logget ind på CometAPI og har fået din API-nøgle. CometAPI tilbyder en pris langt under den officielle pris for at hjælpe dig med integrationen.
Klar til at komme i gang?→ Tilmeld dig CometAPI i dag!
Hvis du vil have flere tips, guider og nyheder om AI, så følg os på VK, X og Discord!
