Google har nettopp innledet Gemini 3-æraen ved å lansere Gemini 3 Pro i forhåndsvisning, og de første signalene er entydige: dette er et stort steg fremover innen multimodalt resonnement, kodingsagenter og forståelse av lange kontekster. Modellen posisjoneres som Googles mest kapable resonnement- og multimodale modell til nå, optimalisert for agentbaserte arbeidsflyter, koding, oppgaver med lang kontekst og multimodal forståelse. Den leveres med en ny “Deep Think”-modus for resonnement, har dramatiske forbedringer på agent-/kodebenchmarker (Terminal-Bench 2.0 oppgitt til 54.2%), og kan tas i bruk umiddelbart via Google AI Studio, API (Vertex AI-integrasjoner) og utviklerverktøy som Google Antigravity.
What is Gemini 3 Pro Preview?
Gemini 3 presenteres av Google som neste generasjons, mest intelligente medlem av Gemini-familien — fokusert på dypere resonnement, rikere multimodal forståelse (tekst, bilder, video, lyd, kode) og bedre agentisk atferd (modeller som planlegger og handler med verktøy).
Headline features
- Native multimodal understanding — bygget for å ta imot og resonnere over tekst, bilder, lyd og video sammen (inkludert lange/video-inndata). Suverent for å mikse dokumenter, skjermbilder, transkripsjoner og video.
- Huge context window (up to ~1,000,000 tokens) — kan ta inn/holde i kontekst ekstremt lange dokumenter, store kodebaser eller timer med transkripsjoner i én økt. Dette er et kjernefortrinn for dyp forskning, kodereview og syntese på tvers av dokumenter.
- Agentic / tool-use capability — designet for å drive autonome agenter som kan kalle verktøy, operere terminaler, styre oppgaveplaner og koordinere flertrinns arbeidsflyter (brukt i Google Antigravity og andre IDE-integrasjoner). Dette gjør den spesielt sterk for koding, orkestrering og flertrinnsautomatisering.
- Stronger reasoning & coding — Google posisjonerer Gemini 3 Pro som deres beste “tenkende” modell for komplekst resonnement, matematikk og kodeoppgaver (forbedrede benchmarker og terminal-/verktøyprestasjon).
What’s new in Gemini 3 Pro compared with Gemini 2.5 Pro and others?
Which capabilities improved the most?
Gemini 3 Pro markedsføres som et stort steg fremover i resonnement (matematisk og vitenskapelig resonnement), multimodalt romlig/visuelt resonnement og verktøybruk. Google fremhever klare gevinster over Gemini 2.5 Pro i benchmarksuiter og i reelle agentiske oppgaver som koding og terminalautomatisering. Eksempel på nøkkeltall teamet har publisert:
| Benchmark / task | Gemini 3 Pro (reported) | Gemini 2.5 Pro (reported) | Absolute gap (pp) |
|---|---|---|---|
| Humanity’s Last Exam (academic reasoning, no tools) | 37.5% | 21.6% | +15.9. |
| GPQA Diamond (scientific / factual QA) | 91.9% | 86.4% | +5.5. |
| AIME 2025 (mathematics, no tools) | 95.0% | 88.0% | +7.0. |
| AIME with code execution | 100.0% | (2.5 Pro: — ) | — (3 Pro hits perfect score with execution). |
| ARC-AGI-2 (visual reasoning puzzles) | 31.1% | 4.9% | +26.2 — very large multimodal gain. |
| SimpleQA Verified (parametric knowledge) | 72.1% | 54.5% | +17.6. |
Disse tallene signaliserer at Gemini 3 Pro er optimalisert for flerstegsresonnement, kompleks verktøybruk og tett integrerte multimodale oppgaver (f.eks. å kombinere videorammer, diagramresonnement og kodegenerering).
Agentic-first developer tooling: Antigravity
For å demonstrere agentiske arbeidsflyter lanserte Google Antigravity — en “agent-first” IDE som bruker Gemini 3 Pro som grunnlag for fleragents kodingsarbeidsflyter. Antigravity lar agenter samhandle direkte med en editor, terminal og nettleser, og produsere “Artifacts” (oppgavelister, skjermbilder, nettleserlogger) som dokumenterer agenthandlinger — noe som adresserer sporbarhet og reproduserbarhet i agentisk utvikling. Dette gjør Gemini 3 Pro langt mer praktisk for faktiske utviklerarbeidsflyter enn modeller som kun fokuserer på tekstgenerering.
Better tool use and coding
Google rapporterer dramatiske forbedringer på en terminal-sentrert benchmark (Terminal-Bench 2.0) som måler en modells evne til å operere en datamaskin via terminalen: Gemini 3 Pro scorer 54.2% på den testen — et stort hopp sammenlignet med tidligere Gemini-versjoner — noe som tyder på reell fremgang i autonom verktøybruk og kodegenerering.

...særlig når den bes om å kjøre skript, orkestrere verktøy eller håndtere flertrinns utvikleroppgaver. I praksis betyr det færre hallusinasjoner når modellen kjører kommandoer, bedre feilhåndtering, og forbedret evne til å hente seg inn etter feilsteg.
How does Gemini 3 Pro perform on benchmarks
Google publiserte en bred suite av benchmark-sammenligninger i Gemini 3-blogginnlegget som spenner over klassisk NLP-resonnement, multimodal forståelse, kodegenerering og agentisk verktøybruk. Nøkkeltall rapportert direkte av Google inkluderer:
- LMArena: Gemini 3 Pro fikk 1501 Elo, en topp-plassering på den konkurransedrevne topplisten (måler generell resonnement-/svarkvalitet i parvise sammenligninger).
- MMMU-Pro (multimodal benchmark): 81% — en betydelig økning vs. tidligere modeller.
- Video-MMMU: 87.6% på video-bevisste multimodale oppgaver.
- SimpleQA Verified: 72.1% som indikerer forbedringer i faktuell QA for komplekse inndata.
- WebDev Arena: 1487 Elo (webutvikling / koderesonnement).
- Terminal-Bench 2.0 & SWE-bench Verified: store hopp i agentisk verktøybruk og ytelse for kodeagenter.
- Deep Think: ytterligere løft på de vanskeligste testene (f.eks. økte Humanity’s Last Exam fra 37.5% til 41.0% i Deep Think på enkelte mål, som rapportert).

Alt dette indikerer en modell tunet for dybde heller enn bare overflatisk tekstgenerering.
Så: ja, Gemini 3 Pro er konsekvent i toppsjiktet på mange tester i dag — men “knuser” avhenger av oppgaven. For ren kodegenerering ligger noen konkurrenter fortsatt jevnt; for lang kontekst, matematikk og multimodal syntese er Gemini 3 Pro ofte rapportert som best i klassen i tidlige kjøringer i november/november 2025.
How can you access Gemini 3 Pro Preview?
Official entry points
Google gjorde Gemini 3 Pro tilgjengelig i forhåndsvisning på flere flater:
- Gemini app (consumer / Pro users): Modellen rulles ut i Gemini-appen som del av lanseringen av “Gemini 3”-æraen.
- Google AI Studio / Gemini Developer API: Utviklere kan eksperimentere via AI Studio og Gemini Developer API. API-et har REST- og SDK-grensesnitt og støtter avanserte funksjoner som funksjonskall og streaming.
- Vertex AI (Google Cloud): Bedrifter og team kan få tilgang til Gemini 3 Pro gjennom Vertex AI for produksjon og MLOps-arbeidsflyter. Vertex støtter eksempler i Python, Node, Java, Go og curl.
- Third-party integrations (CometAPI): CometAPI gir tilgang til Gemini 3 Pro API, med kallnavnet gemini-3-pro-preview. CometAPI tilbyr en pris langt under den offisielle prisen for å hjelpe deg å integrere.
Quickstart: Python example (official SDK pattern)
Nedenfor er et minimalt, praktisk Python-eksempel tilpasset fra Googles Gemini quickstart som demonstrerer kall til Gemini API via Googles GenAI-klient. Erstatt GEMINI_API_KEY med din API-nøkkel hentet fra Google AI Studio eller GCP-prosjektet ditt.
# Example: call Gemini 3 Pro Preview using Google GenAI Python SDK
# Requires: pip install google-generativeai
import os
from google import genai
# Set API key in environment:
# export GEMINI_API_KEY="YOUR_API_KEY"
client = genai.Client() # client picks up GEMINI_API_KEY from env
# Use the preview model identifier. The exact model ID may vary; use the ID listed in the API docs.
model_id = "gemini-3-pro-preview" # or "gemini-3-pro" depending on availability
prompt = """
You are an assistant that writes a short Python function to fetch JSON from a URL,
handle HTTP errors, and return parsed JSON or None on failure.
"""
resp = client.models.generate_content(model=model_id, contents=prompt)
print("MODEL RESPONSE:\n", resp.text)
Hvis du velger CometAPI, erstatt url med https://api.cometapi.com/v1/chat/completions og key med nøkkelen du fikk fra CometAPI.
How to get the best results — prompt patterns and tips
Use “thinking” mode for hard problems
Hvis du løser progressive resonnementer eller komplekse matte-/kodeoppgaver, aktiver forhåndsvisningens “thinking”-variant (hvis tilgjengelig) — den allokerer flere interne resonnementstrinn og gir ofte mer pålitelige løsninger på flertrinnsoppgaver. Sjekk modellnavn for et -thinking-suffiks i konsollen.
Function calling & tool orchestration
Bruk deklarerte funksjoner (Vertex AI/GenAI function calling) for pålitelige, strukturerte utdata og for å redusere hallusinasjoner. La modellen foreslå funksjonskall og kjør dem deterministisk i miljøet ditt. Dokumentasjonen for funksjonskall inkluderer eksempler for å returnere typede JSON-argumenter som du kan kjøre sikkert.
Grounding when you need up-to-date facts
Hvis appen din er avhengig av oppdaterte web-fakta, bruk web grounding, men følg med på kostnader og raterestriksjoner for grounded prompts. Grounding er kraftig — det lar Gemini gjøre oppslag i Search eller Maps — men hver grounded prompt kan påvirke fakturering og latens.
How Gemini 3 Pro stacks up in real-world tasks (use cases)
Code generation & developer productivity
Gemini 3 Pro forbedrer flerdokumentresonnement, lang repo-kontekst og samproduksjon av tester/dokumentasjon sammen med kode. Sammen med funksjonskall og en terminalagent kan den sette opp og validere mellomstore prosjekter raskere enn eldre modeller. Fellestester viser økte LiveCodeBench-/Elo-kodeskårer.
Research & STEM workflows
Modellens Deep Think-kapasitet og større resonnementbudsjett gjør den godt egnet for forskning som krever flerstegs matematiske utledninger, datasett-syntese eller oppsummering på tvers av flere filer. Tidlige benchmarkresultater plasserer den på eller nær toppen for mange STEM-datasett.
Content design, multimodal creative workflows
Gemini 3 Pro sine multimodale utdata og integrasjon med Veo/Whisk/Flow gjør den til et sterkt valg for arbeidsflyter som blander tekst, bilder og video — fra markedsføringsstoryboards til automatiserte videoutkast. Google pakker visse kreatørverktøy i AI Ultra for skapere som ønsker de høyeste grensene.
Conclusion: does Gemini 3 Pro crush other models?
Gemini 3 Pro Preview er et stort steg fremover. På et bredt spekter av benchmarker og i tidlig praktisk testing leder eller matcher den ofte de beste tilgjengelige modellene sent i 2025, særlig innen:
- Komplekst resonnement (matte / STEM)
- Multimodal forståelse og syntese
- Agentiske arbeidsflyter og funksjonskall
Marginen varierer imidlertid med oppgaven. For noen snevrere oppgaver (visse kreative skrivestiler eller svært spesialisert domenekunnskap) kan andre modeller fortsatt være konkurransedyktige eller foretrukne avhengig av kost/latens og økosystemtilpasning. Benchmarker og lekkede skårer antyder at Gemini 3 Pro ofte rangerer i toppsjiktet, men “knusing” er oppgaveavhengig — for mange bedrifts- og utviklerbrukstilfeller er Gemini 3 Pro nå den første modellen å evaluere.
How to get started with CometAPI
CometAPI er en samlet API-plattform som samler over 500 AI-modeller fra ledende leverandører — som OpenAIs GPT-serie, Googles Gemini, Anthropics Claude, Midjourney, Suno og flere — i ett, utviklervennlig grensesnitt. Ved å tilby konsistent autentisering, forespørselsformat og responsbehandling, forenkler CometAPI integrasjonen av AI-kapasiteter dramatisk i applikasjonene dine. Enten du bygger chatboter, bildegeneratorer, musikkkomponister eller datadrevne analysepipelines, lar CometAPI deg iterere raskere, kontrollere kostnader og være leverandøruavhengig — samtidig som du utnytter de siste gjennombruddene i AI-økosystemet.
Utviklere kan få tilgang til Gemini 3 Pro Preview API gjennom CometAPI. For å begynne, utforsk modellkapabilitetene tilCometAPI i Playground og se API-guiden for detaljerte instruksjoner. Før tilgang, sørg for at du har logget inn på CometAPI og innhentet API-nøkkelen.CometAPI tilbyr en pris langt lavere enn den offisielle prisen for å hjelpe deg å integrere.
Klar til å starte?→ Registrer deg for CometAPI i dag !
Hvis du vil ha flere tips, guider og nyheter om AI, følg oss på VK, X og Discord!
