Både Gemini 3 Pro (Google/DeepMind) og Claude Sonnet 4.5 (Anthropic) er flaggskipsmodeller fra 2025-æraen, optimalisert for agentiske arbeidsflyter med lang horisont og verktøybruk — og begge legger stor vekt på koding. De påståtte styrkene divergerer: Google presenterer Gemini 3 Pro som en allmenn, multimodal resonneringsmodell som også briljerer i agentisk koding, mens Anthropic posisjonerer Sonnet 4.5 som verdens beste koding/agent-modell, med spesielt sterk suksess i redigering/verktøy og langvarige agenter.
Kort svar først: begge modellene er i toppsjiktet for programvareingeniør-oppgaver sent i 2025. Claude Sonnet 4.5 ligger litt foran på noen rene programvareingeniør-benchmarks, mens Googles Gemini 3 Pro (Preview) er den bredere, multimodale, agentiske kraftpakken — spesielt når visuell kontekst, verktøybruk, lang kontekst og dype agent-arbeidsflyter er viktige.
Jeg bruker begge modellene, og de har ulike fordeler i utviklingsmiljøet. Jeg vil nå sammenligne dem i denne artikkelen.
Gemini 3 Pro er kun tilgjengelig for Google AI Ultra-abonnenter og betalende Gemini API-brukere. Den gode nyheten er at CometAPI, som en alt-i-ett AI-plattform, har integrert Gemini 3 Pro, og du kan prøve den gratis.
Hva er Gemini 3 Pro Preview og hva er hovedfunksjonene?
Oversikt
Gemini 3 Pro (tilgjengelig initialt som gemini-3-pro-preview) er Google/DeepMinds nyeste “frontier”-LLM i Gemini 3-familien. Den er posisjonert som en høyt-resonnerende, multimodal modell optimalisert for agentiske arbeidsflyter (altså modeller som kan bruke verktøy, orkestrere underagenter og samhandle med eksterne ressurser). Den fremhever sterkere resonnement, multimodalitet (bilder, videorammer, PDF-er) og eksplisitte API-kontroller for intern “tenking”-dybde.
Viktige funksjoner (rettet mot utviklere)
- Agentisk verktøybruk: innebygd funksjonskalling og verktøy (kodekjøring, nettforankring, fil- og URL-kontekst, terminal-/verktøybruk).
- Tenking / Chain-of-Thought-støtte: “tenking”-primitiver for flertrinns planlegging og interne tankesignaturer som gjør flertrinns resonnement mer eksplisitt.
- Multimodal inndata/utdata: tekst, bilder, lyd, video og strukturerte utdata med håndtering av lang kontekst.
- Verktøy for kodekjøring og IDE-integrasjoner: et hostet verktøy for kodekjøring og integrasjoner i IDE-er samt den nye agentiske IDE-en Google Antigravity for samarbeidende autonom koding. Antigravity er for øyeblikket i offentlig forhåndsvisning.
- Kontroller for høy/utvidet tenking (parameteren
thinking_level) slik at du kan bytte latenstid mot dypere intern resonnement.higher standard for Gemini 3 Pro. - Granulære multimodale kontroller (
media_resolution) for å justere bilde-/videokvalitet vs. kostnad — nyttig når du vil at modellen skal lese liten tekst i skjermbilder eller analysere rammer.
Hvor Gemini 3 Pro utmerker seg for koding
- Agentisk utvikling: orkestrering av flertrinnsoppgaver på tvers av editor/terminal/nettleser. Antigravitys artefaktsystem + Geminis verktøy gjør den utmerket for større funksjonsarbeid og automatisering.
- Visuelle + kodekombinasjoner: fikse UI-feil fra skjermbilder, generere UI-test-harnesses eller konvertere designbilder til kode på grunn av sterk bilde-til-kode-forståelse.
Hva er Claude Sonnet 4.5 og hva er hovedfunksjonene?
Claude Sonnet 4.5 er Anthropics 2025-utgivelse som Anthropic markedsfører som sin sterkeste modell for koding, agentiske arbeidsflyter og “bruk av datamaskiner” (kontroll av verktøy, nettlesere, terminaler, regneark osv.). Den fremhever forbedret redigeringskapasitet, verktøysuksess, utvidet tenking, langvarig agent-koherens (30+ timer med autonom oppgaveutførelse i demonstrasjoner) og lavere feilrater ved koderedigering sammenlignet med tidligere generasjoner. Anthropic omtaler Sonnet 4.5 som deres “beste kodemodell” med store forbedringer i redigeringspålitelighet og koherens for oppgaver med lang horisont.
Viktige funksjoner (rettet mot utviklere)
- Høy kodepresisjon på virkelige ingeniør-benchmarks: Anthropic rapporterer state-of-the-art SWE-bench Verified-score og hevder store forbedringer i redigeringsfeilrater og verktøybasert agent-suksess.
- Agentiske og databruksforbedringer: Sonnet 4.5 er konstruert for å kjøre flere verktøy (bash, filredigering, nettleserautomatisering) og for å orkestrere underagenter via Claude Agent SDK. Anthropic fremhever “30+ timer” sammenhengende flertrinnsarbeid i sine interne evalueringer.
- Store kontekstvinduer: standard 200k tokens for de fleste kunder, med 1M-token-kontekst tilgjengelig i beta for høyt-tier-organisasjoner (samme 1M-kapasitet som Gemini tilbyr i forhåndsvisning).
- Verktøy for kodekjøring og fil-API-er: innebygde og API-baserte verktøy tillater sikker kodekjøring, filoppretting/redigering og test-kjøringssløyfer.
Hvor Sonnet 4.5 utmerker seg for koding
- Rene programvareingeniør-benchmarks og strukturerte kodeoppgaver (generering av enhetstester, refaktoriseringer på tvers av repositorier) der modellens algoritmiske strenghet og stabilitet over lang horisont er viktige.
- Kode-først-CLI-er og “kodeassistent”-flyter som Claude Code, der tettsittende terminalintegrasjon og repo-skanning leveres rett ut av boksen.
Rask sammenligningstabell
| Aspekt | Gemini 3 Pro (Preview) | Claude Sonnet 4.5 |
|---|---|---|
| Modell / lanseringsstatus | gemini-3-pro-preview — Google / DeepMind banebrytende modell (preview). Lansert nov 2025 (preview). | claude-sonnet-4-5 — Anthropics Sonnet-klasse banebrytende modell (GA / annonsert 29. september 2025). |
| Målposisjonering (koding og agenter) | Allmenn frontier-modell med vekt på resonnement + multimodalitet + agentiske arbeidsflyter; posisjonert som Googles beste modell for koding/agenter. | Spesialisert for koding, langtids agentarbeid og databruk (Anthropics “best for koding & komplekse agenter”). |
| Viktige utviklerfunksjoner | thinking_level-kontroll for dypere intern tenking; innebygde Google-verktøyintegrasjoner (Search-forankring, kodekjøring, fil/URL-kontekst); dedikert bildevariant for tekst+bildeflyter. | Agent-SDK-er, VS Code-integrasjon (Claude Code), fil- og kodekjøringsverktøy, forbedringer for langhorisont-agenter (eksplisitt testet for fler-timers kjøringer). Vekt på iterative rediger/kjør/test-flyter og checkpointing. |
| Kontekstvindu (inndata / utdata) | 1,000,000 tokens inndata / 64k tokens utdata for gemini-3-pro-preview | 1,000,000 tokens inndata / 64k tokens utdata |
| Prising (publisert basis) | $2 / $12 per 1M tokens (inndata / utdata) for <200k-området; høyere satser for >200k (viser $4 / $18 for >200k). | Anthropic publisert basis: $3 / $15 per 1M tokens (inndata / utdata) for Sonnet 4.5; |
| Multimodal kapasitet (visuell/video/lyd) | Full multimodal støtte: tekst, bilder, lyd, videorammer med konfigurerbare bilde-/videooppløsningsparametere; dedikert gemini-3-pro-image-preview. Sterk vekt på bilde-OCR/visuell ekstraksjon for koding av UI-er/skjermbilder. | Støtter visuelle (tekst+bilde) inndata og bruker visuell kontekst for å støtte kodearbeidsflyter; hovedvekten i Sonnet 4.5 er agentisk integrasjon (bruk av visuell kontekst i agent-flyter snarere enn bildegenereringsparitet). |
| Agentisk ytelse og utholdenhet over lang horisont | “Tenking”-primitiver for eksplisitt flertrinns intern resonnement; sterkt i matematikk/resonnement & multimodalt dypresonnement. God til å dekomponere komplekse algoritmiske oppgaver. Best for tungt enkelt-responsresonnement + multimodal analyse. | Anthropic fremhever langhorisont-agentkoherens — rapporterte interne tester der Sonnet 4.5 opprettholdt sammenhengende flertrinns verktøybruk i 30+ timer og forbedrer kontinuerlig agentstabilitet vs. tidligere modeller. Passer godt for vedvarende automatisering og CI-stil agent-arbeidsflyter. |
| Utdata-kvalitet for koding (redigeringer, tester, pålitelighet) | Svært sterkt enkeltresonnementsnivå + kodegenerering; innebygde verktøy for å kjøre kode via Googles verktøy; høye resultater på algoritmiske benchmarks ifølge leverandør. Praktisk fordel når arbeidsflyten blander visuelle spesifikasjoner + kode. | Designet for iterative rediger→kjør→test-sløyfer; Sonnet 4.5 fremhever forbedret “patching”-pålitelighet (rejection sampling / scoringsmetoder for robuste patches) og verktøy som støtter iterative utviklerflyter (checkpoints, tester). |
Hvordan sammenlignes arkitektur og kjernekapabiliteter?
Arkitektur og designintensjon (høyt nivå)
Gemini 3 Pro: presentert som en multimodal, allmenn grunnlagsmodell med eksplisitt engineering for “tenking” og verktøybruk: designet vektlegger dypt resonnement, video/lyd-forståelse og agentisk orkestrering via innebygd funksjonskalling og kodekjøringsmiljøer. Google rammer inn Gemini 3 Pro som den “mest intelligente” i familien, optimalisert for brede oppgaver utover kode (selv om agentisk koding er en prioritet).
Claude Sonnet 4.5: optimalisert spesifikt for agentiske arbeidsflyter og kode: Anthropic fremhever instruksjonsoppfølging, verktøypålitelighet, redigerings-/korrigeringsdyktighet og tilstandshåndtering over lang horisont. Ingeniørfokuset er å minimere destruktive eller hallusinerte redigeringer og å gjøre robuste virkelige datamaskininteraksjoner.
Konklusjon: Gemini 3 Pro presenteres som en topp generalist som er hardt trimmet for multimodalt resonnement og agentisk integrasjon; Sonnet 4.5 presenteres som en spesialist for koding og agentisk verktøybruk med forbedrede garantier for redigering/korrigering.
Verktøy og integrasjoner
- Gemini: innebygd Google-verktøysett inkl. Search-forankring, filsøk, kodekjøring og førsteklasses bilde-/videoparametere;
thinking_level-parameter for å kontrollere intern compute/latenstid-avveining. Dyp integrasjon i Google-infrastruktur gjør det praktisk for team allerede på Google Cloud. - Claude: robust agent-SDK og vekt på stabil langtids beregning (Sonnet rapportert 30+ timers koherens). Anthropic eksponerer også kodekjøring, fil-API-er og en ny “checkpoints”-redigeringsopplevelse i Claude Code og VS Code-utvidelse — funksjoner som materielt forbedrer iterative kodingarbeidsflyter.
Hva sier tekniske spesifikasjoner og benchmarks?

Benchmarks varierer litt avhengig av evaluator og konfigurasjon (enkeltforsøk vs. flere forsøk, verktøytilgang, innstillinger for utvidet tenking). Nedenfor er benchmark-dataanalyse av kodeevne:
SWE-bench Verified (reelle programvareingeniørtester)
Claude Sonnet 4.5 (Anthropic rapportert): 77.2% (200k tenkebudsjett; 78.2% i 1M-konfig). Anthropic rapporterer også 82,0% høy-compute med parallelle forsøk/rejection sampling.
Gemini 3 Pro (DeepMind-rapportering / relaterte topplister): ~76.2% enkeltforsøk på SWE-bench (leverandørtabell). Offentlige topplister varierer (Gemini og Sonnet bytter smale marginer).
Terminal-Bench og agentiske oppgaver
Gemini 3 Pro: Terminal-/agent-bench-tall (leverandørtabell) viser sterk ytelse (f.eks. Terminal-Bench 54.2% i leverandørtabell), konkurransedyktig med Sonnets agentiske styrker.
Sonnet 4.5: utmerker seg i agentisk verktøyorkestrering (Anthropic rapporterer betydelige gevinster på OSWorld og terminal-stil benchmarks og fremhever lengre sammenhengende oppgaveutførelser).
Konklusjon: de to modellene er svært nære på moderne kodeforståelses- og kodegenereringsbenchmarks; Sonnet 4.5 har en liten fordel på noen verifikasjonsserier for programvareingeniør (Anthropics publiserte tall), mens Gemini 3 Pro er ekstremt konkurransedyktig og leder ofte på multimodale og noen kode-konkurranse-lister. Valider alltid med nøyaktig evalueringskonfigurasjon (verktøytilgang, kontekststørrelse, tenkebudsjett), fordi disse bryterne påvirker resultatene materiellt.
Hvordan sammenlignes deres multimodale kapabiliteter?
Visuell forståelse og bildehåndtering
- Gemini 3 Pro: finmaskede multimodale kontroller med bilde/video
media_resolution(lave/middels/høye token-budsjetter per bilde/ramme), bildegenerering/redigering (egen image preview-modell) og eksplisitt veiledning for OCR/visuelle detaljer. Dette gjør Gemini særlig sterk når kodeoppgaver krever lesing av skjermbilder, UI-mockups eller videorammer. - Claude Sonnet 4.5: støtter tekst+bilde-multimodalitet og Anthropics produktintegrasjoner (Claude-apper) eksponerer visuelle arbeidsflyter; fokuset i Sonnet 4.5 er å integrere visuell kontekst i agentiske arbeidsflyter snarere enn rå bildegenerering.
Når multimodalitet betyr noe for koding
Hvis arbeidsflyten din er tungt avhengig av UI-skjermbilder, designspesifikasjoner i bilder eller videowalkthroughs som modellen må analysere for å produsere eller endre kode, kan Geminis dedikerte bildeoppløsningskontroller og bildegenereringsvariant være en praktisk fordel. Hvis pipelinen din er agent-drevet automatisering (klikke rundt, kjøre kommandoer, redigere filer på tvers av verktøy), er Claudes agent-SDK og kodekjøringsverktøy førsteklasses.
Avansert resonnement og planlegging over lang horisont — hvilken er best?
Sonnet 4.5: utholdenhet og tilpasning
Sonnet 4.5 kan opprettholde sammenhengende arbeid i over 30 timer over komplekse flertrinnsoppgaver (planlegging, research, utarbeiding av juridiske dokumenter, langvarige kodeoppgaver). Denne utholdenheten, pluss Anthropics fokus på tilpasning, gjør Sonnet til et attraktivt valg for ende-til-ende-automatisering der modellen må holde styr på mål og opprettholde sikker atferd.
Gemini 3 Pro: dypt resonnement + agentorkestrering
Gemini 3 Pro introduserer en “Deep Think”-variant og rikere interne tenking-API-er for flertrinns planlegging, kombinert med Googles agentiske IDE. I praksis betyr dette at Gemini både kan planlegge og utføre agentiske steg på tvers av verktøy (editor, shell, web). Hvis automatiseringen din krever ekstern verktøytilgang med artefaktoppretting, er Geminis integrerte agentiske verktøy (Antigravity) et sterkt pluss. Merk: Deep Think bytter latenstid mot dybde.
Sammenligning av langhorisont-planlegging: Vending-Bench 2
I “Vending-Bench 2”-simuleringstesten overgikk Gemini 3 Claude 4.5 ved å drive et virtuelt selskap i et helt år og holde seg lønnsomt. I kortsiktige tester var dataene for Gemini 3 Pro og Claude 4 Sonnet like, men forskjellen ble mer uttalt over lengre testperioder.

Praktisk forskjell
- For enkeltforsøk med høyt resonnement (kompleks algoritmisk debugging, dype logiske bevis inne i kode), lover Geminis
thinking_levelog Deep Think større dybde i én respons. - For langvarig, verktøydrevet automatisering (vedvarende agenter som kjører mange kommandoer, skriver tester, itererer og håndterer tilstand), er Claude Sonnet 4.5s langhorisont-fokus og agent-SDK sterke differensiatorer.
Hvordan sammenlignes API-tilgang og priser for utviklere?
Gemini 3 Pro (Google) — tilgang og prising
- Tilgang: Gemini 3 Pro preview er tilgjengelig via Google AI Studio og Vertex AI (model garden). SDK-er inkluderer google-genai for Python/JS/Go/etc., pluss OpenAI-kompatible lag for enklere migrering, med REST-endepunkter og funksjonskalling / kodekjøringsverktøy. Antigravity leverer en IDE-overflate som bruker Gemini 3 Pro i preview.
- Pris: Forhåndsvisningspriser oppgitt i Google-dokumenter: $2 / $12 per 1M tokens (inndata / utdata) for <200k-tier; høyere priser for >200k (eksempler i docs viser $4 / $18 for >200k).
Claude Sonnet 4.5 — tilgang og prising
- API-er & SDK-er: Anthropic tilbyr Claude API, Claude Agent SDK for å bygge agentiske arbeidsflyter, fil-API-er og kodekjøringsverktøy (native VS Code-utvidelse, forbedringer i Claude Code og en “checkpoint”-funksjon).
- Pris: 200k-token standard kontekstvindu, 1M-token kontekst i beta for enterprise; prising $3 / $15 per 1M tokens (inndata/utdata henholdsvis)
Som utvikler bør du velge en modell basert på dine behov og dens egenskaper, ikke bare den billigste. Hvis oppgaven kan håndteres av to modeller, avgjør basert på konteksten.
Hvis du vil bruke to modeller samtidig, anbefaler jeg CometAPI, som tilbyr både Gemini 3 Pro Preview API og Claude Sonnet 4.5 API, og er priset til 20% av den offisielle prisen.
| Gemini 3 Pro Preview | GPT-5.1 | |
| Input Tokens | $1.60 | $2.4.00 |
| Output Tokens | $9.60 | $12.00 |
Avsluttende tanker
Gemini 3 Pro (Preview) og Claude Sonnet 4.5 er begge state-of-the-art valg for kodeassistenter sent i 2025. Sonnet 4.5 ligger et lite hakk foran Gemini på spesifikke verifikasjonsbenchmarks for programvareingeniør og utholdenhet i oppgaver over lang horisont, mens Gemini 3 Pro leverer sterkere multimodal forståelse og dype agentiske verktøy som kan utføre i editor/terminal/nettleser-miljøer. Det riktige valget avhenger av om ditt primære behov er ren koderesonnering og verifikasjon (Sonnet), eller multimodal, agentisk, verktøy-augmentert utvikling (Gemini). For distribusjon i enterprise-sammenheng vil mange team med rette adoptere en hybrid tilnærming, der man bruker modellen som er sterkest for den aktuelle fasen i utviklingsflyten.
Utviklere kan få tilgang til Gemini 3 Pro Preview API og Claude Sonnet 4.5 API via CometAPI. For å komme i gang, utforsk modellkapabilitetene til CometAPI i Playground og se API-guiden for detaljerte instruksjoner. Før tilgang, sørg for at du er logget inn på CometAPI og har hentet API-nøkkelen. CometAPI tilbyr en pris langt under den offisielle prisen for å hjelpe deg med integrering.
Klar til å starte?→ Free trial of Gemini 3 pro and GPT-5.1 models
Hvis du vil ha flere tips, guider og nyheter om AI, følg oss på VK, X og Discord!
