Tenkemodus i Claude 4.5: Alt du trenger å vite

CometAPI
AnnaDec 30, 2025
Tenkemodus i Claude 4.5: Alt du trenger å vite

Anthropics Claude 4.5-familie (særlig Sonnet 4.5 og Opus 4.5) bringer utvidet «thinking» / intern resonnement i scratchpad-stil til Claude 4-linjen. Messages API eksponerer denne funksjonen gjennom et thinking-objekt (aktiver/deaktiver + en tildeling av budget_tokens), strømmealternativer og spesialhåndtering av innholdsblokker for «thinking» (inkludert signaturer og redigering). Sonnet 4.5 er rettet mot koding og agentiske oppgaver og drar stor nytte av utvidet tenkning; Opus 4.5 legger til bevarte thinking-blokker og andre optimaliseringer.

Hva er Claude 4.5?

Claude 4.5 (publisert i Anthropics Claude-modellfamilie som variantene Sonnet 4.5 og Opus 4.5) er selskapets nyeste generasjon store språkmodeller, justert for dypere resonnement, langsiktig kontekst og produksjonsklar koding / agentiske arbeidsflyter. I Anthropics kunngjøringer og produktsider beskrives Sonnet 4.5 som et stort steg fremover for koding, bygging av agenter og «bruk av datamaskiner» (dvs. verktøyassisterte arbeidsflyter og flertrinnsautomatisering), med målbare forbedringer innen resonnement, matematikk og oppgaver med lang kontekst.

4.5-familiens modellutvalg

  • Claude Sonnet 4.5 (Lansert 29. sep. 2025): «Arbeidshesten» i familien. Den er for øyeblikket rangert som verdens beste kodemodell, i stand til å holde fokus på autonome oppgaver i over 30 timer. Den balanserer hastighet, kostnad og avansert resonnement, noe som gjør den til standardvalget for de fleste bedriftsapplikasjoner.
  • Claude Haiku 4.5 (Lansert 15. okt. 2025): Den hastighetsoptimaliserte modellen. Overraskende nok støtter den nå Extended Thinking, noe som gjør den til den første «lille» modellen som tilbyr dype resonnementsevner som tidligere var forbeholdt frontier-modeller. Den er ideell for høyfrekvente oppgaver der latens betyr noe, men nøyaktighet ikke kan ofres.
  • Claude Opus 4.5 (Lansert 24. nov. 2025): Modellen for frontier-intelligens. Opus 4.5 er utviklet for de mest komplekse og tvetydige oppgavene — som vitenskapelig forskning, design av nye arkitekturer og finansiell analyse med høye krav. Den har den høyeste kapasiteten for «thinking budget» og utmerker seg i selvkorrigering.

Viktige egenskaper på et øyeblikk

  • Større brukbare kontekstvinduer og forbedret oppførsel i langvarige oppgaver (agentarbeidsflyter, stegvis feilsøking, redigering av kodebaser).
  • Bedre ytelse på benchmarker for koding, refaktorering og flertrinnsoppgaver med verktøybruk (Sonnet- og Opus-familien).
  • Avanserte «thinking»-funksjoner (det Anthropic kaller extended thinking / thinking mode) som valgfritt eksponerer noe av modellens interne stegvis resonnement til utvikleren, eller lar modellen bruke et konfigurerbart «budget» av tokens på resonnement før den produserer et endelig svar.

Hvor du kan kjøre Claude 4.5

Claude 4.5 (Sonnet/Opus) er tilgjengelig via Anthropics egen API og er integrert i CometAPI(API-prisene er for tiden på tilbud, omtrent 20 % av Anthropics pris.), slik at du kan kjøre disse modellene gjennom Anthropics plattform eller gjennom tredjeparts skyleverandører som hoster modellen.

Hva er nytt med THINKING mode i Claude Code og Claude 4.5?

Anthropics extended thinking (også kjent som «thinking mode», «thinking blocks» eller «thinking tokens») er en funksjon som lar modellen utføre ekstra interne sampling-steg for å resonnere grundigere før den produserer et endelig svar. Du aktiverer den ved å legge til en thinking-konfigurasjon i Messages API-forespørselen din (for eksempel: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) eller ved å bruke hjelpefunksjoner i Anthropics SDK. Når den er aktivert, vil API-et (avhengig av modellen) enten returnere en oppsummert versjon av det interne resonnementet eller returnere hele resonnementet (med forbehold om redigering av sikkerhetsgrunner).

For å forstå hvorfor «Thinking Mode» er revolusjonerende, må vi se på hvordan store språkmodeller (LLM-er) tradisjonelt fungerer. Standardmodeller er «probabilistiske tekstgeneratorer» — de predikerer neste token umiddelbart etter at de mottar en prompt. De «stopper ikke opp for å tenke»; de begynner å snakke (generere) umiddelbart.

Skiftet til «Extended Thinking»

Thinking Mode endrer dette paradigmet. Når det er aktivert, genererer Claude 4.5 en skjult strøm av «thinking tokens» før den sender ut ett eneste synlig tegn til brukeren.

Synlig resonnement (valgfritt): I noen grensesnitt som Claude.ai kan du se en rullegardin for «Thinking» som viser modellens interne monolog.

Skjult resonnement (API): I API-et er dette separate thinking-blokker. Modellen bruker dette rommet til å:

  • Bryte ned prompten: Dele opp komplekse begrensninger.
  • Planlegge en strategi: Skissere stegvis logikk.
  • Utarbeide og kritisere: Prøve en løsning mentalt, finne en feil og korrigere den før svaret presenteres.

Interleaved Thinking

En stor innovasjon i Sonnet 4.5 er Interleaved Thinking. I agentiske arbeidsflyter (der AI-en bruker verktøy som en kalkulator, en kodefortolker eller en nettleser) ville standardmodeller bare kalt et verktøy, fått et resultat og umiddelbart kalt neste verktøy.

Med Interleaved Thinking kan Claude 4.5:

  1. Tenke over brukerens forespørsel.
  2. Kalle verktøy A (f.eks. søke på nettet).
  3. Tenke over søkeresultatene («Dette resultatet er utdatert, jeg bør prøve et annet søk»).
  4. Kalle verktøy B (f.eks. søke på nytt).
  5. Tenke over hvordan dataene skal syntetiseres.
  6. Endelig svar.

Denne «Think-Act-Think-Act»-løkken reduserer hallusinasjoner og feilforplantning drastisk i lange kodingsoppgaver med flere steg.

Hvordan Claude Code viser tenkning i utviklerverktøy

I Claude Code (CLI-/editoropplevelsen) har Anthropic lagt til UI-mekanismer for å slå thinking mode av/på for interaktive økter (en vanlig UX er å trykke Tab for å veksle tenkning av/på) og for å vise indikatorer for gjeldende thinking budget. Noen eldre utløserord (f.eks. think, think hard) ble historisk brukt for å styre dybden på tenkningen; moderne versjoner bruker eksplisitte brytere og budsjettparametere, mens ultrathink fortsatt er tilgjengelig i noen sammenhenger. Konfigurasjonen kan være global i ~/.claude/settings.json eller overstyres per forespørsel.

Hvordan implementerer du Claude 4.5 Thinking Mode?

For utviklere krever overgangen til Claude 4.5 en endring i hvordan API-forespørsler struktureres. Du sender ikke lenger bare en prompt; du administrerer et «Thinking Budget».

Angi thinking budget

Parameteren thinking er nå en førsteklasses del av Anthropics API. Du må eksplisitt aktivere den og definere en verdi for budget_tokens. Denne verdien representerer hvor mye beregning modellen maksimalt kan bruke på sitt interne resonnement.

Eksempel på implementering i Python

Følgende kode demonstrerer hvordan du initialiserer en Claude 4.5-økt med Extended Thinking aktivert.

import anthropic

# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")

def get_reasoned_response(user_query):
    # We set a high max_tokens to accommodate both thinking and the final answer
    # The budget_tokens must be less than max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Allocating 12k tokens for 'thinking'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Extracting the two distinct parts of the response
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)

print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)

Viktige tekniske hensyn

  • Total tokenbruk: Din totale bruk er thinking_tokens + output_tokens. Hvis du setter et budsjett på 10 000 tokens og modellen bruker 8 000 på tenkning og 2 000 på svaret, blir du fakturert for 10 000 output-tokens.
  • Tvungen tenkning: Hvis oppgaven er for enkel, kan modellen fortsatt bruke et minimum antall thinking-tokens for å bekrefte at forespørselen er enkel.

Hvordan forbedrer Thinking Mode kodegenerering?

En av de viktigste oppgraderingene i Claude 4.5 er ytelsen i Claude Code CLI. Når Claude 4.5 «tenker» over kode, utfører den flere skjulte handlinger som standardmodeller overser.

1. Avhengighetskartlegging

Før den skriver en eneste linje i en rettelse, går Claude 4.5 gjennom repositoriet ditt for å forstå hvordan en endring i utils/auth.ts kan ødelegge en komponent i views/Profile.tsx.

2. Mental kjøring

Modellen «kjører» koden i resonnementblokken. Den simulerer logikkflyten og identifiserer potensielle race conditions eller off-by-one-feil.

3. Verifisering av begrensninger

Hvis du ber om en løsning som er «performant og ikke bruker eksterne biblioteker», fungerer thinking mode som en portvokter. Hvis modellens første instinkt er å foreslå en NPM-pakke, vil tankeprosessen fange opp det bruddet og tvinge modellen til å tenke på nytt om en implementering i ren JavaScript.

Hvordan sammenlignes Thinking Mode med tradisjonell prompting?

Mange brukere er kjent med prompting av typen «Chain of Thought» (CoT), der du ber modellen: «Tenk steg for steg.» Selv om det er effektivt, er det ikke det samme som Claude 4.5s innebygde Thinking Mode.

FeatureChain of Thought (Manual)Extended Thinking (Native)
MechanismUser-prompted instructions.Built-in model architecture.
Token SpaceOccupies visible output space.Occupies a dedicated internal block.
Self-CorrectionLimited; the model often "doubles down" on early mistakes.High; the model can discard an entire reasoning path and start over.
ReliabilityVariable based on prompt quality.Consistently high across complex domains.
API HandlingRequires manual parsing of text.Structured JSON blocks for "thinking" and "text".

Hvordan fungerer thinking mode i Claude 4.5?

Intern arbeidsflyt (konseptuelt)

  1. Brukerforespørsel: Applikasjonen din sender en Messages API-forespørsel som spesifiserer modell, prompt, max_tokens, og eventuelt thinking: { type: "enabled", budget_tokens: N }.
  2. Internt resonnement: Claude utfører intern «thinking» opp til budsjettet. Den registrerer resonnementutdata som thinking-blokker (som kan være oppsummert for brukeren).
  3. Sammensetting av utdata: API-et returnerer en matrise av innholdsblokker. Vanligvis er rekkefølgen thinking-blokk(er) etterfulgt av text-blokk(er) (endelig svar). Ved strømming mottar du thinking_delta-hendelser etterfulgt av text_delta-hendelser.
  4. Bevaring av kontekst: Når du bruker verktøy eller flerturnsflyter, kan du sende tidligere thinking-blokker på nytt (uendret), slik at Claude kan fortsette chain-of-thought. Opus 4.5 introduserte at thinking-blokker bevares som standard for cache/effektivitet.

Teknisk sett bygger Thinking Mode på en spesifikk API-parameterkonfigurasjon som tildeler et token-«Budget» for resonnement.

Konseptet tokenbudsjett

Når du sender en forespørsel til Claude 4.5, må du spesifisere en parameter budget_tokens. Dette er maksantallet tokens modellen har lov til å bruke på sin interne monolog.

  • Lavt budsjett (<2 000 tokens): Bra for raske rimelighetskontroller eller enkle logiske oppgaver.
  • Høyt budsjett (10 000+ tokens): Kreves for kompleks programvarearkitektur, matematiske bevis eller skriving av omfattende juridiske dokumenter.

Modellen er trent til å «administrere» dette budsjettet. Hvis den merker at budsjettet er i ferd med å gå tomt, vil den forsøke å avslutte resonnementet og gi best mulig svar.

Livssyklusen til «thinking process»

Når en bruker spør: «Write a Python script to scrape this website, but ensure it respects robots.txt and handles dynamic loading.»

  1. Inntak: Claude leser prompten.
  2. Tenkefase (skjult):
    • Selvkorrigering: «Jeg må bruke Selenium eller Playwright for dynamisk lasting. requests fungerer ikke.»
    • Sikkerhetssjekk: «Jeg må bekrefte at brukeren har tillatelse til å scrape. Jeg vil legge til en ansvarsfraskrivelse.»
    • Arkitektur: «Jeg skal strukturere koden med en klassebasert tilnærming for modularitet.»
  3. Utdatafase (synlig): Claude genererer Python-koden.

I tidligere modeller kunne AI-en ha begynt å skrive requests-koden med en gang, innsett halvveis at den ikke ville fungere for dynamisk innhold, og deretter enten hallusinert en løsning eller levert ødelagt kode. Thinking mode forhindrer dette scenariet der modellen «maler seg inn i et hjørne».

Når bør du aktivere thinking mode — bruksområder og tommelfingerregler?

Bruksområder som har størst nytte

  • Kompleks koding (arkitektoniske endringer, refaktorering på tvers av flere filer, lange feilsøkingsøkter). Sonnet 4.5 er eksplisitt posisjonert som ledende innen koding og agentiske oppgaver når thinking brukes.
  • Agentiske arbeidsflyter som bruker verktøy gjentatte ganger og må bevare intern kontekst på tvers av mange steg. Interleaved thinking + verktøybruk er et primært scenario.
  • Dyp forskning eller analyse (statistisk analyse, finansiell strukturering, juridisk resonnement) der mellomliggende resonnementstrinn er verdifulle å inspisere eller verifisere.

Når du ikke bør aktivere det

  • Generering av korte svar eller API-er med høy gjennomstrømning og lav latens der minimal latens er kritisk (f.eks. chatgrensesnitt som krever responser på millisekundnivå).
  • Oppgaver der tokenkostnaden per forespørsel må minimeres og oppgaven er enkel eller godt spesifisert.

Praktisk tommelfingerregel

Start med minimum thinking budget (≈1 024 tokens) og øk gradvis for oppgaver som krever mer dybde; benchmark nøyaktighet for hele oppgaven opp mot latens og tokens. For agentoppgaver med flere steg kan du eksperimentere med interleaved thinking og bufrede prompt-brytepunkter for å finne et godt kompromiss.

Konklusjon

Claude 4.5s Thinking Mode er mer enn bare en funksjon; det er en ny måte å samhandle med kunstig intelligens på. Ved å skille tankeprosessen fra produktet av tanken har Anthropic levert et verktøy som er mer pålitelig, mer transparent og bedre i stand til å håndtere kompleksiteten i moderne bedriftsarbeid.

Enten du bruker Claude Code CLI for å håndtere en massiv migrering eller bruker API-et for å bygge neste generasjon autonome agenter, er det å mestre «Thinking Budget» nøkkelen til suksess.

Utviklere kan få tilgang til Claude 4.5-modellen gjennom CometAPI. For å komme i gang kan du utforske modellfunksjonene i CometAPI i Playground og lese API-veiledningen for detaljerte instruksjoner. Før du får tilgang, må du sørge for at du har logget inn på CometAPI og skaffet API-nøkkelen. CometAPI tilbyr en pris som er langt lavere enn den offisielle prisen for å hjelpe deg med integrasjonen.

Klar til å gå i gang?→ Gratis prøveversjon av Claude 4.5!

Tilgang til toppmodeller til lav kostnad

Les mer