Tænketilstand i Claude 4.5: Alt, hvad du behøver at vide

CometAPI
AnnaDec 30, 2025
Tænketilstand i Claude 4.5: Alt, hvad du behøver at vide

Anthropics Claude 4.5-familie (især Sonnet 4.5 og Opus 4.5) bringer udvidet “tænkning”/notesblok-lignende intern ræsonnering til deres Claude 4-serie. Messages API’et eksponerer denne funktion via et thinking-objekt (aktiver/deaktiver + en tildeling af budget_tokens), streamingmuligheder og særlig håndtering af “thinking”-indholdsblokke (inklusive signaturer og maskering). Sonnet 4.5 er målrettet kodning og agentbaserede opgaver og drager stor fordel af udvidet tænkning; Opus 4.5 tilføjer bevarede thinking-blokke og andre optimeringer.

Hvad er Claude 4.5?

Claude 4.5 (offentliggjort i Anthropics familie af Claude-modeller som varianterne Sonnet 4.5 og Opus 4.5) er virksomhedens nyeste generation af large language-modeller tunet til dybere ræsonnering, langtidskontekst og produktionsklar kodning/agentbaserede arbejdsgange. I Anthropics annoncering og produktsider beskrives Sonnet 4.5 som et stort skridt fremad for kodning, agentopbygning og “at bruge computere” (dvs. værktøjsassisterede arbejdsgange og flertrinsautomatisering), med målbare forbedringer på ræsonnering, matematik og langkontekst-opgaver.

4.5-familien i overblik

  • Claude Sonnet 4.5 (Udgivet 29. sep. 2025): Familiens “arbejdshest”. Den er aktuelt vurderet som verdens bedste kodningsmodel, i stand til at holde fokus på autonome opgaver i over 30 timer. Den balancerer hastighed, pris og højniveauræsonnering og er det foretrukne valg for de fleste virksomhedsapplikationer.
  • Claude Haiku 4.5 (Udgivet 15. okt. 2025): Hastighedsoptimeret model. Overraskende nok understøtter den nu Extended Thinking og er dermed den første “lille” model med dybe ræsonneringsevner, som tidligere var forbeholdt frontier-modeller. Ideel til højfrekvente opgaver, hvor latenstid er vigtig, men nøjagtighed ikke må ofres.
  • Claude Opus 4.5 (Udgivet 24. nov. 2025): Frontier-intelligensmodellen. Opus 4.5 er designet til de mest komplekse, tvetydige opgaver—såsom videnskabelig forskning, ny arkitekturudvikling og analyse af højrisiko-finans. Den har den højeste “tænkningsbudget”-kapacitet og excellerer i selvkorrektion.

Centrale funktioner i korte træk

  • Større anvendelige kontekstvinduer og forbedret adfærd i langvarige opgaver (agentarbejdsgange, trin-for-trin-fejlsøgning, kodebaseændringer).
  • Bedre performance på kodebenchmarks, refaktorering og flertrins værktøjsbrug (Sonnet- og Opus-familien).
  • Avancerede “tænknings”-funktioner (det Anthropic kalder udvidet tænkning / tænketilstand) der—valgfrit—eksponerer dele af modellens interne trinvise ræsonnering for udvikleren eller lader modellen bruge et konfigurerbart “budget” af tokens på at ræsonnere, før den producerer et endeligt svar.

Hvor kan du køre Claude 4.5

Claude 4.5 (Sonnet/Opus) er tilgængelig via Anthropics egen API og er integreret i CometAPI (API-priser er i øjeblikket på tilbud, cirka 20 % af Anthropics pris), så du kan køre disse modeller gennem Anthropics platform eller via tredjepartscloudleverandører, der hoster modellen.

Hvad er den nye THINKING-tilstand i Claude Code og Claude 4.5?

Anthropics udvidet tænkning (også kaldet “thinking mode”, “thinking blocks” eller “thinking tokens”) er en funktion, der lader modellen udføre ekstra interne samplingtrin for at ræsonnere mere grundigt, før den producerer et endeligt svar. Du aktiverer det ved at tilføje en thinking-konfiguration til din Messages API-anmodning (for eksempel: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) eller ved at bruge Anthropic SDK-hjælpere. Når det er aktiveret, vil API’et (afhængigt af modellen) enten returnere en opsummeret version af den interne ræsonnering eller returnere den fulde ræsonnering (med maskering af hensyn til sikkerhed).

For at forstå, hvorfor “Thinking Mode” er revolutionerende, må vi se på, hvordan Large Language Models (LLM’er) traditionelt fungerer. Standardmodeller er “probabilistiske tekstgeneratorer”—de forudsiger næste token straks efter at have modtaget en prompt. De “stopper” ikke for at tænke; de begynder at generere med det samme.

Skiftet til “Extended Thinking”

Thinking Mode ændrer dette paradigme. Når den er aktiveret, genererer Claude 4.5 en skjult strøm af “thinking tokens”, før den udsender et eneste synligt tegn til brugeren.

Synlig ræsonnering (valgfrit): I nogle grænseflader som Claude.ai kan du se en “Thinking”-dropdown, der viser modellens interne monolog.

Skjult ræsonnering (API): I API’et er disse særskilte thinking-blokke. Modellen bruger dette rum til at:

  • Dekonstruere prompten: Bryde komplekse begrænsninger ned.
  • Lægge en strategi: Skitsere trin-for-trin-logik.
  • Udkast og kritik: Afprøve en løsning mentalt, finde en fejl og rette den, før svaret præsenteres.

Interleaved Thinking

En stor nyhed i Sonnet 4.5 er Interleaved Thinking. I agentbaserede arbejdsgange (hvor AI’et bruger værktøjer som en lommeregner, en kodefortolker eller en webbrowser) ville standardmodeller blot kalde et værktøj, få et resultat og straks kalde det næste værktøj.

Med Interleaved Thinking kan Claude 4.5:

  1. Tænke over brugerens anmodning.
  2. Kalder værktøj A (f.eks. søg på nettet).
  3. Tænke over søgeresultaterne (“Dette resultat er forældet, jeg bør prøve en anden forespørgsel”).
  4. Kalder værktøj B (f.eks. søg igen).
  5. Tænke over, hvordan dataene bedst syntetiseres.
  6. Endeligt svar.

Denne “Tænk–Handl–Tænk–Handl”-sløjfe reducerer markant hallucinationer og fejlspredning i lange, flertrins kodningsopgaver.

Hvordan Claude Code eksponerer tænkning i udviklerværktøjer

I Claude Code (CLI-/editoroplevelsen) har Anthropic tilføjet UI-muligheder til at slå tænketilstand til/fra for interaktive sessioner (en almindelig UX er at trykke på Tab for at slå tænkning til/fra) og til at vise indikatorer for det aktuelle tænkningsbudget. Nogle ældre triggernøgleord (f.eks. think, think hard) blev historisk brugt til at styre tænkedybden; moderne versioner bygger på eksplicitte toggler og budgetparametre, hvor ultrathink stadig er tilgængelig i nogle kontekster. Konfigurationen kan være global i ~/.claude/settings.json eller tilsidesættes pr. anmodning.

Hvordan implementerer du Claude 4.5 Thinking Mode?

For udviklere kræver overgangen til Claude 4.5 en ændring i, hvordan API-anmodninger struktureres. Du sender ikke længere bare en prompt; du styrer et “tænkningsbudget”.

Fastlæggelse af tænkningsbudgettet

Parameteren thinking er nu en førsteklasses del af Anthropic API’et. Du skal eksplicit aktivere den og definere en budget_tokens-værdi. Denne værdi repræsenterer den maksimale mængde compute, modellen kan bruge på sin interne ræsonnering.

Eksempel på Python-implementering

Følgende kode demonstrerer, hvordan man initialiserer en Claude 4.5-session med Extended Thinking aktiveret.

import anthropic

# Initialisér Gemini Enterprise-perspektivet på integration med Claude 4.5
client = anthropic.Anthropic(api_key="din_api_nøgle")

def get_reasoned_response(user_query):
    # Vi sætter en høj max_tokens for at rumme både tænkning og det endelige svar
    # budget_tokens skal være mindre end max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Allokerer 12k tokens til 'tænkning'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Udtræk de to adskilte dele af svaret
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Eksempel på kompleks forespørgsel
query = "Design et zero-knowledge-bevis-system til en decentraliseret stemmeapp ved hjælp af Circom."
thoughts, answer = get_reasoned_response(query)

print("--- CLAUDES INTERNE RÆSONNERING ---")
print(thoughts)
print("\n--- ENDELIG TEKNISK ARKITEKTUR ---")
print(answer)

Vigtige tekniske overvejelser

  • Samlet tokenforbrug: Dit samlede forbrug er thinking_tokens + output_tokens. Hvis du sætter et budget på 10.000 tokens, og modellen bruger 8.000 på tænkning og 2.000 på svaret, bliver du faktureret for 10.000 outputtokens.
  • Tvungen tænkning: Hvis opgaven er for simpel, kan modellen stadig bruge et minimum af thinking-tokens for at verificere opgavens enkelhed.

Hvordan forbedrer Thinking Mode kodegenerering?

En af de mest markante opgraderinger i Claude 4.5 er performance i Claude Code-CLI’en. Når Claude 4.5 “tænker” over kode, udfører den flere skjulte handlinger, som standardmodeller overser.

1. Afhængighedskortlægning

Før der skrives en eneste linje af en rettelse, traverserer Claude 4.5 dit repository for at forstå, hvordan en ændring i utils/auth.ts kan bryde en komponent i views/Profile.tsx.

2. Mental udførelse

Modellen “kører” koden i sin ræsonneringsblok. Den simulerer logikforløbet og identificerer potentielle race conditions eller off-by-one-fejl.

3. Verificering af begrænsninger

Hvis du beder om en løsning, der er “performant og bruger ingen eksterne biblioteker”, fungerer tænketilstanden som gatekeeper. Hvis modellens første instinkt er at foreslå en NPM-pakke, vil tænkningsprocessen fange det brud og tvinge modellen til at gentænke en vanilla JavaScript-implementering.

Hvordan sammenlignes Thinking Mode med traditionel prompting?

Mange brugere kender “Chain of Thought” (CoT)-prompting, hvor du beder modellen: “Tænk trin for trin.” Det er effektivt, men det er ikke det samme som Claude 4.5’s native Thinking Mode.

FunktionChain of Thought (manuel)Extended Thinking (native)
MekanismeBrugerstyrede instruktioner.Indbygget modelarkitektur.
Token-rumOptager synligt outputrum.Optager en dedikeret intern blok.
SelvkorrektionBegrænset; modellen “dobler ofte ned” på tidlige fejl.Høj; modellen kan forkaste en hel ræsonneringsvej og starte forfra.
PålidelighedVariabel afhængigt af promptkvalitet.Konsekvent høj på tværs af komplekse domæner.
API-håndteringKræver manuel parsing af tekst.Strukturerede JSON-blokke for “thinking” og “text”.

Hvordan fungerer tænketilstanden i Claude 4.5?

Intern arbejdsgang (konceptuelt)

  1. Brugeranmodning: Din applikation sender en Messages API-anmodning med model, prompt, max_tokens og valgfrit thinking: { type: "enabled", budget_tokens: N }.
  2. Intern ræsonnering: Claude udfører intern “tænkning” op til budgettet. Den registrerer ræsonneringsoutput som thinking-blokke (som kan opsummeres for brugeren).
  3. Outputkomposition: API’et returnerer et array af indholdsblokke. Typisk er rækkefølgen thinking-blok(ke) efterfulgt af text-blok(ke) (endeligt svar). Ved streaming modtager du thinking_delta-begivenheder efterfulgt af text_delta-begivenheder.
  4. Bevarelse af kontekst: Når du bruger værktøjer eller flerturnsforløb, kan du gensende tidligere thinking-blokke (uændrede), så Claude kan fortsætte tanke-kæden. Opus 4.5 introducerede adfærd til at bevare thinking-blokke som standard for cache/effektivitet.

Teknisk set afhænger tænketilstand af en specifik API-parameterkonfiguration, der allokerer et “budget” af tokens til ræsonnering.

Tokenbudget-konceptet

Når du laver en anmodning til Claude 4.5, skal du angive en budget_tokens-parameter. Dette er det maksimale antal tokens, modellen må bruge på sin interne monolog.

  • Lavt budget (<2.000 tokens): Godt til hurtige sanity checks eller simple logikopgaver.
  • Højt budget (10.000+ tokens): Krævet til kompleks softwarearkitektur, matematiske beviser eller udarbejdelse af omfattende juridiske dokumenter.

Modellen er trænet til at “forvalte” dette budget. Hvis den mærker, at budgettet er ved at slippe op, vil den forsøge at afrunde sin ræsonnering og give det bedst mulige svar.

“Tænkningsprocessens” livscyklus

Når en bruger spørger: “Skriv et Python-script til at scrape denne hjemmeside, men sørg for, at det respekterer robots.txt og håndterer dynamisk indlæsning.”

  1. Indlæsning: Claude læser prompten.
  2. Tænkningsfase (skjult):
    • Selvkorrektion: “Jeg skal bruge Selenium eller Playwright til dynamisk indlæsning. requests vil ikke virke.”
    • Sikkerhedstjek: “Jeg skal verificere, at brugeren har tilladelse til at scrape. Jeg vil tilføje en ansvarsfraskrivelse.”
    • Arkitektur: “Jeg strukturerer koden med en klassebaseret tilgang for modularitet.”
  3. Outputfase (synlig): Claude genererer Python-koden.

I tidligere modeller kunne AI’en være begyndt at skrive requests-kode med det samme, for så halvvejs at indse, at den ikke ville virke til dynamisk indhold, og derefter enten hallucinere en løsning eller levere brudt kode. Tænketilstand forhindrer dette “male sig selv op i et hjørne”-scenarie.

Hvornår bør du aktivere tænketilstand — use cases og tommelfingerregler?

Use cases der får størst udbytte

  • Kompleks kodning (arkitekturændringer, refaktorering på tværs af filer, lange fejlsøgningssessioner). Sonnet 4.5 er eksplicit positioneret som en leder inden for kodning og agentik, når tænkning er aktiveret.
  • Agentbaserede arbejdsgange, der bruger værktøjer gentagne gange og skal bevare intern kontekst på tværs af mange trin. Interleaved Thinking + værktøjsbrug er et primært scenarie.
  • Dyb research eller analyse (statistisk analyse, finansiel strukturering, juridisk ræsonnering), hvor mellemliggende ræsonneringstrin er værdifulde at inspicere eller verificere.

Hvornår du ikke bør aktivere det

  • Generering af korte svar eller høj-throughput, lav-latenstid-API’er, hvor minimal latenstid er kritisk (f.eks. chat-UI’er, der kræver respons på millisekundniveau).
  • Opgaver hvor tokenomkostning pr. anmodning skal minimeres, og opgaven er simpel eller veldefineret.

Praktisk tommelfingerregel

Start med det mindste tænkningsbudget (≈1.024 tokens) og øg gradvist for opgaver, der kræver mere dybde; benchmark end-to-end-opgavenøjagtighed vs. latenstid og tokens. For flertrins agentopgaver kan du eksperimentere med indflettet tænkning og cachede prompt-breakpoints for at finde det rette kompromis.

Konklusion

Claude 4.5’s Thinking Mode er mere end blot en funktion; det er en ny måde at interagere med kunstig intelligens på. Ved at adskille tankeprocessen fra tankeproduktet har Anthropic leveret et værktøj, der er mere pålideligt, mere transparent og bedre i stand til at håndtere kompleksiteten i moderne virksomhedsfunktioner.

Uanset om du bruger Claude Code-CLI’en til at styre en massiv migration eller anvender API’et til at bygge næste generation af autonome agenter, er beherskelsen af “tænkningsbudgettet” nøglen til succes.

Udviklere kan få adgang til Claude 4.5-modellen via CometAPI. For at komme i gang kan du udforske modellernes kapaciteter på CometAPI i Playground og konsultere API-guiden for detaljerede instruktioner. Før adgang, sørg for at du er logget ind på CometAPI og har fået en API-nøgle. CometAPI tilbyder en pris, der er langt lavere end den officielle pris for at hjælpe dig med integrationen.

Klar til at komme i gang?→ Gratis prøve af Claude 4.5!

Adgang til topmodeller til lav pris

Læs mere