Tænketilstand i Claude 4.5: Alt, du behøver at vide

CometAPI
AnnaDec 30, 2025
Tænketilstand i Claude 4.5: Alt, du behøver at vide

Anthropics Claude 4.5-familie (især Sonnet 4.5 og Opus 4.5) bringer udvidet “tænkning” / kladde-agtig intern ræsonnering til deres Claude 4-serie. Messages API eksponerer denne funktion via et thinking-objekt (aktiver/deaktiver + en tildeling af budget_tokens), streamingmuligheder og særlig håndtering af “thinking”-indholdsblokke (inklusive signaturer og redigering). Sonnet 4.5 er målrettet kodning og agentbaserede opgaver og får markante fordele af udvidet tænkning; Opus 4.5 tilføjer bevarede tænkeblokke og andre optimeringer.

Hvad er Claude 4.5?

Claude 4.5 (udgivet i Anthropics familie af Claude-modeller som varianterne Sonnet 4.5 og Opus 4.5) er virksomhedens nyeste generation af store sprogmodeller, tunet til dybere ræsonnering, langhorisont-kontekst og produktionsklar kodning/agentiske workflows. I Anthropics annoncering og produktsider beskrives Sonnet 4.5 som et stort skridt fremad for kodning, agentopbygning og “brug af computere” (dvs. værktøjsunderstøttede arbejdsgange og flertrins-automatisering), med målbare forbedringer på ræsonnering, matematik og langkontekst-opgaver.

4.5-familien i oversigt

  • Claude Sonnet 4.5 (Udgivet 29. sep. 2025): Familiens arbejdshest. Den er i øjeblikket vurderet som verdens bedste model til kodning, i stand til at opretholde fokus på autonome opgaver i over 30 timer. Den balancerer hastighed, omkostning og højniveauræsonnering og er det standardvalg til de fleste virksomhedsapplikationer.
  • Claude Haiku 4.5 (Udgivet 15. okt. 2025): Hastighedsoptimeret model. Overraskende nok understøtter den nu Udvidet Tænkning og er dermed den første “lille” model, der tilbyder dyb ræsonnering tidligere forbeholdt frontier-modeller. Ideel til højfrekvente opgaver, hvor latens er vigtig, men nøjagtighed ikke må ofres.
  • Claude Opus 4.5 (Udgivet 24. nov. 2025): Frontier-intelligensmodellen. Opus 4.5 er designet til de mest komplekse, flertydige opgaver—såsom videnskabelig forskning, ny arkitekturdesign og finansiel analyse med høj risiko. Den har den højeste “tænkningsbudget”-kapacitet og excellerer i selvkorrektion.

Centrale muligheder i et glimt

  • Større brugbare kontekstvinduer og forbedret adfærd i langvarige opgaver (agentarbejdsgange, trinvis debugging, ændringer i kodebaser).
  • Bedre performance på kode-benchmarks, refaktorering og flertrins opgaver med brug af værktøjer (Sonnet- og Opus-familien).
  • Avancerede “tænknings”-funktioner (det Anthropic kalder udvidet tænkning / tænkemodus), der valgfrit eksponerer noget af modellens interne trinvise ræsonnering for udvikleren eller lader modellen bruge et konfigurerbart “budget” af tokens på at ræsonnere før den producerer et endeligt svar.

Hvor kan du køre Claude 4.5

Claude 4.5 (Sonnet/Opus) er tilgængelig via Anthropics egen API og er integreret i CometAPI(API-priserne er i øjeblikket på tilbud, cirka 20% af Anthropics pris.), så du kan køre disse modeller via Anthropics platform eller gennem tredjeparts cloud-udbydere, der hoster modellen.

Hvad er den nye THINKING-tilstand i Claude Code og Claude 4.5?

Anthropics udvidede tænkning (også kaldet “thinking mode”, “thinking blocks” eller “thinking tokens”) er en funktion, der lader modellen udføre ekstra interne samplingtrin for at ræsonnere mere grundigt, før den producerer et endeligt svar. Du aktiverer den ved at tilføje en thinking-konfiguration til din Messages API-anmodning (for eksempel: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) eller ved at bruge Anthropics SDK-hjælpere. Når den er aktiveret, vil API’et (afhængigt af model) enten returnere en opsummeret version af den interne ræsonnering eller returnere hele ræsonneringen (med redigering af hensyn til sikkerhed).

For at forstå, hvorfor “Thinking Mode” er revolutionerende, skal vi se på, hvordan store sprogmodeller (LLM’er) traditionelt fungerer. Standardmodeller er “probabilistiske tekstgeneratorer”—de forudsiger det næste token straks efter at have modtaget en prompt. De “stopper ikke for at tænke”; de begynder at tale (generere) med det samme.

Skiftet til “Udvidet tænkning”

Thinking Mode ændrer dette paradigme. Når aktiveret, genererer Claude 4.5 en skjult strøm af “thinking tokens”, før den udsender et eneste synligt tegn til brugeren.

Synlig ræsonnering (valgfrit): I nogle interfaces som Claude.ai kan du se en “Thinking”-dropdown, der viser modellens interne monolog.

Skjult ræsonnering (API): I API’et er disse separate thinking-blokke. Modellen bruger dette rum til at:

  • Dele prompten op: Nedbryde komplekse begrænsninger.
  • Planlægge en strategi: Skitsere trin-for-trin logik.
  • Udkast og kritik: Afprøve en løsning mentalt, finde en fejl og rette den, før svaret præsenteres.

Indflettet tænkning

En stor innovation i Sonnet 4.5 er Indflettet tænkning. I agentiske arbejdsgange (hvor AI’et bruger værktøjer som en lommeregner, en kodefortolker eller en webbrowser), ville standardmodeller blot kalde et værktøj, få et resultat og straks kalde det næste værktøj.

Med indflettet tænkning kan Claude 4.5:

  1. Tænke over brugerens anmodning.
  2. Kalde værktøj A (f.eks. søge på nettet).
  3. Tænke over søgeresultaterne (“Dette resultat er forældet, jeg bør prøve en anden forespørgsel”).
  4. Kalde værktøj B (f.eks. søge igen).
  5. Tænke over, hvordan dataene syntetiseres.
  6. Endeligt svar.

Denne “Tænk-Handl-Tænk-Handl”-sløjfe reducerer drastisk hallucinationer og fejlspredning i lange, flertrins kodningsopgaver.

Sådan eksponerer Claude Code tænkning i udviklerværktøjer

I Claude Code (CLI-/editoroplevelsen) har Anthropic tilføjet UI-faciliteter til at slå tænkemodus til/fra for interaktive sessioner (en almindelig UX er at trykke på Tab for at slå tænkning til/fra) og til at vise indikatorer for det aktuelle tænkningsbudget. Nogle ældre trigger-ord (fx think, think hard) blev historisk brugt til at styre tænkedybde; moderne versioner bygger på eksplicitte toggles og budgetparametre, hvor ultrathink stadig er tilgængelig i nogle sammenhænge. Konfigurationen kan være global i ~/.claude/settings.json eller tilsidesat pr. anmodning.

Hvordan implementerer du Claude 4.5 Thinking Mode?

For udviklere kræver overgangen til Claude 4.5 en ændring i, hvordan API-anmodninger struktureres. Du sender ikke længere blot en prompt; du styrer et “tænkningsbudget”.

Indstilling af tænkningsbudgettet

thinking-parameteren er nu en førsteklasses indbygget del af Anthropics API. Du skal eksplicit aktivere den og definere en budget_tokens-værdi. Denne værdi repræsenterer den maksimale mængde compute, modellen kan bruge på sin interne ræsonnering.

Python-implementeringseksempel

Følgende kode demonstrerer, hvordan man initialiserer en Claude 4.5-session med Udvidet Tænkning aktiveret.

import anthropic

# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")

def get_reasoned_response(user_query):
    # We set a high max_tokens to accommodate both thinking and the final answer
    # The budget_tokens must be less than max_tokens
    response = client.messages.create(
        model="claude-4-5-sonnet-202512",
        max_tokens=20000,
        thinking={
            "type": "enabled",
            "budget_tokens": 12000  # Allocating 12k tokens for 'thinking'
        },
        messages=[
            {"role": "user", "content": user_query}
        ]
    )

    # Extracting the two distinct parts of the response
    thinking_content = ""
    final_output = ""

    for block in response.content:
        if block.type == "thinking":
            thinking_content = block.thinking
        elif block.type == "text":
            final_output = block.text

    return thinking_content, final_output

# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)

print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)

Vigtige tekniske overvejelser

  • Total tokenforbrug: Dit samlede forbrug er thinking_tokens + output_tokens. Hvis du sætter et budget på 10.000 tokens, og modellen bruger 8.000 på tænkning og 2.000 på svaret, bliver du faktureret for 10.000 output-tokens.
  • Tvungen tænkning: Hvis opgaven er for enkel, kan modellen stadig bruge et minimum af thinking-tokens for at verificere enkelheden af forespørgslen.

Hvordan forbedrer Thinking Mode kodegenerering?

En af de mest betydningsfulde opgraderinger i Claude 4.5 er performance i Claude Code CLI’en. Når Claude 4.5 “tænker” over kode, udfører den flere skjulte handlinger, som standardmodeller overser.

1. Afhængighedskortlægning

Før der skrives en eneste linje af en rettelse, gennemgår Claude 4.5 dit repository for at forstå, hvordan en ændring i utils/auth.ts kan ødelægge en komponent i views/Profile.tsx.

2. Mental eksekvering

Modellen “kører” koden i sin ræsonneringsblok. Den simulerer logikflowet og identificerer potentielle race conditions eller off-by-one-fejl.

3. Verifikation af begrænsninger

Hvis du beder om en løsning, der er “performant og ikke bruger eksterne biblioteker”, fungerer tænkemodus som gatekeeper. Hvis modellens første instinkt er at foreslå en NPM-pakke, vil tænkeprocessen fange den overtrædelse og tvinge modellen til at genoverveje en vanilla JavaScript-implementering.

Hvordan sammenlignes Thinking Mode med traditionel prompting?

Mange brugere kender til “Chain of Thought” (CoT)-prompting, hvor du beder modellen: “Tænk trin for trin.” Selvom det er effektivt, er det ikke det samme som Claude 4.5’s native Thinking Mode.

FunktionChain of Thought (manuel)Udvidet tænkning (indbygget)
MekanismeBruger-promptede instruktioner.Indbygget modelarkitektur.
Token-pladsOptager synlig output-plads.Optager et dedikeret internt blokrum.
SelvkorrektionBegrænset; modellen “dobbelt-nedtoner” ofte tidlige fejl.Høj; modellen kan forkaste en hel ræsonneringssti og starte forfra.
PålidelighedVariabel, afhængig af promptkvalitet.Konsekvent høj på tværs af komplekse domæner.
API-håndteringKræver manuel parsing af tekst.Strukturerede JSON-blokke for "thinking" og "text".

Hvordan fungerer tænkemodus i Claude 4.5?

Intern arbejdsgang (konceptuelt)

  1. Brugeranmodning: Din applikation sender en Messages API-anmodning med angivelse af model, prompt, max_tokens og valgfrit thinking: { type: "enabled", budget_tokens: N }.
  2. Intern ræsonnering: Claude udfører intern “tænkning” op til budgettet. Den registrerer ræsonneringsoutput som thinking-blokke (som kan blive opsummeret for brugeren).
  3. Outputkomposition: API’et returnerer et array af indholdsblokke. Typisk er rækkefølgen thinking-blok(ke) derefter text-blok(ke) (endeligt svar). Ved streaming modtager du thinking_delta-events efterfulgt af text_delta-events.
  4. Bevarelse af kontekst: Når du bruger værktøjer eller flertrinsflows, kan du gensende tidligere thinking-blokke (uændret), så Claude kan fortsætte kæden af tanke. Opus 4.5 introducerede adfærd til at bevare thinking-blokke som standard for cache/effektivitet.

Teknisk set bygger Thinking Mode på en specifik API-parameterkonfiguration, der allokerer et “budget” af tokens til ræsonnering.

Tokenbudget-konceptet

Når du laver en anmodning til Claude 4.5, skal du angive en budget_tokens-parameter. Dette er det maksimale antal tokens, modellen må bruge på sin interne monolog.

  • Lavt budget (<2.000 tokens): Godt til hurtige sanity checks eller simple logikopgaver.
  • Højt budget (10.000+ tokens): Kræves til kompleks softwarearkitektur, matematiske beviser eller udarbejdelse af omfattende juridiske notater.

Modellen er trænet til at “forvalte” dette budget. Hvis den fornemmer, at budgettet er ved at være opbrugt, vil den forsøge at runde ræsonneringen af og give det bedst mulige svar.

“Thinking Process”-livscyklus

Når en bruger spørger: “Write a Python script to scrape this website, but ensure it respects robots.txt and handles dynamic loading.”

  1. Indtagelse: Claude læser prompten.
  2. Tænkningsfase (skjult):
    • Selvkorrektion: “Jeg skal bruge Selenium eller Playwright til dynamisk indlæsning. requests vil ikke virke.”
    • Sikkerhedstjek: “Jeg skal verificere, at brugeren har tilladelse til at scrape. Jeg tilføjer en ansvarsfraskrivelse.”
    • Arkitektur: “Jeg vil strukturere koden med en klassebaseret tilgang for modularitet.”
  3. Outputfase (synlig): Claude genererer Python-koden.

I tidligere modeller ville AI’et måske være begyndt at skrive requests-kode med det samme, indse halvvejs, at det ikke ville virke for dynamisk indhold, og derefter enten hallucinere en løsning eller levere brudt kode. Tænkemodus forhindrer dette “malet op i et hjørne”-scenario.

Hvornår bør du aktivere tænkemodus — use cases og tommelfingerregler?

Use cases, der får størst udbytte

  • Kompleks kodning (arkitektoniske ændringer, refaktorering på tværs af filer, lange debug-sessioner). Sonnet 4.5 er eksplicit positioneret som førende inden for kodning og agentik, når tænkning bruges.
  • Agentiske arbejdsgange, der bruger værktøjer gentagne gange og skal bevare intern kontekst på tværs af mange trin. Indflettet tænkning + værktøjsbrug er et primært scenarie.
  • Dybdegående forskning eller analyse (statistisk analyse, finansiel strukturering, juridisk ræsonnering), hvor mellemregninger er værdifulde at inspicere eller verificere.

Hvornår du ikke bør aktivere det

  • Kort svargenerering eller høj-gennemstrømning med lav latenstid, hvor minimal latenstid er kritisk (f.eks. chat-UI’er, der kræver svartider på millisekundniveau).
  • Opgaver, hvor tokenomkostning pr. anmodning skal minimeres, og opgaven er simpel eller veldefineret.

Praktisk tommelfingerregel

Start med det minimale tænkningsbudget (≈1.024 tokens) og øg det gradvist for opgaver, der kræver mere dybde; benchmarket end-to-end opgavenøjagtighed vs. latenstid og tokens. For flertrins agentopgaver kan du eksperimentere med indflettet tænkning og cachede prompt-brudpunkter for at finde et sweet spot.

Konklusion

Claude 4.5’s Thinking Mode er mere end bare en funktion; det er en ny måde at interagere med kunstig intelligens på. Ved at adskille tankeprocessen fra tankeproduktet har Anthropic leveret et værktøj, der er mere pålideligt, mere transparent og mere i stand til at håndtere kompleksiteten i moderne virksomhedsarbejde.

Uanset om du bruger Claude Code CLI’en til at styre en massiv migrering eller udnytter API’et til at bygge næste generation af autonome agenter, er mestring af “tænkningsbudgettet” nøglen til succes.

Udviklere kan få adgang til Claude 4.5-modellen via CometAPI. For at komme i gang kan du udforske modellens kapaciteter på CometAPI i Playground og konsultere API-guiden for detaljerede instruktioner. Før adgang skal du sikre, at du er logget ind på CometAPI og har fået en API-nøgle. CometAPI tilbyder en pris langt lavere end den officielle pris for at hjælpe dig med at integrere.

Klar til at komme i gang?→ Gratis prøve af Claude 4.5!

Læs mere

500+ modeller i én API

Op til 20% rabat