Anthropics Claude 4.5-familie (særlig Sonnet 4.5 og Opus 4.5) bringer utvidet «tenkning»/kladdebok-lignende intern resonnering til Claude 4-serien. Messages API eksponerer denne funksjonen gjennom et thinking-objekt (aktivere/deaktivere + en budget_tokens-allokering), strømmealternativer og spesialhåndtering for «thinking»-innholdsblokker (inkludert signaturer og sladding). Sonnet 4.5 er rettet mot koding og agentiske oppgaver og drar stor nytte av utvidet tenkning; Opus 4.5 legger til bevarte thinking-blokker og andre optimaliseringer.
Hva er Claude 4.5?
Claude 4.5 (publisert i Anthropics familie av Claude-modeller som variantene Sonnet 4.5 og Opus 4.5) er selskapets nyeste generasjon store språkmodeller, finjustert for dypere resonnering, langtidskontekst og kode/agentiske arbeidsflyter i produksjonskvalitet. I Anthropics kunngjøringer og produktsider beskrives Sonnet 4.5 som et stort steg fremover for koding, agentbygging og «å bruke datamaskiner» (dvs. verktøyassisterte arbeidsflyter og flerstegs automatisering), med målbare forbedringer på resonnering, matematikk og lang-kontekst-oppgaver.
4.5-familien
- Claude Sonnet 4.5 (Lansert 29. sep. 2025): «Arbeidshesten» i familien. Den er for tiden vurdert som verdens beste kodemodell, i stand til å opprettholde fokus på autonome oppgaver i over 30 timer. Den balanserer fart, kostnad og høy-nivå-resonnering, og er standardvalget for de fleste bedriftsapplikasjoner.
- Claude Haiku 4.5 (Lansert 15. okt. 2025): Den hastighetsoptimaliserte modellen. Overraskende nok støtter den nå Extended Thinking, og er den første «lille» modellen som tilbyr dyp resonnering tidligere forbeholdt frontmodellene. Ideell for høyfrekvente oppgaver der latens betyr noe, men nøyaktighet ikke kan ofres.
- Claude Opus 4.5 (Lansert 24. nov. 2025): Frontier-intelligensmodellen. Opus 4.5 er designet for de mest komplekse, tvetydige oppgavene—som vitenskapelig forskning, ny arkitekturutforming og finansanalyse med høye innsatser. Den har den høyeste kapasiteten for «thinking»-budsjett og utmerker seg i selvkorreksjon.
Viktige egenskaper i korte trekk
- Større brukbare kontekstvinduer og forbedret atferd i langvarige oppgaver (agentiske arbeidsflyter, steg-for-steg-feilsøking, redigering av kodebaser).
- Bedre ytelse på kodebenchmarker, refaktorering og flerstegs verktøybrukende oppgaver (Sonnet- og Opus-familien).
- Avanserte «thinking»-funksjoner (det Anthropic kaller extended thinking / thinking mode) som valgfritt eksponerer noe av modellens interne trinnvise resonnement for utvikleren eller lar modellen bruke et konfigurerbart «budsjett» av tokens til å resonnere før den gir et endelig svar.
Hvor kan du kjøre Claude 4.5
Claude 4.5 (Sonnet/Opus) er tilgjengelig via Anthropics egen API og er integrert i CometAPI(API-prising er for tiden på salg, omtrent 20 % av Anthropics pris.), så du kan kjøre disse modellene gjennom Anthropics plattform eller via tredjeparts skyleverandører som hoster modellen.
Hva er ny TENKEMODUS i Claude Code og Claude 4.5?
Anthropics extended thinking (også kalt «thinking mode», «thinking blocks» eller «thinking tokens») er en funksjon som lar modellen utføre flere interne sampling-trinn for å resonnere mer grundig før den gir et endelig svar. Du aktiverer den ved å legge til en thinking-konfigurasjon i Messages API-forespørselen din (for eksempel: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) eller ved å bruke Anthropic SDK-hjelpere. Når den er aktivert, vil API-et (avhengig av modellen) enten returnere en oppsummert versjon av den interne resonneringen eller returnere hele resonneringen (med sladding av hensyn til sikkerhet).
For å forstå hvorfor «Thinking Mode» er revolusjonerende, må vi se på hvordan store språkmodeller (LLM-er) tradisjonelt opererer. Standardmodeller er «probabilistiske tekstgeneratorer»—de predikerer neste token umiddelbart etter at de har mottatt en prompt. De «stopper ikke opp for å tenke»; de begynner å snakke (generere) med en gang.
Skiftet til «Utvidet tenkning»
Thinking Mode endrer dette paradigmet. Når aktivert, genererer Claude 4.5 en skjult strøm av «thinking tokens» før den gir brukeren et eneste synlig tegn.
Synlig resonnement (valgfritt): I noen grensesnitt som Claude.ai kan du se en «Thinking»-rullegardin som viser modellens interne monolog.
Skjult resonnement (API): I API-et er dette distinkte thinking-blokker. Modellen bruker dette rommet til å:
- Dekonstruere prompten: Bryte ned komplekse begrensninger.
- Planlegge en strategi: Skissere steg-for-steg-logikk.
- Utkast og kritikk: Prøve en løsning mentalt, finne en feil og korrigere den før svaret presenteres.
Innflettet tenkning
En stor innovasjon i Sonnet 4.5 er Innflettet tenkning. I agentiske arbeidsflyter (der AI bruker verktøy som kalkulator, kodeinterpreter eller nettleser), ville standardmodeller bare kalle et verktøy, få et resultat og umiddelbart kalle neste verktøy.
Med innflettet tenkning kan Claude 4.5:
- Tenke over brukerens forespørsel.
- Kalle verktøy A (f.eks. søke på nettet).
- Tenke over søkeresultatene («Dette resultatet er utdatert, jeg bør prøve en annen spørring»).
- Kalle verktøy B (f.eks. søke igjen).
- Tenke på hvordan dataene skal syntetiseres.
- Endelig respons.
Denne «Tenk–Handle–Tenk–Handle»-sløyfen reduserer dramatisk hallusinasjoner og feilspredning i lange, flerstegs kodeoppgaver.
Hvordan Claude Code viser tenkning i utviklerverktøy
I Claude Code (CLI-/editoropplevelsen) har Anthropic lagt til UI-mekanismer for å slå tenkemodus av/på i interaktive økter (en vanlig UX er å trykke Tab for å slå tenkning av/på) og for å vise indikatorer for gjeldende tenkningsbudsjett. Noen eldre trigger-nøkkelord (f.eks. think, think hard) ble historisk brukt til å kontrollere tenkedybde; moderne versjoner baserer seg på eksplisitte av/på-brytere og budsjettparametere, med ultrathink fortsatt tilgjengelig i noen kontekster. Konfigurasjonen kan være global i ~/.claude/settings.json eller overstyres per forespørsel.
Hvordan implementerer du tenkemodus i Claude 4.5?
For utviklere krever overgangen til Claude 4.5 en endring i hvordan API-forespørsler struktureres. Du sender ikke lenger bare en prompt; du administrerer et «tenkningsbudsjett».
Angi tenkningsbudsjettet
thinking-parameteren er nå en førsteordens parameter i Anthropic API. Du må eksplisitt aktivere den og definere en budget_tokens-verdi. Denne verdien representerer maksimum beregning modellen kan bruke på sin interne resonnering.
Python-implementeringseksempel
Følgende kode demonstrerer hvordan du initialiserer en Claude 4.5-økt med Extended Thinking aktivert.
import anthropic
# Initialiser Gemini Enterprise-perspektivet på integrasjon med Claude 4.5
client = anthropic.Anthropic(api_key="your_api_key")
def get_reasoned_response(user_query):
# Vi setter en høy max_tokens for å romme både tenkingen og det endelige svaret
# budget_tokens må være mindre enn max_tokens
response = client.messages.create(
model="claude-4-5-sonnet-202512",
max_tokens=20000,
thinking={
"type": "enabled",
"budget_tokens": 12000 # Allokerer 12k tokens til 'thinking'
},
messages=[
{"role": "user", "content": user_query}
]
)
# Ekstraherer de to distinkte delene av responsen
thinking_content = ""
final_output = ""
for block in response.content:
if block.type == "thinking":
thinking_content = block.thinking
elif block.type == "text":
final_output = block.text
return thinking_content, final_output
# Eksempel på kompleks forespørsel
query = "Design et system for nullkunnskapsbevis for en desentralisert stemmeapp ved bruk av Circom."
thoughts, answer = get_reasoned_response(query)
print("--- CLAUDES INTERNE RESONNERING ---")
print(thoughts)
print("\n--- ENDELIG TEKNISK ARKITEKTUR ---")
print(answer)
Viktige tekniske hensyn
- Totalt tokenforbruk: Ditt totale forbruk er
thinking_tokens+output_tokens. Hvis du setter et budsjett på 10,000 tokens og modellen bruker 8,000 til tenkning og 2,000 til svaret, blir du fakturert for 10,000 utgående tokens. - Tvungen tenkning: Hvis oppgaven er for enkel, kan modellen fortsatt bruke et minimum antall thinking-tokens for å verifisere enkelheten i forespørselen.
Hvordan forbedrer tenkemodus kodegenerering?
En av de mest betydelige oppgraderingene i Claude 4.5 er ytelsen i Claude Code CLI. Når Claude 4.5 «tenker» om kode, utfører den flere skjulte handlinger som standardmodeller overser.
1. Avhengighetskartlegging
Før den skriver en eneste linje med fiks, gjennomgår Claude 4.5 repoen din for å forstå hvordan en endring i utils/auth.ts kan bryte en komponent i views/Profile.tsx.
2. Mental kjøring
Modellen «kjører» koden i sin resonneringsblokk. Den simulerer logikkflyten og identifiserer potensielle race conditions eller off-by-one-feil.
3. Verifisering av begrensninger
Hvis du ber om en løsning som er «ytelseseffektiv og bruker ingen eksterne biblioteker», fungerer tenkemodus som portvokter. Hvis modellens første instinkt er å foreslå en NPM-pakke, vil tenkeprosessen fange den overtredelsen og tvinge modellen til å tenke om en vanilla JavaScript-implementering.
Hvordan sammenlignes tenkemodus med tradisjonell prompting?
Mange brukere er kjent med «Chain of Thought» (CoT)-prompting, der du sier til modellen: «Tenk steg for steg.» Det er effektivt, men er ikke det samme som Claude 4.5s innebygde tenkemodus.
| Funksjon | Chain of Thought (manuell) | Utvidet tenkning (innebygd) |
|---|---|---|
| Mekanisme | Brukerstyrte instruksjoner. | Innebygd modellarkitektur. |
| Token-plass | Opptar synlig utdata-plass. | Opptar en dedikert intern blokk. |
| Selvkorreksjon | Begrenset; modellen «dobler ned» på tidlige feil. | Høy; modellen kan forkaste en hel resonneringssti og starte på nytt. |
| Pålitelighet | Variabel basert på prompt-kvalitet. | Konsekvent høy på tvers av komplekse domener. |
| API-håndtering | Krever manuell parsing av tekst. | Strukturerte JSON-blokker for «thinking» og «text». |
Hvordan fungerer tenkemodus i Claude 4.5?
Intern arbeidsflyt (konseptuelt)
- Brukerforespørsel: Applikasjonen din sender en Messages API-forespørsel som spesifiserer modell, prompt,
max_tokens, og eventueltthinking: { type: "enabled", budget_tokens: N }. - Intern resonnering: Claude utfører intern «tenkning» opp til budsjettet. Den registrerer resonnement som
thinking-blokker (som kan oppsummeres for brukeren). - Sammensetning av output: API-et returnerer en matrise av innholdsblokker. Typisk er rekkefølgen
thinking-blokk(er) derettertext-blokk(er) (endelig svar). Ved streaming mottar duthinking_delta-hendelser etterfulgt avtext_delta-hendelser. - Bevare kontekst: Når du bruker verktøy eller fler-omgangs flyt, kan du sende tidligere thinking-blokker (uendret) på nytt, slik at Claude kan fortsette kjeden av tanke. Opus 4.5 introduserte at thinking-blokker bevares som standard for cache/effektivitet.
Teknisk sett baserer tenkemodus seg på en spesifikk API-parameterkonfigurasjon som allokerer et «budsjett» av tokens til resonnering.
Konseptet med token-budsjett
Når du gjør en forespørsel til Claude 4.5, må du spesifisere en budget_tokens-parameter. Dette er maksimum antall tokens modellen kan bruke på sin interne monolog.
- Lavt budsjett (<2,000 tokens): Bra for raske sanity-sjekker eller enkle logikkoppgaver.
- Høyt budsjett (10,000+ tokens): Kreves for kompleks programvarearkitektur, matematiske bevis eller å skrive omfattende juridiske dokumenter.
Modellen er trent til å «administrere» dette budsjettet. Hvis den merker at budsjettet er i ferd med å gå tomt, vil den forsøke å avslutte resonnementet og gi det beste mulige svaret.
Livssyklusen for «tenkeprosessen»
Når en bruker spør: "Write a Python script to scrape this website, but ensure it respects robots.txt and handles dynamic loading."
- Inntak: Claude leser prompten.
- Tenkefase (skjult):
- Selvkorreksjon: «Jeg må bruke Selenium eller Playwright for dynamisk lasting.
requestsvil ikke fungere.» - Sikkerhetssjekk: «Jeg må verifisere at brukeren har tillatelse til å skrape. Jeg vil legge til en disclaimer.»
- Arkitektur: «Jeg vil strukturere koden med en klassebasert tilnærming for modularitet.»
- Selvkorreksjon: «Jeg må bruke Selenium eller Playwright for dynamisk lasting.
- Outputfase (synlig): Claude genererer Python-koden.
I tidligere modeller kan AI-en ha begynt å skrive requests-kode umiddelbart, innsett halvveis at den ikke fungerer for dynamisk innhold, og deretter enten hallusinert en løsning eller levert ødelagt kode. Tenkemodus forhindrer dette «male seg inn i et hjørne»-scenariet.
Når bør du aktivere tenkemodus — bruksområder og tommelfingerregler?
Bruksområder som drar mest nytte
- Kompleks koding (arkitektoniske endringer, flerfil-refaktoreringer, lange feilsøkingsøkter). Sonnet 4.5 er eksplisitt posisjonert som en ledende modell for koding og agentikk når tenkning er aktivert.
- Agentiske arbeidsflyter som bruker verktøy gjentatte ganger og må bevare intern kontekst over mange steg. Innflettet tenkning + verktøybruk er et primært scenario.
- Dyp forskning eller analyse (statistisk analyse, finansstrukturering, juridisk resonnering) der mellomliggende resonnementstrinn er verdifulle å inspisere eller verifisere.
Når du ikke bør aktivere den
- Generering av korte svar eller høy-gjennomstrøms lav-latens API-er der minimal latens er kritisk (f.eks. chat-grensesnitt som krever responser på millisekundnivå).
- Oppgaver der tokenkostnad per forespørsel må minimeres og oppgaven er enkel eller godt spesifisert.
Praktisk heuristikk
Start med minimum tenkningsbudsjett (≈1,024 tokens) og øk gradvis for oppgaver som trenger mer dybde; mål ende-til-ende oppgavenøyaktighet mot latens og tokens. For flerstegs agentoppgaver, eksperimenter med innflettet tenkning og cachede prompt-«breakpoints» for å finne et sweet spot.
Konklusjon
Claude 4.5s tenkemodus er mer enn bare en funksjon; det er en ny måte å samhandle med kunstig intelligens på. Ved å skille prosessen med tenkning fra produktet av tenkning, har Anthropic gitt et verktøy som er mer pålitelig, mer transparent og mer kapabelt til å håndtere kompleksiteten i moderne bedriftsarbeid.
Enten du bruker Claude Code CLI for å håndtere en massiv migrering eller utnytter API-et for å bygge neste generasjon autonome agenter, er mestring av «tenkningsbudsjettet» nøkkelen til suksess.
Utviklere kan få tilgang til Claude 4.5-modellen via CometAPI. For å begynne, utforsk modellkapabilitetene til CometAPI i Playground og se API-guiden for detaljerte instruksjoner. Før tilgang, sørg for at du har logget inn på CometAPI og hentet API-nøkkelen. CometAPI tilbyr en pris langt lavere enn den offisielle prisen for å hjelpe deg å integrere.
Klar til å starte?→ Gratis prøve av Claude 4.5!
