Sådan bruger du Claude Opus 4.5 API

CometAPI
AnnaNov 24, 2025
Sådan bruger du Claude Opus 4.5 API

Anthropic udgav Claude Opus 4.5 i slutningen af ​​november 2025 som en mere kapabel og effektiv Opus-klassemodel målrettet professionel softwareudvikling, agentiske arbejdsgange og langsigtede opgaver. Den er tilgængelig via Anthropics udviklerplatform og via CometAPI, og den introducerer nye API-kontroller (især effort-parameteren), forbedrede computerværktøjer, udvidet tænkning og forbedringer af token-effektivitet, der er vigtige i produktion.

Nedenfor er en praktisk og professionel gennemgang: hvad der er ændret, hvordan man får adgang, hvordan man bruger de nye kontroller (indsats, udvidet tænkning, værktøjsbrug, filer/computerbrug), vejledning om omkostninger og optimering, sikkerheds-/styringsovervejelser og integrationsmønstre i den virkelige verden.

Hvad er Claude Opus 4.5 præcist, og hvorfor er det vigtigt?

Claude Opus 4.5 er Anthropics nyeste medlem af Opus-klassen (udgivet 24.-25. november 2025), der fokuserer på maksimal ræsonnement og kodningskapacitet, samtidig med at den forbedrer token-effektiviteten og tilbyder nye API-kontroller til at afbalancere omkostninger kontra grundighed. Anthropic positionerer Opus 4.5 som den "mest intelligente model", de har udgivet, med sigte på komplekse softwareudviklingsopgaver, langvarige agenter, regnearks-/Excel-automatisering og opgaver, der kræver vedvarende flertrinsræsonnement.

Hvad er de vigtigste opdateringer i Opus 4.5?

Anthropic designede Opus 4.5 for at forbedre dybde af ræsonnement og agent adfærd, samtidig med at udviklere får bedre kontrol over afvejninger mellem omkostninger og latenstid. Højdepunkterne i udgivelsen er:

  • Indsatsparameter (beta): en førsteklasses API-knap, der styrer, hvor meget "tænkebudget" Claude bruger på en anmodning (almindeligvis low, medium, high). Det påvirker ræsonnement, værktøjskald og interne "tænke"-tokens, så du kan justere hastighed vs. grundighed pr. kald i stedet for at skifte model. Dette er en signaturfunktion i Opus 4.5.
  • Bedre agent- og værktøjsorkestrering: forbedret præcision ved valg af værktøjer, bedre strukturerede værktøjskald og en mere robust værktøjsresultat-workflow for bygningsagenter og flertrins-pipelines. Anthropic leverer dokumentation og SDK-vejledning til "værktøjsbrugs"-flowet.
  • Token / omkostningseffektivitet — Anthropic rapporterer op til ~50% reduktioner i token-brug for nogle arbejdsgange sammenlignet med Sonnet 4.5, plus færre værktøjskaldsfejl og færre iterationer for komplekse ingeniøropgaver.
  • Forbedrede multimodale muligheder: Omfattende forbedringer i visuel, ræsonnements- og matematisk præstation.
  • Kontekstvinduet er udvidet til 200 tokens, hvilket understøtter dybe, lange samtaler og kompleks dokumentanalyse.

Hvilke praktiske færdigheder blev forbedret?

Opgradering af ydeevne

  • Bedre agent- og værktøjsorkestrering: forbedret nøjagtighed ved valg af værktøjer, bedre strukturerede værktøjskald og en mere robust værktøjsresultat-workflow til opbygning af agenter og flertrins-pipelines. Anthropic leverer dokumentation og SDK-vejledning til "værktøjsbrugs"-flowet. Forbedret konteksthåndtering, komprimeringshjælpere til lange agentkørsler og førsteklasses værktøjs-SDK'er til registrering og validering af værktøjer betyder, at Opus 4.5 er bedre til opbygning af agenter, der kører uovervåget i mange trin.
  • Forbedrede multimodale muligheder: Omfattende forbedringer i visuel, ræsonnements- og matematisk præstation.
  • Kontekstvinduet er udvidet til 200 tokens, hvilket understøtter dybe, lange samtaler og kompleks dokumentanalyse.

Kodning og langsigtet arbejde

Opus 4.5 fortsætter med at være benchmark-drevet til kodningsopgaver; det reducerer antallet af iterationer og værktøjskaldsfejl under lange job (kodemigrering, refaktorering, flertrinsfejlfinding). Tidlige rapporter og Anthropics systemkort nævner forbedret vedvarende ydeevne på tekniske benchmarks og dramatiske effektivitetsforbedringer i værktøjsdrevne pipelines.

In SWE-bænk, Opus 4.5 rapporterer førende scorer på softwareudviklingsbenchmarks (Anthropic angiver en 80.9% på SWE-bench Verified i lanceringsmateriale), og kunder rapporterer forbedringer på debugging, redigering af flere filer og kodeopgaver med lang horisont.

Claude Opus 4.5-SWE-1

Omkostninger og effektivitet

Anthropic designede Opus 4.5 for at forbedre dybde af ræsonnement og agent adfærd, samtidig med at udviklere får bedre kontrol over afvejninger mellem omkostninger og latenstid:

  • Prisreduktion Sammenlign med Opus 4.1: $5 (input) / $25 (output) pr. million tokens.
  • Forbedring af tokenbrug: Gennemsnitlig reduktion på 50-75% i forbrug, samtidig med at ydeevnen opretholdes.
  • en førsteklasses API-knap, der styrer, hvor meget "tænkebudget" Claude bruger på en anmodning (almindeligvis low, medium, high). Det påvirker ræsonnement, værktøjskald og interne "tænknings"-tokens, så du kan justere hastighed vs. grundighed pr. kald i stedet for at skifte model. Dette er en signaturfunktion i Opus 4.5 (sammenlignet med Sonnet 4.5: Mellem indsats → 76 % færre tokens, sammenlignelig ydeevne; Høj indsats → 4.3 % ydeevneforbedring, 48 % reduktion i tokenbrug).

Hvordan får jeg adgang til og bruger Claude Opus 4.5 API?

Hvordan kan jeg få adgang og nøgler?

  1. Opret en Anthropic / Claude Developer-konto. Tilmeld dig på Claude/Anthropic-udviklerportalen, og opret en API-nøgle via konsollen (der findes organisations-/administratorflows for teams). Messages API'en er det primære slutpunkt for chat-/assistentlignende interaktioner.
  2. Cloud-partnere: Opus 4.5 er også tilgængelig via store cloud-markedspladser Google Vertex AI, CometAPI(En AI API-aggregeringsplatform, skal bruge dens godkendelse)), I CometAPI kan du få adgang til Claude opus 4.5 API via Anthropic Messages-format og Chat-format.

Hvordan skal jeg godkende mine anmodninger?

Brug standardbærertokens: inkluder en Authorization: Bearer $_API_KEY header med hvert API-kald. Anmodninger er JSON over HTTPS; Messages API accepterer en liste over strukturerede meddelelser (system + bruger + assistent).

Lynstart — Python (officiel SDK)

Installer SDK'et:

pip install anthropic

Minimalt eksempel (synkront):

import os
from anthropic import Anthropic

# expects ANTHROPIC_API_KEY in env

client = Anthropic(api_key=os.environ)

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    max_tokens=512,
)

print(resp.content.text)  # SDK returns structured content blocks

Dette kald bruger den kanoniske Opus 4.5-modelidentifikator. For udbyderadministrerede slutpunkter (Vertex, CometAPI, Foundry) skal du følge udbyderdokumentationen for at konstruere klienten og angive udbyderens URL og nøgle (f.eks. https://api.cometapi.com/v1/messages for CometAPI).

Hurtigstart — Python (CometAPI)

Du skal logge ind på CometAPI og få en nøgle.

curl 
--location 
--request POST 'https://api.cometapi.com/v1/messages' \ 
--header 'Authorization: Bearer ' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "claude-opus-4-5-20251101", "max_tokens": 1000, "thinking": { "type": "enabled", "budget_tokens": 1000 }, "messages":  }'

Hvordan bruger jeg det nye indsats parameter og udvidet tænkning?

Hvad er det indsats parameter, og hvordan indstiller jeg den?

indsats parameter er en førsteklasses API-kontrol introduceret med Opus 4.5, der justerer, hvor meget intern beregning og tokenbudget modellen bruger på at producere sit output. Typiske værdier er low, mediumog highBrug den til at afbalancere latenstid og tokenomkostninger versus grundighed:

  • low — hurtige, token-effektive svar til automatisering med høj volumen og rutineopgaver.
  • medium — afbalanceret kvalitet/omkostninger til produktionsbrug.
  • high — dybdegående analyse, flertrinsræsonnement eller når nøjagtighed er mest vigtigt.

Antropisk introduceret effort for Opus 4.5 (beta). Du skal inkludere en beta-header (f.eks. effort-2025-11-24) og specificér output_config: { "effort": "low|medium|high" } (eksempel vist nedenfor). high er standardadfærden. Reduceret indsats reducerer tokenbrug og latenstid, men kan i beskeden grad reducere grundigheden. Brug den til opgaver med høj gennemløbshastighed eller latenstidsfølsomme opgaver.

Eksempel:

# Example using the beta messages API shown in Anthropic docs

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

response = client.beta.messages.create(
    model="claude-opus-4-5-20251101",
    betas=,   # required beta header

    messages=,
    max_tokens=1500,
    output_config={"effort": "medium"}  # low | medium | high

)

print(response)

Hvornår skal man bruge hvilken: brug low til automatiserede pipelines (f.eks. e-mailkategorisering) medium for standardassistenter, og high til kodegenerering, dybdegående research eller risikofølsomme opgaver. Anthropic fremhæver denne parameter som en nøglekontrol for Opus 4.5.

I SWE-bænktesten:

  • I tilstanden Medium Effort: ydeevnen er sammenlignelig med Sonnet 4.5, men outputtokens er reduceret med 76%;
  • I High Effort-tilstand: ydeevnen overstiger Sonnet 4.5 med cirka 4.3 procentpoint, og tokens reduceres med 48%.

Claude Opus 4.5-SWE-2

Hvad er udvidet tænkning, og hvordan aktiverer jeg den?

Udvidet tænkning (også kaldet "udvidet tænkning" eller "tænkeblokke") lader modellen udføre mellemliggende tankekæder eller trinvis ræsonnement, mens den valgfrit bevarer eller opsummerer de interne tankeblokke. Messages API understøtter denne adfærd, og Anthropic har tilføjet kontroller til at bevare tidligere tankeblokke, så multi-turn agenter kan genbruge tidligere ræsonnement uden at gentage dyr genberegning. Brug udvidet tænkning, når opgaven kræver flertrinsplanlægning, langsigtet problemløsning eller værktøjsorkestrering.

Hvordan integrerer jeg værktøjer og build-agenter med Opus 4.5?

En af Opus 4.5's største styrker er forbedringen brug af værktøjDefiner værktøjer i din klient, lad Claude bestemme, hvornår de skal kaldes, udføre værktøjet og returnere tool_result — Claude vil bruge disse resultater i sit endelige svar. Anthropic leverer Agent SDK'er, der giver dig mulighed for at registrere typebestemte værktøjsfunktioner (f.eks. run_shell, call_api, search_docs) som Claude kan opdage og kalde under udvidet tænkning. Platformen konverterer værktøjsdefinitioner til kaldbare funktioner, som modellen kan kalde og modtage resultater fra. Sådan opbygger du agentiske arbejdsgange sikkert (med kontrollerede input/output).

Nedenfor er et praktisk mønster og et end-to-end Python-eksempel.

Værktøjsbrugsmønster (konceptuelt)

  1. Kundeforsyninger tools metadata med navn, beskrivelse og JSON-skema (input_schema).
  2. Modellen returnerer en tool_use blokere (modellens strukturerede instruktion til at kalde et bestemt værktøj med specifikke input). API-svaret stop_reason kan være tool_use.
  3. Klienten udfører værktøjet (din kode kalder den eksterne API eller lokale funktion).
  4. Klienten sender en opfølgende besked med role:"user" og en tool_result indholdsblok, der indeholder værktøjets output.
  5. Modellen bruger værktøjsresultatet og returnerer endeligt svar eller yderligere værktøjskald.

Dette flow giver sikker klientsidekontrol over, hvad modellen udfører (modellen foreslår værktøjskald; du styrer udførelsen).

Eksempel på alt — Python (simpelt vejrværktøj)

# 1) Define tools metadata and send initial request

from anthropic import Anthropic
import os, json

client = Anthropic(api_key=os.environ)

tools = [
    {
        "name": "get_weather",
        "description": "Return the current weather for a given city.",
        "input_schema": {"type":"object","properties":{"city":{"type":"string"}},"required":}
    }
]

resp = client.messages.create(
    model="claude-opus-4-5-20251101",
    messages=,
    tools=tools,
    max_tokens=800,
)

# 2) Check if Claude wants a tool call

stop_reason = resp.stop_reason  # SDK field

if stop_reason == "tool_use":
    # Extract the tool call (format varies by SDK; this is schematic)

    tool_call = resp.tool_calls  # e.g., {"name":"get_weather", "input":{"city":"Tokyo"}}

    tool_name = tool_call
    tool_input = tool_call

    # 3) Execute the tool client-side (here: stub)

    def get_weather(city):
        # Replace this stub with a real weather API call

        return {"temp_c": 12, "condition": "Partly cloudy"}

    tool_result = get_weather(tool_input)

    # 4) Send tool_result back to Claude

    follow_up = client.messages.create(
        model="claude-opus-4-5-20251101",
        messages=[
            {"role":"user", "content":[{"type":"tool_result",
                                        "tool_use_id": resp.tool_use_id,
                                        "content": json.dumps(tool_result)}]}
        ],
        max_tokens=512,
    )

    print(follow_up.content.text)
else:
    print(resp.content.text)

Hvordan bør du strukturere agenter for at sikre pålidelighed?

  • Rens værktøjsinput (undgå injektion via prompter).
  • Valider værktøjsoutput før de sendes tilbage til modellen (skematjek).
  • Begræns værktøjsomfang (princippet om mindste privilegier).
  • Brug komprimeringshjælpemidler (fra Anthropic SDK'er) for at holde kontekst håndterbar over lange kørsler.

Hvordan skal jeg designe prompts og strukturere beskeder til Opus 4.5?

Hvilke beskedroller og forudfyldningsstrategier fungerer bedst?

Brug et tredelt mønster:

  • Systemkrav (rolle: system): globale instruktioner — tone, rækværk, rolle.
  • Assistant (valgfrit): standardeksempler eller indledende indhold.
  • Bruger (rolle: bruger): den umiddelbare anmodning.

Udfyld systemmeddelelsen på forhånd med begrænsninger (format, længde, sikkerhedspolitik, JSON-skema, hvis du ønsker struktureret output). For agenter skal du inkludere værktøjsspecifikationer og brugseksempler, så Opus 4.5 kan kalde disse værktøjer korrekt.

Hvordan bruger jeg kontekstkomprimering og promptcaching til at gemme tokens?

  • Kontekstkomprimering: komprimere ældre dele af en samtale til præcise resuméer, som modellen stadig kan bruge. Opus 4.5 understøtter automatisering for at komprimere kontekst uden at miste kritiske argumentationsblokke.
  • Hurtig caching: Cachemodelsvar for gentagne prompts (Anthropic leverer prompt-cachingmønstre for at reducere latenstid/omkostninger).

Begge funktioner reducerer token-fodaftrykket ved lange interaktioner og anbefales til langvarige agentarbejdsgange og produktionsassistenter.

Fejlhåndtering og bedste praksis

Nedenfor er pragmatiske anbefalinger til pålidelighed og sikkerhed for produktionsintegration med Opus 4.5.

Pålidelighed og genforsøg

  • Håndteringshastighedsgrænser (HTTP 429) med eksponentiel tilbageslag og jitter (starter ved 500-1000 ms).
  • IdempotensFor ikke-muterende LLM-kald kan du trygt forsøge igen, men vær forsigtig i arbejdsgange, hvor modellen udløser eksterne bivirkninger (værktøjskald) — deduplikér ved sporing tool_use_id eller dine egne anmodnings-ID'er.
  • Streamingstabilitet: håndter delvise strømme og genopret forbindelsen problemfrit; hvis der opstår en afbrydelse, foretrækkes det at gentage hele anmodningen eller genoptage ved hjælp af applikationsniveautilstand for at undgå inkonsistente værktøjsinteraktioner.

Sikkerhed og tryghed

  • Hurtig injektion og værktøjssikkerhed: aldrig tillad modellen at udføre vilkårlige shell-kommandoer eller kode direkte uden validering. Valider altid værktøjsinput og rengør output. Modellen foreslår værktøjskald; din kode afgør, om de skal køres. Anthropics systemkort og dokumentation beskriver justeringsbegrænsninger og sikkerhedsniveauer – følg dem for højrisikodomæner.
  • Datahåndtering og compliance: Behandl prompts og værktøjsinput/output, der indeholder PII eller regulerede data, i henhold til jeres juridiske/compliance-politik. Brug udbyderens VPC/virksomhedskontroller, hvis I har strenge krav til dataopbevaring eller revision (Bedrock/Vertex/Foundry tilbyder virksomhedsmuligheder).

Observerbarhed og omkostningskontrol

  • Logmetadata for anmodninger/svar (ikke råt følsomt indhold, medmindre det er tilladt) — tokenantal, effort niveau, latenstid, model-id og udbyder. Disse metrikker er afgørende for omkostningstildeling og fejlfinding.
  • Brug indsatsen til at kontrollere omkostningerne pr. opkaldforetrækker low indsats for rutinemæssig opsummering eller endepunkter med høj QPS; brug high indsats for dybdegående fejlfinding eller undersøgelser. Overvåg kvalitet vs. tokenforbrug for at vælge standardindstillinger for forskellige slutpunkter.

Konklusion — Hvornår (og hvordan) bør du vælge Opus 4.5?

Claude Opus 4.5 er et naturligt valg, når dit produkt har brug for:

  • dyb flertrinsræsonnement (lange kæder af logik, research eller debugging),
  • robust agent-/værktøjsorkestrering (komplekse arbejdsgange, der aktiverer eksterne API'er), eller
  • Kodeassistance i produktionskvalitet på tværs af store kodebaser.

Operationelt brug indsats at finjustere budgetter pr. opkald; stol på værktøjets brugsmønster for at opretholde udførelsessikkerheden og vælg en cloud-partner (eller Anthropic API direct) baseret på dine compliance-behov. Benchmark med dit eget korpus: leverandørnumre (SWE-bench osv.) er nyttige signaler, men din reelle opgave og data bestemmer ROI. Af sikkerhedsmæssige årsager skal du følge Opus 4.5-systemkortet og sætte rækværk omkring værktøjsudførelse og PII-håndtering.

Udviklere kan få adgang Claude Opus 4.5 API gennem CometAPI. For at begynde, udforsk modellens mulighederCometAPI i Legeplads og se API-vejledningen for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen. CometAPI tilbyde en pris, der er langt lavere end den officielle pris, for at hjælpe dig med at integrere.

Klar til at gå? → Tilmeld dig CometAPI i dag !

Hvis du vil vide flere tips, guider og nyheder om AI, følg os på VKX og Discord!

Læs mere

500+ modeller i én API

Op til 20% rabat