OpenAI lancerer GPT-5.4-serien: hvad GPT-5.4 ændrer

OpenAIs seneste udgivelse, GPT-5.4, kommer som en målrettet modelfamilie til “professionelt arbejde” med to primære varianter — GPT-5.4 Thinking og GPT-5.4 Pro — og et stærkt fokus på dokumentarbejde med lang kontekst, native computerbrug (agent)-kapaciteter samt forbedret faktualitet og opgaveydelse på tværs af kontor-, juridiske og finansielle arbejdsgange. Udgivelsen følger tidligere opdateringer i GPT-5-linjen (især GPT-5.3 Instant og GPT-5.3-Codex) og bringer målbare forbedringer på interne og offentlige benchmarks, dybere værktøjsintegration (inklusive et ChatGPT for Excel‑plug-in) og en større understøttet kontekst (angiver op til 1,000,000 tokens).

Nu understøtter CometAPI GPT-5.4 og GPT-5.4 Pro, og tilbyder dem med rabatter.

Hvad er GPT-5.4?

Positionering og varianter

GPT-5.4 præsenteres af OpenAI som den mest kapable model i GPT-5-serien, tunet til arbejdsflows, der er professionelle, dokumenttunge og agentiske. Den tilbydes i mindst to offentliggjorte varianter:

GPT-5.4 Thinking — en ræsonneringsfokuseret variant, der eksponerer mere af modellens tankeproces og er optimeret til flertrinsræsonnering og agentiske opgaver (tilgængelig i ChatGPT som “Thinking”-tilstand).
GPT-5.4 Pro — et prioriteret inferensniveau med højere beregningsressourcer til høj gennemstrømning eller latenstidsfølsomme virksomhedsarbejdslaster, med højere API-priser (afspejler den ekstra beregning).

OpenAI fremhæver GPT-5.4’s native computer-use-kapaciteter — som gør det muligt for modeller at betjene software via programmatisk mus-/tastaturstyring og orkestrere multi-værktøjssekvenser — hvilket positioneres som et spring fremad for opbygning af egentlige opgaveudførende agenter.

Nye og fremhævede kapaciteter

Understøttelse af lang kontekst: GPT-5.4 siges at understøtte meget store kontekster (understøtter op til 1,000,000 tokens i ChatGPT- og Codex-kontekster), så modellen kan holde enorme projekter, bøger, kodebaser eller datasæt “i hukommelsen” under en session. Det er transformativt for dokumentgennemgang, juridiske kontrakter og multifil-ingeniørprojekter.
Native computerbrug / agenting: GPT-5.4 er OpenAIs første generelle model med native computer-use-kapaciteter — den kan generere sekvenser af UI-handlinger og kode til at betjene software (f.eks. via Playwright eller ved at udsende mus-/tastaturkommandoer informeret af skærmbilleder). Denne kapabilitet er designet til, at udviklere kan bygge agenter, der fuldfører opgaver på tværs af web- og desktopapps.
Forbedrede Office-færdigheder: Markant fokus på regneark, præsentationer og dokumenter — med interne benchmarks, der viser store løft i regnearksmodellering, præsentationsæstetik og kvaliteten af dokumentudkast.
Faktualitet og reduktion af hallucinationer: OpenAI rapporterer færre faktuelle fejl relativt til tidligere modeller på internt kuraterede evalueringssæt (se benchmarks nedenfor).

Sammenlignet med tidligere modeller som GPT-5.2 Thinking og GPT-5.3 Codex, samler GPT-5.4 disse kapaciteter i en enkelt model designet til at håndtere langvarige opgaver og komplekse workflows med minimal brugerindgriben.

Nøglefunktioner og tekniske højdepunkter ved GPT-5.4

1) Enorme kontekstvinduer (op til 1,000,000 tokens)

Den mest synlige kapabilitet er understøttelsen af kontekstvinduer op til 1,000,000 tokens via API’et. Det udvider, hvad en enkelt modelsession kan rumme: hele bøger, lange kodebaser eller hele multi-dokument-dossierer uden at skulle chunkes på tværs af mange kald. For videnintensive virksomhedsworkflows (legal discovery, forskningssyntese, storskalakodeanalyse) reducerer evnen til at vedligeholde en million-tokens-kontekst behovet for lim-ingeniørarbejde og forbedrer kohærensen.

Implikation: workflows, der tidligere krævede orkestrering (retrieval, chunking, ekstern hukommelse), kan nu holde mere af råkonteksten i modellens arbejdshukommelse — hvilket forenkler pipelines og sænker latency/konsistens-afvejninger.

2. Native computer- og værktøjsbrug

OpenAI fremhæver en stærkere evne til robust at betjene softwareværktøjer og connectorer (f.eks. regneark, dokumentredaktører, kodekørselsmiljøer) end tidligere modeller. GPT-5.4 udvider tidligere “værktøjsbrug” med:

Bedre værktøjsvalg og -parametrering.
Mere pålidelig sekvensplanlægning ved kald af eksterne API’er eller gennemløb af UI-lignende handlinger.
Reduceret token-overhead for agentiske workflows via en smartere arkitektur for værktøjskald.

Agentiske og udviklerorienterede kapaciteter:

Desktop- og webautomatisering: Med eksplicit støtte til at udsende mus- og tastaturhandlinger informeret af skærmbilleder kan GPT-5.4 indlejres i agenter, der betjener reelle softwareworkflows (for eksempel udfyldning af formularer, navigation i dashboards eller kørsel af flertrinsprocedurer). OpenAI rapporterer state-of-the-art-resultater på OS-lignende benchmarks.
Værktøjsgrænseflade og styrbarhed: GPT-5.4 er mere styrbar via udviklerbeskeder og kan bedre beslutte, hvornår og hvordan der skal kaldes eksterne værktøjer, connectorer og API’er — en afgørende kapabilitet for at bygge pålidelige multi-værktøjsagenter, der minimerer unødvendige eller risikable handlinger.

Praktisk betydning: Automatiseringsopgaver (f.eks. “åbn dette regneark, beregn disse pivots, generér slidenoter”) kræver færre fejl/gentagelsescyklusser og mindre menneskelig supervision.

3) Fem niveauer af ræsonneringsindsats, ekstreme tilstande

OpenAI angiver flere niveauer af ræsonneringsindsats — som giver brugere mulighed for at bytte latenstid/omkostning mod dybere intern chain-of-thought-beregning (tilstande omtales nogle gange uformelt som xhigh eller ekstrem ræsonnering). De er tiltænkt problemer, hvor mere intern overvejelse væsentligt forbedrer korrekthed (komplekse beviser, lange kodetransformationer, flertrins finansielle analyser). API-prissætning og fakturering afspejler det ekstra modelarbejde, der udføres under disse tilstande.

Praktisk betydning: Denne opdeling lader kunder vælge de afvejninger, der passer til deres arbejdsbelastninger, i stedet for at forlange, at en enkelt model skal være “alt i én”.

4) Produktivitet og indholdsproduktion

Regnearksmodellering: GPT-5.4 viser stærke forbedringer på regnearksopgaver, som sandsynligvis bruges i revision, finans og analyseworkflows. OpenAI rapporterer en gennemsnitlig score på 87.3% på interne opgaver i stil med “investment banking-modellering” for GPT-5.4 vs. 68.4% for GPT-5.2. Det er et markant løft i opgavenøjagtighed for numerisk modellering og formelkonstruktion.
Præsentationer og visuelt output: Menneskelige bedømmere foretrak præsentationer genereret af GPT-5.4 i 68.0% af tilfældene frem for dem fra GPT-5.2 på grund af bedre æstetik, variation og integration med billedgenerering. Det afspejler forbedringer i både indhold og form ved produktion af slidedecks.
Dokumentudkast og lange tekster: GPT-5.4 blev optimeret til at opretholde konsistens på tværs af lange dokumenter, bedre citationsadfærd og færre interne modsigelser ved håndtering af store kontekster, takket være det udvidede kontekstvindue og dedikeret ræsonneringstuning.

5) Sikkerhed, afbødninger og cybermæssige hensyn

Reducerede hallucinationer: OpenAI rapporterer, at på et sæt af de-identificerede prompts, hvor brugere påpegede faktuelle fejl, er individuelle påstande fra GPT-5.4 33% mindre tilbøjelige til at være forkerte, og fulde svar er 18% mindre tilbøjelige til at indeholde nogen fejl, relativt til GPT-5.2 — en nøgletal for virksomhedsadoption, hvor faktuel nøjagtighed er vigtig.
Cybersikkerhedsafværgning (Thinking-varianten): GPT-5.4 Thinking fremhæver et udvidet sæt af afbødninger for cyberrisici og bygger videre på beskyttelser, der blev brugt i tidligere Codex/5.3-modeller. GPT-5.4 Thinking blev designet med ekstra værn mod misbrugsscenarier med høj kapabilitet.

Ydelsesbenchmarks — hvad tallene siger

OpenAI og flere medier offentliggjorde tidlige benchmarkresultater som en del af udrulningen. Fordi forskellige benchmarks tester forskellige kapaciteter (webnavigation vs. domæneviden vs. sikkerhed), er det nyttigt at samle hovedtallene og hvad de betyder.

OpenAI lancerer GPT-5.4-serien: hvad GPT-5.4 ændrer

Rapporterede resultater viser markante forbedringer i forhold til tidligere medlemmer af GPT-5.x-familien og tæt konkurrence med andre topmodeller.

Benchmarks for web- og desktopinteraktion

WebArena-Verified (browserbrugstests): GPT-5.4 opnår 67.3% succes ved brug af både DOM- og skærmbilledesignaler, sammenlignet med GPT-5.2’s 65.4% — et synligt men ikke overvældende løft. Dette måler opgaver, hvor modellen skal interagere med live-sider og UI-elementer.
Online-Mind2Web (skærmbilledbaserede browseropgaver): GPT-5.4 nåede 92.8% succes ved kun at bruge skærmbilledobservationer — en særligt stærk forbedring i forhold til tidligere agentlignende baselinjer (OpenAI sammenlignede dette med ChatGPT Atlas’ Agent Mode-ydelse).
OSWorld-Verified (desktopnavigation): uafhængig rapportering indikerede, at GPT-5.4 scorede 75.0% på en benchmark, der vurderer navigation i desktopmiljøer og opgavefuldførelse. Det placerede 5.4 foran mange offentlige baselinjer for ende-til-ende-automatiseringsopgaver.

Konklusion: Forbedringerne i 5.4 er mest udtalte, hvor forståelse af visuelt kontekst, UI-muligheder og lange handlingssekvenser er vigtige — dvs. agentiske workflows.

Benchmarks for sundhed, sikkerhed og viden

OpenAIs rapportering om implementeringssikkerhed viser blandede signaler:

HealthBench: GPT-5.4 scorede 62.6% på HealthBench (et moderat fald fra GPT-5.2’s 63.3%), hvilket indikerer subtile afvejninger mellem kapabilitet og visse sundhedsrelaterede evalueringsmetrikker i de snapshot-tests, OpenAI rapporterede.
Hard: GPT-5.4 scorede 40.1% på en “Hard”-evalueringssuite (en smule ned fra 42.0%).
Consensus: GPT-5.4 opnåede 96.6% på “Consensus”, en metrik, der afspejler overensstemmelse med kuraterede konsensussvar (en stigning på ~2.1 point).

OpenAI bemærkede også ændringer i gennemsnitlig svarlængde på sundhedsevalueringer (GPT-5.4 i gennemsnit ~3,311 tegn vs. 2,676 for GPT-5.2), hvilket kan påvirke, hvordan en model indrammer følsomme emner.

Fortolkning: Sikkerheds- og sundhedsmetrikkerne viser, at 5.4 samlet set øgede konsensusjustering og ændrede svarfylde, selv om nogle snævre sundhedsscorer faldt en smule. Dette mønster afspejler ofte en omkalibrering af modelmål — mere beslutsomme, længere svar kan styrke nytteværdi og konsensus, mens de kræver omhyggelig monitorering på følsomme områder.

Domænespecifikke eksempler og påstande

Tidlige tests gav konkrete, domænespecifikke påstande (OpenAI og tredjepartskilder):

Legal reasoning-benchmark (BigLaw Bench) — GPT-5.4 opnåede ~91% på juridiske ræsonneringsdele i tidlige tests, et stærkt signal for dokumentanalyseopgaver; bemærk at dette er tidlige, ikke-peer reviewede tal.
Reducerede hallucinationer: GPT-5.4-svar er ~33% mindre tilbøjelige til at indeholde falske påstande og ~18% mindre tilbøjelige til at indeholde faktuelle fejl sammenlignet med visse tidligere baselinjer. Disse procenter blev fremhævet i sekundær rapportering og virksomhedsmeddelelser; som med alle sådanne påstande afhænger de af benchmarksuiten og stikprøvemethodikken.

Sådan får du adgang til og betaler for GPT-5.4

ChatGPT-abonnementer og virksomhedsadgang

Ifølge OpenAI og produktrapportering:

Brugere af ChatGPT Plus / Team / Pro var de første, der fik GPT-5.4 Thinking i produktet. Enterprise- og Education-administratorer kan aktivere tidlig adgang via admin-kontroller. Free/Go-brugere er ikke garanteret øjeblikkelig adgang. Udviklere kan kalde gpt-5.4 og gpt-5.4-pro-endpoints via API’et.

API-prisoversigt (offentlige udviklerpriser)

OpenAIs udviklerpriser lister GPT-5.4 som en frontmodul med pris per token. Som offentliggjort på den offentlige prisside på tidspunktet for annonceringen er eksempler på satser for GPT-5.4 omtrent:

Model	Input	Cached input	Output
gpt-5.4 (<272K context length)	$2.50	$0.25	$15.00
gpt-5.4 (>272K context length)	$5.00	$0.50	$22.50
gpt-5.4-pro (<272K context length)	$30.00		$180.00
gpt-5.4-pro (>272K context length)	$60.00		$270.00

I CometAPI (en alt-i-én aggregationsplatform for store model-API’er):

Model	Comet Price (USD / M Tokens)	Official Price (USD / M Tokens)	Discount
gpt-5.4	Input:$2/M; Output:$16/M	Input:$2.5/M; Output:$20/M	-20%
gpt-5.4-pro	Input:$24/MOutput:$192/M	Input:$30/MOutput:$240/M	-20%

Derfor kan jeg varmt anbefale CometAPI, da det kan reducere API-omkostningerne betydeligt.

Overvejelser om omkostningsstyring

Hvis du planlægger at bruge modellen i skala, især i langdokument- eller høj-gennemstrømningsindstillinger, bør du overveje:

Caching og deduplikering af input (for at bruge cachet input-pris, hvor det er muligt).
Prompt engineering til at komprimere kontekst og undgå redundante tokens.
Batching-strategier og efterbehandling, der minimerer dyr outputgenerering.
Monitorering af ræsonneringstilstand, da dybere ræsonneringstilstande kan medføre højere beregningsomkostninger.

Sammenligning: GPT-5.4 vs GPT-5.3

Hvor GPT-5.4 forbedrer sig i forhold til GPT-5.3

Ræsonneringsdybde og værktøjsorkestrering: 5.4 Thinking blev eksplicit tunet til at overgå 5.3 på flertrinsræsonnering og agentiske anvendelser. Det ses i web-/desktopinteraktionsbenchmarks og agentsuccesmetrikker.
Kontekstkapacitet: 5.4’s 1M token-tilbud er et klart teknisk skridt ud over, hvad 5.3 leverede i almindeligt tilgængelig API, og muliggør nye klasser af opgaver i én session.
Domæneydeevneløft: OpenAIs tidlige tal og tredjepartsrapporter peger på forbedringer i visse juridiske og dokumentbenchmarks, hvor 5.4’s længere kontekst og specialtuning hjælper.

Afvejninger og hvor 5.3 stadig kan være at foretrække

Letvægtig samtaleanvendelse: GPT-5.3 Instant er fortsat optimeret til hurtige, økonomiske samtaleforløb; organisationer, der ønsker lavest mulig latenstid/omkostning for korte chatinteraktioner, kan foretrække den.
Stabilitet i sikkerhedsmetrikker: nogle sundheds- og “hard”-evalueringer viste et let fald for 5.4 versus 5.2 i OpenAIs snapshots; virksomheder i følsomme, regulerede domæner bør validere modellen på deres egne evalueringssuiter før fuld udrulning.

Anvendelsesscenarier og brancheimplikationer

Kombinationen af dyb ræsonnering, langtidshukommelse af kontekst og værktøjsbrug i GPT-5.4 åbner flere praktiske og strategiske muligheder.

1. Professionelle tjenester og konsulentarbejde

Firmaer, der producerer lange leverancer (f.eks. juridiske indlæg, fler-kapitel konsulentrapporter, M&A due diligence-pakker), kan holde hele dokumenter og datasæt i kontekst, hvilket muliggør sammenhængende tværdokument-syntese, automatiseret QA og generering af ledelsesresuméer uden manuel chunk-stitching. Benchmark-sejre på APEX-Agents stemmer overens med denne positionering.

2. Softwareengineering og ræsonnering over kodebaser

Længere kontekst betyder, at et enkelt modelkald kan inkludere hele repositories eller lange logspor. GPT-5.4’s forbedringer på SWE-benchmarks indikerer bedre performance til debugging, refaktorering og kodegennemgangsworkflows — især sammen med Pro for vedvarende belastninger.

3. Autonome agenter og virksomhedsautomatisering

Agentiske systemer, der opererer over værktøjer (regneark, ticketsystemer, webgrænseflader), drager fordel af GPT-5.4’s forbedrede værktøjsvalg, reducerede token-overhead for agentworkflows og forbedret bevarelse af langvarig tilstand. Det gør GPT-5.4 attraktiv til virksomhedsautomatiseringspipelines og “assistenter, der handler” på tværs af flere systemer.

Konklusion — hvad GPT-5.4 ændrer

GPT-5.4 repræsenterer et pragmatisk og kapabilitetsdrevet fremskridt mod modeller, der kan håndtere lang, multi-dokument-ræsonnering, udføre agentiske workflows med større pålidelighed og skaleres ind i professionelle pipelines via Pro-kontrakter. For organisationer, hvis workflows er langstrakte og værktøjsafhængige, er GPT-5.4 et kvantespring i potentiel produktivitet

Udviklere kan få adgang til GPT-5.4, GPT-5.4-pro, og GPT 5.3 Chat via CometAPI nu. For at komme i gang kan du udforske modellens kapaciteter i Playground og konsultere API-vejledningen for detaljerede instruktioner. Før adgang skal du sikre, at du er logget ind på CometAPI og har fået din API-nøgle. CometAPI tilbyder en pris langt under den officielle pris for at hjælpe dig med integrationen.

Klar til at gå i gang?→ Tilmeld dig GPT-5.4 i dag !

Hvis du vil have flere tips, vejledninger og nyheder om AI, så følg os på VK, X og Discord!