OpenAI afslører o3 og o4-mini: banebrydende AI-modeller løfter ræsonnementkapaciteten

April 17, 2025: OpenAI har introduceret to banebrydende AI-modeller på onsdag, o3 og o4-mini, hvilket markerer et betydeligt fremskridt inden for kunstig intelligens-ræsonnement. Disse modeller er designet til at forbedre ydeevnen i komplekse opgaver, der integrerer visuel forståelse og avancerede problemløsningsevner.

o3 og o4-mini

o3: Fremskridt mod ræsonnement på menneskeligt niveau

O3-modellen står som OpenAIs mest sofistikerede ræsonnementssystem til dato. Det har vist enestående ydeevne på tværs af forskellige benchmarks:

Matematik: Opnåede en score på 96.7 % på AIME 2024-eksamenen, der mangler kun ét spørgsmål.
Videnskabelig ræsonnement: Scorede 87.7 % på GPQA Diamond-benchmark, der tacklede videnskabelige problemer på kandidatniveau.
Software Engineering: Opnåede en nøjagtighed på 71.7 % på SWE-Bench Verified-kodningstestene.
Generel efterretning: Overskred den menneskelignende tærskel på ARC-AGI benchmark med en score på 87.5 % under høje computerindstillinger.

Disse præstationer positionerer o3 som et væsentligt skridt mod kunstig generel intelligens (AGI), der viser dets evne til at tilpasse sig nye opgaver ud over huskede mønstre.

Se også GPT-4.1: Hvad er det, og hvordan kan du bruge det?

o4-mini: Effektiv og alsidig

O4-mini-modellen tilbyder et mere kompakt og omkostningseffektivt alternativ uden at gå på kompromis med ydeevnen. Det udmærker sig i opgaver som matematik, kodning og visuel analyse, hvilket gør det velegnet til en bred vifte af applikationer.

Innovationer inden for visuel ræsonnement og forbedret værktøjsautonomi

Både o3 og o4-mini introducerer muligheden for at ræsonnere med visuelle input, herunder billeder, skitser og tavleindhold. Denne integration gør det muligt for modellerne at manipulere billeder - såsom at zoome eller rotere - som en del af deres analytiske processer, hvilket forbedrer deres problemløsningsevner.

OpenAI har implementeret et nyt træningsparadigme kaldet "deliberative alignment" i disse modeller. Denne tilgang gør det muligt for AI at engagere sig i strukturerede ræsonnementer i overensstemmelse med menneskeskrevne sikkerhedsstandarder, hvilket forbedrer overholdelse af sikkerhedsbenchmarks og giver kontekstfølsomme svar.

Administrerende direktør Sam Altman har anerkendt kompleksiteten af OpenAIs modelnavnekonventioner og indikeret, at et mere intuitivt navnesystem er på vej.

Se også Kan GPT-4o generere NSFW-billeder?

Tilgængelighed og fremtidig udvikling

O3- og o4-mini-modellerne er nu tilgængelige for ChatGPT Plus-, Pro- og Team-brugere. Udrulningen stemmer overens med OpenAIs nylige afsløring af GPT-4.1-modellen, hvilket afspejler virksomhedens hurtige fremskridt inden for AI-udvikling.

Administrerende direktør Sam Altman har anerkendt kompleksiteten af OpenAIs modelnavnekonventioner og indikeret, at et mere intuitivt navnesystem er på vej.

Disse fremskridt understreger OpenAIs forpligtelse til at skubbe grænserne for AI-kapaciteter og samtidig bevare fokus på sikkerhed og tilgængelighed.

OpenAI lancerede også Codex CLI, en åben kildekode-agent, der kører lokalt på brugerens terminal. Det har til formål at give brugerne en enkel og overskuelig måde at forbinde AI-modeller (inklusive o3 og o4-mini (med understøttelse af GPT-4.1 kommer snart)) til kode og opgaver, der kører på deres egne computere. Codex CLI er open source, og du kan få adgang til det nu på GitHub.

Besøg CometAPI for mere information om OpenAIs seneste modeller og deres muligheder o3 API og O4 Mini API, beskriver, hvordan man får adgang til og integrerer o3 API og O4 Mini API gennem CometAPI.

o3: Fremskridt mod ræsonnement på menneskeligt niveau

o4-mini: Effektiv og alsidig

Innovationer inden for visuel ræsonnement og forbedret værktøjsautonomi

Tilgængelighed og fremtidig udvikling

Læs mere

500+ modeller i én API