OpenAI prezentuje o3 i o4-mini: pionierskie modele AI podnoszą możliwości rozumowania

17 kwietnia 2025 r.: OpenAI wprowadził w środę dwa przełomowe modele AI, o3 i o4-mini, co oznacza znaczący postęp w zakresie możliwości rozumowania sztucznej inteligencji. Modele te zostały zaprojektowane w celu zwiększenia wydajności w złożonych zadaniach, integrując rozumienie wizualne i zaawansowane umiejętności rozwiązywania problemów.

o3 i o4-mini

o3: Postęp w kierunku rozumowania na poziomie ludzkim

Model o3 jest jak dotąd najbardziej zaawansowanym systemem wnioskowania OpenAI. Wykazał wyjątkową wydajność w różnych testach porównawczych:

matematyka:Uzyskał wynik 96.7% na egzaminie AIME 2024, nie odpowiadając tylko na jedno pytanie.
Rozumowanie naukowe:Zdobył 87.7% w teście GPQA Diamond, rozwiązując problemy z zakresu nauk ścisłych na poziomie studiów podyplomowych.
Inżynieria oprogramowania:Osiągnięto dokładność na poziomie 71.7% w testach kodowania zweryfikowanych przez SWE-Bench.
Ogólna inteligencja:Przekroczono próg zbliżony do ludzkiego w teście porównawczym ARC-AGI, uzyskując wynik 87.5% przy ustawieniach wymagających dużej mocy obliczeniowej.

Osiągnięcia te stawiają o3 w pozycji istotnego kroku w kierunku ogólnej sztucznej inteligencji (AGI), pokazując jej zdolność do adaptacji do nowych zadań wykraczających poza zapamiętane wzorce.

Zobacz także GPT-4.1: Co to jest i jak można go używać?

o4-mini: Wydajny i wszechstronny

Model o4-mini oferuje bardziej kompaktową i ekonomiczną alternatywę bez uszczerbku dla wydajności. Doskonale sprawdza się w zadaniach takich jak matematyka, kodowanie i analiza wizualna, dzięki czemu nadaje się do szerokiej gamy zastosowań.

Innowacje w rozumowaniu wizualnym i zwiększona autonomia narzędzi

Zarówno o3, jak i o4-mini wprowadzają możliwość rozumowania za pomocą danych wizualnych, w tym obrazów, szkiców i treści tablicy. Ta integracja pozwala modelom manipulować obrazami — takimi jak powiększanie lub obracanie — jako częścią ich procesów analitycznych, zwiększając ich zdolność rozwiązywania problemów.

OpenAI wdrożyło w tych modelach nowy paradygmat szkoleniowy zwany „deliberative alignment”. To podejście umożliwia AI angażowanie się w ustrukturyzowane rozumowanie zgodne z normami bezpieczeństwa napisanymi przez człowieka, zwiększając przestrzeganie punktów odniesienia bezpieczeństwa i zapewniając odpowiedzi zależne od kontekstu.

Dyrektor generalny Sam Altman przyznał, że konwencje nazewnictwa modeli OpenAI są skomplikowane i stwierdził, że wkrótce powstanie bardziej intuicyjny system nazewnictwa.

Zobacz także Czy GPT-4o może generować obrazki NSFW?

Dostępność i przyszły rozwój

Modele o3 i o4-mini są teraz dostępne dla użytkowników ChatGPT Plus, Pro i Team. Wprowadzenie na rynek jest zgodne z niedawnym ujawnieniem przez OpenAI modelu GPT-4.1, odzwierciedlającym szybki postęp firmy w rozwoju AI.

Dyrektor generalny Sam Altman przyznał, że konwencje nazewnictwa modeli OpenAI są skomplikowane i stwierdził, że wkrótce powstanie bardziej intuicyjny system nazewnictwa.

Postępy te podkreślają zaangażowanie OpenAI w poszerzanie granic możliwości sztucznej inteligencji przy jednoczesnym zachowaniu nacisku na bezpieczeństwo i dostępność.

OpenAI uruchomiło również Codex CLI, agenta kodu open source, który działa lokalnie na terminalu użytkownika. Jego celem jest zapewnienie użytkownikom prostego i przejrzystego sposobu łączenia modeli AI (w tym o3 i o4-mini (wkrótce z obsługą GPT-4.1)) z kodem i zadaniami uruchamianymi na ich własnych komputerach. Codex CLI jest open source i możesz uzyskać do niego dostęp już teraz na GitHub.

Więcej informacji na temat najnowszych modeli OpenAI i ich możliwości znajdziesz na stronie CometAPI Interfejs API o3 oraz O4 Mini API, opisuje sposób dostępu oraz integracji o3 API i O4 Mini API poprzez CometAPI.

o3: Postęp w kierunku rozumowania na poziomie ludzkim

o4-mini: Wydajny i wszechstronny

Innowacje w rozumowaniu wizualnym i zwiększona autonomia narzędzi

Dostępność i przyszły rozwój

Czytaj więcej

500+ modeli w jednym API