17 kwietnia 2025 r.: OpenAI wprowadził w środę dwa przełomowe modele AI, o3 i o4-mini, co oznacza znaczący postęp w zakresie możliwości rozumowania sztucznej inteligencji. Modele te zostały zaprojektowane w celu zwiększenia wydajności w złożonych zadaniach, integrując rozumienie wizualne i zaawansowane umiejętności rozwiązywania problemów.

o3: Postęp w kierunku rozumowania na poziomie ludzkim
Model o3 jest jak dotąd najbardziej zaawansowanym systemem wnioskowania OpenAI. Wykazał wyjątkową wydajność w różnych testach porównawczych:
- matematyka:Uzyskał wynik 96.7% na egzaminie AIME 2024, nie odpowiadając tylko na jedno pytanie.
- Rozumowanie naukowe:Zdobył 87.7% w teście GPQA Diamond, rozwiązując problemy z zakresu nauk ścisłych na poziomie studiów podyplomowych.
- Inżynieria oprogramowania:Osiągnięto dokładność na poziomie 71.7% w testach kodowania zweryfikowanych przez SWE-Bench.
- Ogólna inteligencja:Przekroczono próg zbliżony do ludzkiego w teście porównawczym ARC-AGI, uzyskując wynik 87.5% przy ustawieniach wymagających dużej mocy obliczeniowej.
Osiągnięcia te stawiają o3 w pozycji istotnego kroku w kierunku ogólnej sztucznej inteligencji (AGI), pokazując jej zdolność do adaptacji do nowych zadań wykraczających poza zapamiętane wzorce.
Zobacz także GPT-4.1: Co to jest i jak można go używać?
o4-mini: Wydajny i wszechstronny
Model o4-mini oferuje bardziej kompaktową i ekonomiczną alternatywę bez uszczerbku dla wydajności. Doskonale sprawdza się w zadaniach takich jak matematyka, kodowanie i analiza wizualna, dzięki czemu nadaje się do szerokiej gamy zastosowań.
Innowacje w rozumowaniu wizualnym i zwiększona autonomia narzędzi
Zarówno o3, jak i o4-mini wprowadzają możliwość rozumowania za pomocą danych wizualnych, w tym obrazów, szkiców i treści tablicy. Ta integracja pozwala modelom manipulować obrazami — takimi jak powiększanie lub obracanie — jako częścią ich procesów analitycznych, zwiększając ich zdolność rozwiązywania problemów.
OpenAI wdrożyło w tych modelach nowy paradygmat szkoleniowy zwany „deliberative alignment”. To podejście umożliwia AI angażowanie się w ustrukturyzowane rozumowanie zgodne z normami bezpieczeństwa napisanymi przez człowieka, zwiększając przestrzeganie punktów odniesienia bezpieczeństwa i zapewniając odpowiedzi zależne od kontekstu.
Dyrektor generalny Sam Altman przyznał, że konwencje nazewnictwa modeli OpenAI są skomplikowane i stwierdził, że wkrótce powstanie bardziej intuicyjny system nazewnictwa.
Zobacz także Czy GPT-4o może generować obrazki NSFW?
Dostępność i przyszły rozwój
Modele o3 i o4-mini są teraz dostępne dla użytkowników ChatGPT Plus, Pro i Team. Wprowadzenie na rynek jest zgodne z niedawnym ujawnieniem przez OpenAI modelu GPT-4.1, odzwierciedlającym szybki postęp firmy w rozwoju AI.
Dyrektor generalny Sam Altman przyznał, że konwencje nazewnictwa modeli OpenAI są skomplikowane i stwierdził, że wkrótce powstanie bardziej intuicyjny system nazewnictwa.
Postępy te podkreślają zaangażowanie OpenAI w poszerzanie granic możliwości sztucznej inteligencji przy jednoczesnym zachowaniu nacisku na bezpieczeństwo i dostępność.
OpenAI uruchomiło również Codex CLI, agenta kodu open source, który działa lokalnie na terminalu użytkownika. Jego celem jest zapewnienie użytkownikom prostego i przejrzystego sposobu łączenia modeli AI (w tym o3 i o4-mini (wkrótce z obsługą GPT-4.1)) z kodem i zadaniami uruchamianymi na ich własnych komputerach. Codex CLI jest open source i możesz uzyskać do niego dostęp już teraz na GitHub.
Więcej informacji na temat najnowszych modeli OpenAI i ich możliwości znajdziesz na stronie CometAPI Interfejs API o3 oraz O4 Mini API, opisuje sposób dostępu oraz integracji o3 API i O4 Mini API poprzez CometAPI.



