17 апреля 2025: OpenAI представила в среду две новаторские модели ИИ, o3 и o4-mini, что стало значительным шагом вперед в возможностях рассуждения искусственного интеллекта. Эти модели предназначены для повышения производительности при выполнении сложных задач, объединяя визуальное понимание и продвинутые навыки решения проблем.

o3: Продвижение к человеческому уровню мышления
Модель o3 является самой сложной системой рассуждений OpenAI на сегодняшний день. Она продемонстрировала исключительную производительность в различных тестах:
- Математика: Набрал 96.7% баллов на экзамене AIME 2024, пропустив всего один вопрос.
- Научное обоснование: Набрал 87.7% баллов по тесту GPQA Diamond, решая научные задачи на уровне аспирантуры.
- Программная инженерия: Достигнута точность 71.7% на тестах кодирования SWE-Bench Verified.
- Общая разведка: Превзошел порог, сопоставимый с человеческим, на тесте ARC-AGI, набрав 87.5% баллов при высоких вычислительных настройках.
Эти достижения позиционируют o3 как значительный шаг на пути к созданию искусственного интеллекта общего назначения (AGI), демонстрируя его способность адаптироваться к новым задачам, выходящим за рамки заученных шаблонов.
См. также GPT-4.1: что это такое и как его использовать?
o4-mini: Эффективный и универсальный
Модель o4-mini предлагает более компактную и экономичную альтернативу без ущерба для производительности. Она отлично справляется с такими задачами, как математика, кодирование и визуальный анализ, что делает ее пригодной для широкого спектра приложений.
Инновации в области визуального мышления и улучшенной автономности инструментов
И o3, и o4-mini вводят возможность рассуждать с помощью визуальных входов, включая изображения, эскизы и содержимое доски. Эта интеграция позволяет моделям манипулировать изображениями, например, масштабировать или вращать их, как часть их аналитических процессов, что повышает их способность решать проблемы.
OpenAI реализовал в этих моделях новую парадигму обучения под названием «совещательное выравнивание». Этот подход позволяет ИИ заниматься структурированными рассуждениями, согласованными с написанными человеком стандартами безопасности, улучшая соблюдение контрольных показателей безопасности и предоставляя контекстно-зависимые ответы.
Генеральный директор Сэм Альтман признал сложность соглашений об именовании моделей OpenAI и указал на перспективу разработки более интуитивной системы наименования.
См. также Может ли GPT-4o генерировать изображения NSFW?
Доступность и будущее развитие
Модели o3 и o4-mini теперь доступны пользователям ChatGPT Plus, Pro и Team. Развертывание совпадает с недавним представлением OpenAI модели GPT-4.1, отражая быстрый прогресс компании в разработке ИИ.
Генеральный директор Сэм Альтман признал сложность соглашений об именовании моделей OpenAI и указал на перспективу разработки более интуитивной системы наименования.
Эти достижения подчеркивают стремление OpenAI расширять границы возможностей ИИ, уделяя при этом особое внимание безопасности и доступности.
OpenAI также запустила Codex CLI, агент с открытым исходным кодом, который работает локально на терминале пользователя. Он направлен на предоставление пользователям простого и понятного способа подключения моделей ИИ (включая o3 и o4-mini (с поддержкой GPT-4.1 в ближайшее время)) к коду и задачам, запущенным на их собственных компьютерах. Codex CLI имеет открытый исходный код, и вы можете получить к нему доступ уже сейчас на GitHub.
Более подробную информацию о последних моделях OpenAI и их возможностях можно найти на сайте CometAPI. API-интерфейс o3 и O4 Мини API, описывает, как получить доступ и интегрировать API o3 и API O4 Mini через CometAPI.



