OpenAI представляет o3 и o4-mini: новаторские модели ИИ расширяют возможности рассуждений

17 апреля 2025: OpenAI представила в среду две новаторские модели ИИ, o3 и o4-mini, что стало значительным шагом вперед в возможностях рассуждения искусственного интеллекта. Эти модели предназначены для повышения производительности при выполнении сложных задач, объединяя визуальное понимание и продвинутые навыки решения проблем.

o3 и o4-мини

o3: Продвижение к человеческому уровню мышления

Модель o3 является самой сложной системой рассуждений OpenAI на сегодняшний день. Она продемонстрировала исключительную производительность в различных тестах:

Математика: Набрал 96.7% баллов на экзамене AIME 2024, пропустив всего один вопрос.
Научное обоснование: Набрал 87.7% баллов по тесту GPQA Diamond, решая научные задачи на уровне аспирантуры.
Программная инженерия: Достигнута точность 71.7% на тестах кодирования SWE-Bench Verified.
Общая разведка: Превзошел порог, сопоставимый с человеческим, на тесте ARC-AGI, набрав 87.5% баллов при высоких вычислительных настройках.

Эти достижения позиционируют o3 как значительный шаг на пути к созданию искусственного интеллекта общего назначения (AGI), демонстрируя его способность адаптироваться к новым задачам, выходящим за рамки заученных шаблонов.

См. также GPT-4.1: что это такое и как его использовать?

o4-mini: Эффективный и универсальный

Модель o4-mini предлагает более компактную и экономичную альтернативу без ущерба для производительности. Она отлично справляется с такими задачами, как математика, кодирование и визуальный анализ, что делает ее пригодной для широкого спектра приложений.

Инновации в области визуального мышления и улучшенной автономности инструментов

И o3, и o4-mini вводят возможность рассуждать с помощью визуальных входов, включая изображения, эскизы и содержимое доски. Эта интеграция позволяет моделям манипулировать изображениями, например, масштабировать или вращать их, как часть их аналитических процессов, что повышает их способность решать проблемы.

OpenAI реализовал в этих моделях новую парадигму обучения под названием «совещательное выравнивание». Этот подход позволяет ИИ заниматься структурированными рассуждениями, согласованными с написанными человеком стандартами безопасности, улучшая соблюдение контрольных показателей безопасности и предоставляя контекстно-зависимые ответы.

Генеральный директор Сэм Альтман признал сложность соглашений об именовании моделей OpenAI и указал на перспективу разработки более интуитивной системы наименования.

См. также Может ли GPT-4o генерировать изображения NSFW?

Доступность и будущее развитие

Модели o3 и o4-mini теперь доступны пользователям ChatGPT Plus, Pro и Team. Развертывание совпадает с недавним представлением OpenAI модели GPT-4.1, отражая быстрый прогресс компании в разработке ИИ.

Эти достижения подчеркивают стремление OpenAI расширять границы возможностей ИИ, уделяя при этом особое внимание безопасности и доступности.

OpenAI также запустила Codex CLI, агент с открытым исходным кодом, который работает локально на терминале пользователя. Он направлен на предоставление пользователям простого и понятного способа подключения моделей ИИ (включая o3 и o4-mini (с поддержкой GPT-4.1 в ближайшее время)) к коду и задачам, запущенным на их собственных компьютерах. Codex CLI имеет открытый исходный код, и вы можете получить к нему доступ уже сейчас на GitHub.

Более подробную информацию о последних моделях OpenAI и их возможностях можно найти на сайте CometAPI. API-интерфейс o3 и O4 Мини API, описывает, как получить доступ и интегрировать API o3 и API O4 Mini через CometAPI.

o3: Продвижение к человеческому уровню мышления

o4-mini: Эффективный и универсальный

Инновации в области визуального мышления и улучшенной автономности инструментов

Доступность и будущее развитие

Читать далее

500+ моделей в одном API