19–20 ноября 2025 года OpenAI выпустила два связанных, но отдельных обновления: GPT-5.1-Codex-Max, новая модель агентного кодирования для Codex, которая делает акцент на кодировании с дальним горизонтом, эффективности токенов и «уплотнении» для поддержки многооконных сеансов; а также ГПТ-5.1 Про, обновленная модель Pro-tier ChatGPT, настроенная на более четкие и эффективные ответы в сложной профессиональной работе.
Что такое GPT-5.1-Codex-Max и какую проблему он пытается решить?
GPT-5.1-Codex-Max — это специализированная модель Codex от OpenAI, оптимизированная для рабочих процессов кодирования, требующих устойчивое, долгосрочное рассуждение и исполнениеТам, где обычные модели могут быть сбиты с толку чрезвычайно длинными контекстами — например, многофайловыми рефакторингами, сложными циклами агентов или постоянными задачами CI/CD — Codex-Max разработан для автоматически сжимать и управлять состоянием сеанса в нескольких контекстных окнах, что позволяет ему продолжать слаженную работу, поскольку единый проект охватывает многие тысячи (или более) токенов. OpenAI позиционирует Codex-Max как следующий шаг на пути к созданию агентов, способных работать с кодом, которые действительно полезны для расширенных инженерных задач.
Что такое GPT-5.1-Codex-Max и какую проблему он пытается решить?
GPT-5.1-Codex-Max — это специализированная модель Codex от OpenAI, оптимизированная для рабочих процессов кодирования, требующих устойчивое, долгосрочное рассуждение и исполнениеТам, где обычные модели могут быть сбиты с толку чрезвычайно длинными контекстами — например, многофайловыми рефакторингами, сложными циклами агентов или постоянными задачами CI/CD — Codex-Max разработан для автоматически сжимать и управлять состоянием сеанса в нескольких контекстных окнах, что позволяет ему продолжать работать слаженно, поскольку единый проект охватывает многие тысячи (или более) токенов.
OpenAI описывает его как «более быстрый, более интеллектуальный и более эффективный с точки зрения токенов на каждом этапе цикла разработки» и явно предназначен для замены GPT-5.1-Codex в качестве модели по умолчанию в поверхностях Codex.
Снимок функции
- Уплотнение для обеспечения непрерывности нескольких окон: очищает и сохраняет критический контекст для согласованной работы на протяжении миллионов токенов и часов. 0
- Улучшенная эффективность токена по сравнению с GPT-5.1-Codex: до ~30% меньше токенов мышления при аналогичном усилии рассуждения в некоторых тестах кода.
- Долгосрочная устойчивость агента: внутренние наблюдения позволяют поддерживать многочасовые/многодневные циклы работы агентов (OpenAI задокументировал более 24-часовых внутренних запусков).
- Интеграция с платформой: доступно уже сегодня в Codex CLI, расширениях IDE, облаке и инструментах проверки кода; доступ к API ожидается в ближайшее время.
- Поддержка среды Windows: OpenAI особо отмечает, что впервые в рабочих процессах Codex реализована поддержка Windows, что расширяет возможности реальных разработчиков.
Как он соотносится с конкурирующими продуктами (например, GitHub Copilot, другими системами ИИ для кодирования)?
GPT-5.1-Codex-Max позиционируется как более автономное и долгосрочное решение для совместной работы по сравнению с инструментами, работающими по запросу. Хотя Copilot и аналогичные помощники отлично справляются с краткосрочным завершением работы в редакторе, сильные стороны Codex-Max заключаются в организации многошаговых задач, поддержании согласованного состояния между сеансами и управлении рабочими процессами, требующими планирования, тестирования и итераций. Тем не менее, для большинства команд наилучшим подходом будет гибридный: Codex-Max используется для сложной автоматизации и длительных задач, выполняемых агентами, а более легкие помощники — для завершения работы на уровне строк.
Как работает GPT-5.1-Codex-Max?
Что такое «уплотнение» и как оно обеспечивает длительную работу?
Центральным техническим достижением является уплотнение— внутренний механизм, который очищает историю сеанса, сохраняя при этом важные фрагменты контекста, чтобы модель могла продолжать согласованную работу с разными Контекстные окна. На практике это означает, что сеансы Codex, приближающиеся к пределу контекста, будут сжаты (более старые или менее ценные токены будут суммированы/сохранены), чтобы у агента появилось новое окно, и он мог продолжать итерации до завершения задачи. OpenAI сообщает о внутренних запусках, в которых модель работала над задачами непрерывно более 24 часов.
Адаптивное мышление и эффективность токенов
GPT-5.1-Codex-Max применяет улучшенные стратегии рассуждений, которые делают его более эффективным с точки зрения токенов: в отчётных внутренних тестах OpenAI модель Max достигает аналогичной или лучшей производительности, чем GPT-5.1-Codex, при этом используя значительно меньше «мыслящих» токенов — OpenAI приводит примерно На 30% меньше Маркеры мышления на SWE-bench проверены при работе с одинаковыми затратами на рассуждение. Модель также представляет режим «Extra High (xhigh)» затрат на рассуждение для задач, не чувствительных к задержке, который позволяет ей затрачивать больше внутренних затрат на рассуждение для получения более качественных результатов.
Системные интеграции и агентские инструменты
Codex-Max распространяется в рамках рабочих процессов Codex (CLI, расширения IDE, облако и поверхности для проверки кода), что позволяет ему взаимодействовать с инструментами реальных разработчиков. Ранние версии включают Codex CLI и агенты IDE (VS Code, JetBrains и др.), а в дальнейшем планируется доступ к API. Цель разработки — не только более интеллектуальный синтез кода, но и создание ИИ, способного выполнять многоэтапные рабочие процессы: открывать файлы, запускать тесты, исправлять ошибки, проводить рефакторинг и перезапускать код.
Как GPT-5.1-Codex-Max показывает себя в тестах и реальных задачах?
Устойчивое рассуждение и долгосрочные задачи
Оценки указывают на измеримые улучшения в устойчивом рассуждении и долгосрочных задачах:
- Внутренние оценки OpenAICodex-Max может работать над задачами «более 24 часов» в ходе внутренних экспериментов, а интеграция Codex с инструментами разработки повысила внутренние показатели производительности инженерных процессов (например, использование и скорость обработки запросов на извлечение). Это внутренние заявления OpenAI, которые указывают на повышение производительности на уровне задач в реальной работе.
- Независимые оценки (METR): Независимый отчет METR измерил наблюдаемый 50% временной горизонт (статистика, представляющая среднее время, в течение которого модель может последовательно поддерживать длительную задачу) для GPT-5.1-Codex-Max около 2 часов 40 минут (с широким доверительным интервалом), что выше показателя GPT-5 в 2 часа 17 минут в сопоставимых измерениях — значимое улучшение устойчивой согласованности, идущее в ногу со временем. Методология METR и CI подчёркивают изменчивость, но результат подтверждает утверждение о том, что Codex-Max улучшает практическую эффективность в долгосрочной перспективе.
Тесты кода
OpenAI сообщает об улучшении результатов на frontier-оценках кодирования, в частности, на SWE-bench Verified, где GPT-5.1-Codex-Max превосходит GPT-5.1-Codex, демонстрируя более высокую эффективность токенов. Компания подчёркивает, что при одинаковом «среднем» объёме рассуждений модель Max даёт лучшие результаты, используя примерно на 30% меньше токенов; для пользователей, допускающих более длительные внутренние рассуждения, режим xhigh может дополнительно повысить качество ответов ценой задержки.
| GPT‑5.1-Codex (высокий) | GPT‑5.1-Codex-Max (xhigh) | |
| Проверено SWE-bench (n=500) | 73.7%. | 77.9%. |
| SWE-Lancer IC SWE | 66.3%. | 79.9%. |
| Терминал-Скамья 2.0 | 52.8%. | 58.1%. |

Чем GPT-5.1-Codex-Max отличается от GPT-5.1-Codex?
Различия в производительности и назначении
- Объем: GPT-5.1-Codex — высокопроизводительный вариант кодирования семейства GPT-5.1; Кодекс-Макс — это явно агентный преемник с длительным горизонтом, который должен быть рекомендуемым по умолчанию для Codex и подобных ему сред.
- Эффективность токена: Codex-Max демонстрирует существенный рост эффективности токенов (по заявлению OpenAI, количество токенов мышления сократилось примерно на 30%) на SWE-bench и при внутреннем использовании.
- Управление контекстом: Codex-Max представляет сжатие и встроенную многооконную обработку для поддержки задач, выходящих за рамки одного контекстного окна; Codex изначально не предоставлял такую возможность в том же масштабе.
- Готовность инструмента: Codex-Max поставляется в качестве модели Codex по умолчанию для CLI, IDE и поверхностей обзора кода, сигнализируя о переходе на рабочие процессы разработчиков производственного продукта.
Когда использовать какую модель?
- Использовать GPT-5.1-Codex для интерактивной помощи при кодировании, быстрого редактирования, небольших рефакторингов и вариантов использования с малой задержкой, когда весь соответствующий контекст легко умещается в одном окне.
- Использовать GPT-5.1-Codex-Max для многофайловой рефакторинга, автоматизированных агентских задач, требующих большого количества итерационных циклов, рабочих процессов типа CI/CD или когда вам нужно, чтобы модель сохраняла перспективу на уровне проекта при множестве взаимодействий.
Практические шаблоны подсказок и примеры для достижения наилучших результатов?
Подсказки, которые работают хорошо
- Будьте откровенны в отношении целей и ограничений: «Реорганизуйте X, сохраните открытый API, сохраните имена функций и обеспечьте прохождение тестов A, B, C».
- Предоставьте минимальный воспроизводимый контекст: Ссылайтесь на проваленный тест, включайте трассировки стека и соответствующие фрагменты файлов вместо того, чтобы выгружать целые репозитории. Codex-Max будет сжимать историю по мере необходимости.
- Используйте пошаговые инструкции для сложных задач: разбейте крупные задания на последовательность подзадач и позвольте Codex-Max выполнить их (например, «1) запустить тесты 2) исправить 3 наиболее неудачных теста 3) запустить linter 4) подытожить изменения»).
- Попросите объяснений и различий: запросите как исправление, так и краткое обоснование, чтобы эксперты могли быстро оценить безопасность и намерения.
Примеры шаблонов подсказок
Задача рефакторинга
«Рефакторинг
payment/модуль для извлечения обработки платежей вpayment/processor.py. Сохраняйте сигнатуры открытых функций стабильными для существующих вызывающих функций. Создайте модульные тесты дляprocess_payment()которые охватывают успешные тесты, сбои в сети и недействительную карту. Запустите набор тестов и верните неудавшиеся тесты и исправление в едином формате различий.
Исправление ошибки + тест
«Тест
tests/test_user_auth.py::test_token_refreshОшибка при трассировке . Выясните причину, предложите исправление с минимальными изменениями и добавьте модульный тест для предотвращения регрессии. Примените патч и запустите тесты.
Итеративное создание PR
«Реализовать функцию X: добавить конечную точку
POST /api/exportкоторый экспортирует результаты потоковой передачи и проходит аутентификацию. Создайте конечную точку, добавьте документы, создайте тесты и откройте запрос на включение изменений (PR) с кратким описанием и контрольным списком ручных элементов.
Для большинства из них начните с средний усилие; переключиться на xhigh когда вам нужно, чтобы модель выполняла глубокие рассуждения по многим файлам и нескольким итерациям тестирования.
Как получить доступ к GPT-5.1-Codex-Max?
Где это доступно сегодня
OpenAI интегрировал GPT-5.1-Codex-Max в Инструменты Кодекса Сегодня: Codex CLI, расширения IDE, облако и процессы проверки кода по умолчанию используют Codex-Max (вы можете выбрать Codex-Mini). API будет доступен позже; GitHub Copilot предлагает общедоступные предварительные версии, включающие модели GPT-5.1 и серии Codex.
Разработчики могут получить доступ к GPT-5.1-Codex-Max и API GPT-5.1-Codex через CometAPI. Для начала изучите возможности моделиCometAPI в Детская Площадка Подробные инструкции см. в руководстве по API. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. сetAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.
Готовы к работе?→ Зарегистрируйтесь в CometAPI сегодня !
Если вы хотите узнать больше советов, руководств и новостей об искусственном интеллекте, подпишитесь на нас VK, X и Discord!
Быстрый старт (практическое пошаговое руководство)
- Убедитесь, что у вас есть доступ: убедитесь, что ваш план продукта ChatGPT/Codex (Plus, Pro, Business, Edu, Enterprise) или ваш план API разработчика поддерживает модели семейства GPT-5.1/Codex.
- Установите расширение Codex CLI или IDE: Если вы хотите запускать задачи кода локально, установите Codex CLI или расширение Codex IDE для VS Code / JetBrains / Xcode (в зависимости от ситуации). В поддерживаемых конфигурациях по умолчанию будет использоваться инструментарий GPT-5.1-Codex-Max.
- Выберите усилие по рассуждению: начинать с средний Для большинства задач. Для глубокой отладки, сложного рефакторинга или когда вы хотите, чтобы модель работала эффективнее, и вас не волнует задержка отклика, переключитесь на высокая or xhigh Режимы. Для быстрого решения мелких проблем, низкокачественными является разумным.
- Укажите контекст репозитория: Укажите для модели чёткую отправную точку — URL-адрес репозитория или набор файлов, а также краткую инструкцию (например, «реорганизовать платёжный модуль для использования асинхронного ввода-вывода и добавления модульных тестов, сохраняя контракты на уровне функций»). Codex-Max будет сжимать историю по мере приближения к ограничениям контекста и продолжит работу.
- Повторите тесты: После того, как модель создаст исправления, запустит наборы тестов и предоставит обратную связь об ошибках в рамках текущего сеанса. Сжатие и непрерывность многооконного режима позволяют Codex-Max сохранять важный контекст для неудачных тестов и выполнять итерации.
Вывод:
GPT-5.1-Codex-Max представляет собой значительный шаг к созданию помощников по агентному кодированию, способных выполнять сложные, длительные инженерные задачи с повышенной эффективностью и логическим мышлением. Технические достижения (компактность, режимы логического мышления, обучение в среде Windows) делают его исключительно подходящим для современных инженерных организаций — при условии, что команды будут сочетать модель с консервативным операционным контролем, четкими политиками участия человека в управлении и надежным мониторингом. Для команд, которые будут внедрять его с умом, Codex-Max может изменить подход к разработке, тестированию и поддержке программного обеспечения, превратив рутинную инженерную работу в более ценное взаимодействие между людьми и моделями.
