Что такое GPT-5.1-Codex-Max и как его использовать?

CometAPI
AnnaNov 19, 2025
Что такое GPT-5.1-Codex-Max и как его использовать?

19–20 ноября 2025 года OpenAI выпустила два связанных, но отдельных обновления: GPT-5.1-Codex-Max, новая модель агентного кодирования для Codex, которая делает акцент на кодировании с дальним горизонтом, эффективности токенов и «уплотнении» для поддержки многооконных сеансов; а также ГПТ-5.1 Про, обновленная модель Pro-tier ChatGPT, настроенная на более четкие и эффективные ответы в сложной профессиональной работе.

Что такое GPT-5.1-Codex-Max и какую проблему он пытается решить?

GPT-5.1-Codex-Max — это специализированная модель Codex от OpenAI, оптимизированная для рабочих процессов кодирования, требующих устойчивое, долгосрочное рассуждение и исполнениеТам, где обычные модели могут быть сбиты с толку чрезвычайно длинными контекстами — например, многофайловыми рефакторингами, сложными циклами агентов или постоянными задачами CI/CD — Codex-Max разработан для автоматически сжимать и управлять состоянием сеанса в нескольких контекстных окнах, что позволяет ему продолжать слаженную работу, поскольку единый проект охватывает многие тысячи (или более) токенов. OpenAI позиционирует Codex-Max как следующий шаг на пути к созданию агентов, способных работать с кодом, которые действительно полезны для расширенных инженерных задач.

Что такое GPT-5.1-Codex-Max и какую проблему он пытается решить?

GPT-5.1-Codex-Max — это специализированная модель Codex от OpenAI, оптимизированная для рабочих процессов кодирования, требующих устойчивое, долгосрочное рассуждение и исполнениеТам, где обычные модели могут быть сбиты с толку чрезвычайно длинными контекстами — например, многофайловыми рефакторингами, сложными циклами агентов или постоянными задачами CI/CD — Codex-Max разработан для автоматически сжимать и управлять состоянием сеанса в нескольких контекстных окнах, что позволяет ему продолжать работать слаженно, поскольку единый проект охватывает многие тысячи (или более) токенов.

OpenAI описывает его как «более быстрый, более интеллектуальный и более эффективный с точки зрения токенов на каждом этапе цикла разработки» и явно предназначен для замены GPT-5.1-Codex в качестве модели по умолчанию в поверхностях Codex.

Снимок функции

  • Уплотнение для обеспечения непрерывности нескольких окон: очищает и сохраняет критический контекст для согласованной работы на протяжении миллионов токенов и часов. 0
  • Улучшенная эффективность токена по сравнению с GPT-5.1-Codex: до ~30% меньше токенов мышления при аналогичном усилии рассуждения в некоторых тестах кода.
  • Долгосрочная устойчивость агента: внутренние наблюдения позволяют поддерживать многочасовые/многодневные циклы работы агентов (OpenAI задокументировал более 24-часовых внутренних запусков).
  • Интеграция с платформой: доступно уже сегодня в Codex CLI, расширениях IDE, облаке и инструментах проверки кода; доступ к API ожидается в ближайшее время.
  • Поддержка среды Windows: OpenAI особо отмечает, что впервые в рабочих процессах Codex реализована поддержка Windows, что расширяет возможности реальных разработчиков.

Как он соотносится с конкурирующими продуктами (например, GitHub Copilot, другими системами ИИ для кодирования)?

GPT-5.1-Codex-Max позиционируется как более автономное и долгосрочное решение для совместной работы по сравнению с инструментами, работающими по запросу. Хотя Copilot и аналогичные помощники отлично справляются с краткосрочным завершением работы в редакторе, сильные стороны Codex-Max заключаются в организации многошаговых задач, поддержании согласованного состояния между сеансами и управлении рабочими процессами, требующими планирования, тестирования и итераций. Тем не менее, для большинства команд наилучшим подходом будет гибридный: Codex-Max используется для сложной автоматизации и длительных задач, выполняемых агентами, а более легкие помощники — для завершения работы на уровне строк.

Как работает GPT-5.1-Codex-Max?

Что такое «уплотнение» и как оно обеспечивает длительную работу?

Центральным техническим достижением является уплотнение— внутренний механизм, который очищает историю сеанса, сохраняя при этом важные фрагменты контекста, чтобы модель могла продолжать согласованную работу с разными Контекстные окна. На практике это означает, что сеансы Codex, приближающиеся к пределу контекста, будут сжаты (более старые или менее ценные токены будут суммированы/сохранены), чтобы у агента появилось новое окно, и он мог продолжать итерации до завершения задачи. OpenAI сообщает о внутренних запусках, в которых модель работала над задачами непрерывно более 24 часов.

Адаптивное мышление и эффективность токенов

GPT-5.1-Codex-Max применяет улучшенные стратегии рассуждений, которые делают его более эффективным с точки зрения токенов: в отчётных внутренних тестах OpenAI модель Max достигает аналогичной или лучшей производительности, чем GPT-5.1-Codex, при этом используя значительно меньше «мыслящих» токенов — OpenAI приводит примерно На 30% меньше Маркеры мышления на SWE-bench проверены при работе с одинаковыми затратами на рассуждение. Модель также представляет режим «Extra High (xhigh)» затрат на рассуждение для задач, не чувствительных к задержке, который позволяет ей затрачивать больше внутренних затрат на рассуждение для получения более качественных результатов.

Системные интеграции и агентские инструменты

Codex-Max распространяется в рамках рабочих процессов Codex (CLI, расширения IDE, облако и поверхности для проверки кода), что позволяет ему взаимодействовать с инструментами реальных разработчиков. Ранние версии включают Codex CLI и агенты IDE (VS Code, JetBrains и др.), а в дальнейшем планируется доступ к API. Цель разработки — не только более интеллектуальный синтез кода, но и создание ИИ, способного выполнять многоэтапные рабочие процессы: открывать файлы, запускать тесты, исправлять ошибки, проводить рефакторинг и перезапускать код.

Как GPT-5.1-Codex-Max показывает себя в тестах и ​​реальных задачах?

Устойчивое рассуждение и долгосрочные задачи

Оценки указывают на измеримые улучшения в устойчивом рассуждении и долгосрочных задачах:

  • Внутренние оценки OpenAICodex-Max может работать над задачами «более 24 часов» в ходе внутренних экспериментов, а интеграция Codex с инструментами разработки повысила внутренние показатели производительности инженерных процессов (например, использование и скорость обработки запросов на извлечение). Это внутренние заявления OpenAI, которые указывают на повышение производительности на уровне задач в реальной работе.
  • Независимые оценки (METR): Независимый отчет METR измерил наблюдаемый 50% временной горизонт (статистика, представляющая среднее время, в течение которого модель может последовательно поддерживать длительную задачу) для GPT-5.1-Codex-Max около 2 часов 40 минут (с широким доверительным интервалом), что выше показателя GPT-5 в 2 часа 17 минут в сопоставимых измерениях — значимое улучшение устойчивой согласованности, идущее в ногу со временем. Методология METR и CI подчёркивают изменчивость, но результат подтверждает утверждение о том, что Codex-Max улучшает практическую эффективность в долгосрочной перспективе.

Тесты кода

OpenAI сообщает об улучшении результатов на frontier-оценках кодирования, в частности, на SWE-bench Verified, где GPT-5.1-Codex-Max превосходит GPT-5.1-Codex, демонстрируя более высокую эффективность токенов. Компания подчёркивает, что при одинаковом «среднем» объёме рассуждений модель Max даёт лучшие результаты, используя примерно на 30% меньше токенов; для пользователей, допускающих более длительные внутренние рассуждения, режим xhigh может дополнительно повысить качество ответов ценой задержки.

GPT‑5.1-Codex (высокий)GPT‑5.1-Codex-Max (xhigh)
Проверено SWE-bench (n=500)73.7%.77.9%.
SWE-Lancer IC SWE66.3%.79.9%.
Терминал-Скамья 2.052.8%.58.1%.

Что такое GPT-5.1-Codex-Max и как его использовать?

Чем GPT-5.1-Codex-Max отличается от GPT-5.1-Codex?

Различия в производительности и назначении

  • Объем: GPT-5.1-Codex — высокопроизводительный вариант кодирования семейства GPT-5.1; Кодекс-Макс — это явно агентный преемник с длительным горизонтом, который должен быть рекомендуемым по умолчанию для Codex и подобных ему сред.
  • Эффективность токена: Codex-Max демонстрирует существенный рост эффективности токенов (по заявлению OpenAI, количество токенов мышления сократилось примерно на 30%) на SWE-bench и при внутреннем использовании.
  • Управление контекстом: Codex-Max представляет сжатие и встроенную многооконную обработку для поддержки задач, выходящих за рамки одного контекстного окна; Codex изначально не предоставлял такую ​​возможность в том же масштабе.
  • Готовность инструмента: Codex-Max поставляется в качестве модели Codex по умолчанию для CLI, IDE и поверхностей обзора кода, сигнализируя о переходе на рабочие процессы разработчиков производственного продукта.

Когда использовать какую модель?

  • Использовать GPT-5.1-Codex для интерактивной помощи при кодировании, быстрого редактирования, небольших рефакторингов и вариантов использования с малой задержкой, когда весь соответствующий контекст легко умещается в одном окне.
  • Использовать GPT-5.1-Codex-Max для многофайловой рефакторинга, автоматизированных агентских задач, требующих большого количества итерационных циклов, рабочих процессов типа CI/CD или когда вам нужно, чтобы модель сохраняла перспективу на уровне проекта при множестве взаимодействий.

Практические шаблоны подсказок и примеры для достижения наилучших результатов?

Подсказки, которые работают хорошо

  • Будьте откровенны в отношении целей и ограничений: «Реорганизуйте X, сохраните открытый API, сохраните имена функций и обеспечьте прохождение тестов A, B, C».
  • Предоставьте минимальный воспроизводимый контекст: Ссылайтесь на проваленный тест, включайте трассировки стека и соответствующие фрагменты файлов вместо того, чтобы выгружать целые репозитории. Codex-Max будет сжимать историю по мере необходимости.
  • Используйте пошаговые инструкции для сложных задач: разбейте крупные задания на последовательность подзадач и позвольте Codex-Max выполнить их (например, «1) запустить тесты 2) исправить 3 наиболее неудачных теста 3) запустить linter 4) подытожить изменения»).
  • Попросите объяснений и различий: запросите как исправление, так и краткое обоснование, чтобы эксперты могли быстро оценить безопасность и намерения.

Примеры шаблонов подсказок

Задача рефакторинга

«Рефакторинг payment/ модуль для извлечения обработки платежей в payment/processor.py. Сохраняйте сигнатуры открытых функций стабильными для существующих вызывающих функций. Создайте модульные тесты для process_payment() которые охватывают успешные тесты, сбои в сети и недействительную карту. Запустите набор тестов и верните неудавшиеся тесты и исправление в едином формате различий.

Исправление ошибки + тест

«Тест tests/test_user_auth.py::test_token_refresh Ошибка при трассировке . Выясните причину, предложите исправление с минимальными изменениями и добавьте модульный тест для предотвращения регрессии. Примените патч и запустите тесты.

Итеративное создание PR

«Реализовать функцию X: добавить конечную точку POST /api/export который экспортирует результаты потоковой передачи и проходит аутентификацию. Создайте конечную точку, добавьте документы, создайте тесты и откройте запрос на включение изменений (PR) с кратким описанием и контрольным списком ручных элементов.

Для большинства из них начните с средний усилие; переключиться на xhigh когда вам нужно, чтобы модель выполняла глубокие рассуждения по многим файлам и нескольким итерациям тестирования.

Как получить доступ к GPT-5.1-Codex-Max?

Где это доступно сегодня

OpenAI интегрировал GPT-5.1-Codex-Max в Инструменты Кодекса Сегодня: Codex CLI, расширения IDE, облако и процессы проверки кода по умолчанию используют Codex-Max (вы можете выбрать Codex-Mini). API будет доступен позже; GitHub Copilot предлагает общедоступные предварительные версии, включающие модели GPT-5.1 и серии Codex.

Разработчики могут получить доступ к GPT-5.1-Codex-Max и API GPT-5.1-Codex через CometAPI. Для начала изучите возможности моделиCometAPI в Детская Площадка Подробные инструкции см. в руководстве по API. Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. сetAPI предложить цену намного ниже официальной, чтобы помочь вам интегрироваться.

Готовы к работе?→ Зарегистрируйтесь в CometAPI сегодня !

Если вы хотите узнать больше советов, руководств и новостей об искусственном интеллекте, подпишитесь на нас VKX и Discord!

Быстрый старт (практическое пошаговое руководство)

  1. Убедитесь, что у вас есть доступ: убедитесь, что ваш план продукта ChatGPT/Codex (Plus, Pro, Business, Edu, Enterprise) или ваш план API разработчика поддерживает модели семейства GPT-5.1/Codex.
  2. Установите расширение Codex CLI или IDE: Если вы хотите запускать задачи кода локально, установите Codex CLI или расширение Codex IDE для VS Code / JetBrains / Xcode (в зависимости от ситуации). В поддерживаемых конфигурациях по умолчанию будет использоваться инструментарий GPT-5.1-Codex-Max.
  3. Выберите усилие по рассуждению: начинать с средний Для большинства задач. Для глубокой отладки, сложного рефакторинга или когда вы хотите, чтобы модель работала эффективнее, и вас не волнует задержка отклика, переключитесь на высокая or xhigh Режимы. Для быстрого решения мелких проблем, низкокачественными является разумным.
  4. Укажите контекст репозитория: Укажите для модели чёткую отправную точку — URL-адрес репозитория или набор файлов, а также краткую инструкцию (например, «реорганизовать платёжный модуль для использования асинхронного ввода-вывода и добавления модульных тестов, сохраняя контракты на уровне функций»). Codex-Max будет сжимать историю по мере приближения к ограничениям контекста и продолжит работу.
  5. Повторите тесты: После того, как модель создаст исправления, запустит наборы тестов и предоставит обратную связь об ошибках в рамках текущего сеанса. Сжатие и непрерывность многооконного режима позволяют Codex-Max сохранять важный контекст для неудачных тестов и выполнять итерации.

Вывод:

GPT-5.1-Codex-Max представляет собой значительный шаг к созданию помощников по агентному кодированию, способных выполнять сложные, длительные инженерные задачи с повышенной эффективностью и логическим мышлением. Технические достижения (компактность, режимы логического мышления, обучение в среде Windows) делают его исключительно подходящим для современных инженерных организаций — при условии, что команды будут сочетать модель с консервативным операционным контролем, четкими политиками участия человека в управлении и надежным мониторингом. Для команд, которые будут внедрять его с умом, Codex-Max может изменить подход к разработке, тестированию и поддержке программного обеспечения, превратив рутинную инженерную работу в более ценное взаимодействие между людьми и моделями.

Читать далее

500+ моделей в одном API

Скидка до 20%