5–7 марта 2026 года OpenAI публично представила GPT-5.4 — передовую модель, специально настроенную для профессиональных, документоёмких и агентных рабочих процессов. В релизе выделены три сходящихся улучшения: (1) существенно увеличенные контекстные окна (≈1 050 000 токенов), (2) новая возможность «reasoning», позволяющая разработчикам управлять внутренними затратами на рассуждение, и (3) первоклассные возможности computer-use / оркестрации инструментов и улучшённое мультимодальное понимание (текст + изображения + скриншоты). Эти функции делают GPT-5.4 особенно подходящей для задач вроде моделирования в таблицах, проверки контрактов, генерации слайдов, многошаговых агентных процессов и написания кода, управляющего живыми системами.
Вы можете попробовать GPT-5.4 в CometAPI. Вариант с более высоким вычислительным бюджетом — GPT-5.4 Pro — доступен для самых сложных задач рассуждения и многотуровых диалогов.
Что такое GPT-5.4 (включая варианты Thinking и Pro)
Семейство моделей, вкратце
GPT-5.4 позиционируется как «передовая» модель линейки GPT-5 для сложной профессиональной работы: длинные документы, код, многошаговое рассуждение и агентные процессы. Релиз объединяет возможности, ранее разделённые между Codex (кодирование) и линией GPT, — вы получаете одну модель, которая умеет писать код, рассуждать, использовать инструменты и работать с длинным контекстом. Официальный гид по моделям указывает gpt-5.4 как вариант по умолчанию для большинства задач и gpt-5.4-pro — для самых сложных проблем.
Ключевые характеристики (официальные):
- Контекстное окно: ~1 050 000 токенов (≈ 700–800 тыс. английских слов), что позволяет подавать очень большие входы — целые черновики книг, многофайловые кодовые базы или длинные юридические документы.
- Максимум токенов на вывод: по сообщениям, поддерживаются очень большие ответы (например, до 128 000 токенов в некоторых конфигурациях Pro).
- Варианты:
gpt-5.4(по умолчанию),gpt-5.4-pro(больше вычислений, более длительное «мышление») и облегчённые/мини-модели для чувствительных к стоимости сценариев.
Пояснение «Thinking» и «Pro»
- GPT-5.4 Thinking: режим, настроенный на интерактивное рассуждение. Делает упор на рабочие процессы «сначала план» — модель может представить краткий план (an “upfront plan”) перед полной генерацией, что позволяет управлять ходом работы в процессе и сокращает траты токенов на неверные направления. Этот режим повышает прозрачность намечаемых шагов и делает длинные задачи безопаснее и более контролируемыми.
- GPT-5.4 Pro: высоковычислительный «собрат» для самых трудных задач — более глубокая цепочка рассуждений, большие внутренние вычислительные бюджеты и более детерминированные/стабильные результаты на сложных бенчмарках. Доступен в Responses API и предназначен для многотуровых, ресурсоёмких задач рассуждения (ожидайте более высокую задержку и стоимость).
Ключевые улучшения и новые возможности GPT-5.4
Огромные контекстные окна (≈1 050 000 токенов)
Это одно из главных улучшений: модель способна воспринимать и осмыслять целые книги, многофайловые кодовые базы или корпоративные наборы документов, не разбивая их на части при потоковой загрузке. На практике это упрощает задачи вроде сквозной проверки контракта, суммирования полного документа и много-документного Q&A. Сценарии: юридическая проверка (due diligence), технические аудиты и журналы агентов.
Практическое примечание: увеличенное контекстное окно меняет дизайн систем — вместо агрессивного чанкинга теперь можно держать больше «глобального» состояния в контексте, но всё же следует применять уплотнение (см. управление параметрами), чтобы держать затраты в разумных пределах.
Нативная работа с компьютером и интеграция инструментов
GPT-5.4 — первая универсальная модель с нативными возможностями работы с компьютером: генерация последовательностей действий в браузере или ОС (скрипты Playwright, события клавиатуры/мыши), чтение скриншотов, взаимодействие с веб-интерфейсами и оркестрация многоинструментных рабочих процессов. Это важный шаг к созданию автономных агентов, выполняющих реальные задачи «от и до».
GPT-5.4 включает встроенную computer use: модель может взаимодействовать с локальными/удалёнными софтовыми агентами, вызывать коннекторы, манипулировать таблицами, делать скриншоты и автоматизировать многошаговые процессы при наличии разрешений. Это уменьшает «клейкий» код: вместо хрупких обёрток инструкций модель работает в цикле build-run-verify-fix (агентное поведение), используя документированные API инструментов. Это большой шаг к безопасным, практичным автономным агентам.
Режимы рассуждения и reasoning.effort
Настраиваемый параметр reasoning.effort позволяет контролировать, сколько внутреннего вычисления модель вложит в цепочку рассуждений и поиск решения (варианты: none, low, medium, high, xhigh). Более высокий уровень даёт лучшие ответы для сложных задач, но стоит дороже и увеличивает задержку — идеально для gpt-5.4-pro.
Предварительное планирование / интерактивные планы
«Upfront plans» позволяют модели вывести короткий план до выполнения длинной генерации. План можно изучить и изменить разработчику или пользователю, минимизируя бесполезные ответы и позволяя корректировать курс по ходу задачи (отлично для длительного создания документов или многошаговых анализов).
Лучшие мультимодальные/документные навыки
Бенчмарки и внутренние оценки, опубликованные вместе с моделью, показывают большие приросты в задачах с электронными таблицами (пример внутреннего теста: среднее по GPT-5.4 — 87,3% против 68,4% у GPT-5.2) и предпочтения людей для презентаций (презентации GPT-5.4 предпочли в 68% случаев по сравнению с GPT-5.2). Также сообщается о снижении фактических ошибок (ложность отдельных утверждений на ~33% ниже, общая ошибка ответа — на ~18% ниже, чем у GPT-5.2).
Как использовать API GPT-5.4 (Responses API / Chat API)
GPT-5.4 pro поддерживает только доступ через response. GPT-5.4 (thinking) поддерживает chat и responses. CometAPI (универсальная платформа-агрегатор API крупных моделей со скидками) предлагает серию GPT-5.4, два метода доступа и удобные совместимые песочницы.
Примечание: Responses API — рекомендуемый способ интеграции для моделей GPT-5.x, поскольку он напрямую поддерживает параметры рассуждения, регистрацию инструментов и большие размеры контекста.
Python — Responses API (пример)
# pip install openai (or use the official package named in docs)
from openai import OpenAI
import os
api_key = os.environ.get("OPENAI_API_KEY") # or set env var
client = OpenAI(api_key=api_key)
resp = client.responses.create(
model="gpt-5.4-pro-2026-03-05",
input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
reasoning={"effort": "high"}, # hidden internal reasoning tokens used
max_output_tokens=4096, # keep below max output limit for your use case
temperature=0.0, # deterministic for legal/technical tasks
tools=[ # optionally register tools the model can call
{
"name": "file_search",
"type": "file_search",
"config": {"root": "/mnt/data/contracts"}
}
],
response_format={"type":"json", "json_schema":{
"name":"redlines",
"schema":{"type":"object","properties":{"summary":{"type":"string"},"redlines":{"type":"array","items":{"type":"object"}}}}
}}
)
print(resp.output_text) # final model answer
Примечания: reasoning — объект, управляющий внутренними затратами на рассуждение; tools регистрирует доступные инструментальные интерфейсы, которые модель может вызывать; response_format обеспечивает структурированный вывод. Доступные значения для reasoning.effort варьируются от none (самый быстрый) до xhigh (наибольшие внутренние усилия) в зависимости от поддержки SDK и провайдера. Используйте низкий уровень для простых суммаризаций; повышайте для сложных, многошаговых задач.
Crul— chat API (пример)
curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
"model": "gpt-5.2\4",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant."
},
{
"role": "user",
"content": "Hello!"
}
]
}'
Использование инструментов с GPT-5.4 (Computer Use, коннекторы и агенты)
Самый практичный скачок GPT-5.4 — агентное, «инструменто-осознанное» поведение: модель может находить и вызывать нужный инструмент, работать с таблицами и интерфейсами при наличии разрешений и рассуждать о действиях, которые собирается выполнить.
GPT-5.4 специально создана для работы с инструментами. Есть три основных класса инструментов:
- Хостинговые инструменты (например,
web_search,file_search) — модель может вызывать их как часть цикла ответа. Подходят для получения актуальной информации или запросов к векторным БД. - Пользовательские инструменты / вызов функций — ваши собственные серверные эндпоинты или схемы функций. Объявляйте функции (схемы), чтобы модель возвращала структурированные выходы, которые исполняет ваш код.
- Computer use — модель выдаёт действия для GUI и ожидает их исполнения обвязкой (клики, ввод, скриншоты). Это мощно, но высокорискованно.
Когда инструментов десятки/сотни, передавайте tool_search, и позвольте модели на лету находить релевантные схемы инструментов. Это снижает использование токенов и улучшает кэширование в разных развёртываниях.
Как работает интеграция инструментов (концептуально)
- Обнаружение инструментов: модель находит доступные коннекторы (например, Google Sheets, Salesforce, внутренние БД) на основе каталога.
- План и разрешение: модель выводит предварительный план с описанием, какие инструменты и зачем она вызовет; он проверяется и утверждается.
- Вызов и проверка: модель вызывает инструменты (через коннекторы или action API), читает результаты и выполняет проверки (или запрашивает подтверждение человека).
- Цикл исправлений: при сбоях модель пытается исправить проблемы или просит указаний.
Этот паттерн уменьшает хрупкую кастомную оркестрацию и переносит логику в модель, но требует строгого контроля доступа и журналов аудита.
Вызовы с tools (web_search / file_search / computer use)
Responses API позволяет передать массив tools. Модель может выбирать инструменты (встроенные, такие как web_search, file_search), или вы можете заранее задать и ограничить их. Пример: попросить модель использовать веб-поиск.
response = client.responses.create( model="gpt-5.4", input="What are the three most-cited 2025 papers on federated learning?", tools=[{"type": "web_search", "name": "web_search"}], tool_search={"enabled": True})
Если вы передаёте много определений инструментов, tool_search позволяет GPT-5.4 отложить загрузку большинства из них и подгрузить только релевантные — критично для больших экосистем инструментов.
Руководство по совместимости и управлению параметрами GPT-5.4
Традиционные параметры LLM сохраняются, но ограничены в зависимости от режима рассуждения.
Базовые параметры API GPT-5.4
reasoning.effort: следующие параметры полностью поддерживаются и рекомендуются при вызове GPT-5.4. Управляет тем, сколько внутреннего рассуждения выполняет модель перед финальным выводом.
Поддерживаемые значения:
nonelowmediumhighxhigh
Пример:
response = client.responses.create( model="gpt-5.4", reasoning={"effort": "high"}, input="Explain the Nash equilibrium in game theory.")
Эффекты:
| Значение | Поведение |
|---|---|
| none | Самый быстрый ответ |
| low | Лёгкое рассуждение |
| medium | Баланс по умолчанию |
| high | Сильное рассуждение |
| xhigh | Максимальная глубина |
Более высокий уровень рассуждения обычно увеличивает:
- точность ответа
- токены рассуждения
- задержку
- стоимость
Уровень по умолчанию обычно medium.
Tools
Определяет инструменты, которые может вызывать модель. tools + tool_search
tool_searchоткладывает загрузку определений инструментов для эффективности; включайте при больших наборах инструментов.toolsобъявляет определения инструментов (web_search, file_search, пользовательские RPC).
Поддерживаемые встроенные инструменты включают:
- веб-поиск
- поиск по файлам
- интерпретатор кода
- генерация изображений
Пример:
tools=[{
"name":"get_weather",
"description":"Get current weather",
"parameters":{
"type":"object",
"properties":{
"city":{"type":"string"}
}
}
}
Параметры семплирования (контроль случайности)
Важное правило совместимости: когда reasoning.effort ≠ none, некоторые параметры семплирования могут не поддерживаться. Если reasoning.effort — high, запрос может завершиться с ошибкой или проигнорировать temperature.
Модели GPT-5.4 отключают такие параметры, как:
temperaturetop_plogprobs
поскольку модели рассуждения управляют семплированием внутренне.
temperatureУправляет случайностью при семплировании токенов.
| Значение | Эффект |
|---|---|
| 0.0 | детерминированно |
| 0.2–0.4 | стабильно |
| 0.7 | сбалансировано |
| 1.0 | высокая креативность |
Пример:
{ "model": "gpt-5.4", "temperature": 0.2, "reasoning": { "effort": "none" }}
Если reasoning.effort — high, запрос может завершиться с ошибкой или проигнорировать temperature.
top_p: параметр nucleus-семплирования.
| Значение | Значение |
|---|---|
| 0.9 | учитывать топ-90% вероятных токенов |
| 0.5 | консервативная генерация |
| 1.0 | полное распределение |
- stop: останавливает генерацию при встрече заданных токенов.
Полезно для:
- генерации кода
- конвейеров с инструментами
- разделителей в чатах
Verbosity: управляет длиной ответа.
Начиная с моделей GPT-5, включая GPT-5.4, появился ряд новых параметров.
Значения:
lowmediumhigh
Пример:
verbosity="high"
Сценарии использования:
| Значение | Поведение |
|---|---|
| low | лаконичные ответы |
| medium | сбалансировано |
| high | развернутые пояснения |
Этот параметр помогает управлять длиной вывода без манипуляций лимитами токенов.
Отличия параметров GPT-5.4
Ниже упрощённая таблица совместимости.
| Параметр | reasoning:none | reasoning:low+ |
|---|---|---|
| temperature | ✓ | ✗ / игнорируется |
| top_p | ✓ | ✗ |
| logprobs | ✓ | ✗ |
| max_output_tokens | ✓ | ✓ |
| tools | ✓ | ✓ |
| tool_choice | ✓ | ✓ |
| verbosity | ✓ | ✓ |
| reasoning.effort | ✓ | ✓ |
Сравнение параметров и возможностей GPT-5.4 и GPT-5.4-Pro
| Возможность | GPT-5.4 | GPT-5.4-Pro |
|---|---|---|
| Гибкость рассуждения | Полный диапазон none → xhigh | Только medium → xhigh |
| Задержка | Ниже | Выше (сложные задачи могут занять минуты) |
| Стоимость | Ниже | Выше из-за дополнительных вычислений |
| Фоновое выполнение | По желанию | Рекомендуется для длинных задач |
| Поддерживаемые уровни рассужд. | none, low, medium, high, xhigh | medium, high, xhigh |
Лучшие практики внедрения GPT-5.4 в продакшене
1) Начинайте с малого, затем повышайте рассуждение
- Начните с
reasoning.effort=none/low+text.verbosity=lowдля латентно- критичных конечных точек. - Для сложных сценариев переходите на
medium, затемhighтолько после A/B-тестов «стоимость против точности».
2) Предпочитайте структурированный вывод для программных задач
Используйте схемы функций или Pydantic/JSON-схемы, чтобы модель возвращала машинно парсимые результаты; это снижает ошибки последующего парсинга.
3) Держите человека в цикле для решений с высоким влиянием
Любой рабочий процесс, связанный с деньгами, юридическими последствиями или персональными данными, должен требовать одобрения человеком перед внешними эффектами.
4) Ограничивайте доступные возможности
Используйте списки allowed_tools (по умолчанию запрет) и гранулярные разрешения на инструменты. Для computer use применяйте строгий белый список действий.
5) Бюджетирование стоимости и токенов
Используйте max_output_tokens и text.verbosity для предсказуемых затрат. Для очень больших контекстов где уместно — пагинируйте или сжимайте контент; даже при 1M токенов стратегии уплотнения/отбора помогают снижать стоимость.
Заключение — миграция и дальнейшие шаги
GPT-5.4 — значимый шаг вперёд в построении ИИ-систем, которые могут думать больше, работать в разных приложениях и обрабатывать очень большие контексты. Для большинства команд рекомендуемый путь миграции:
- Прототип на небольшом наборе рабочих процессов (например, проверка контрактов, генерация слайдов) с использованием алиаса
gpt-5.4в песочнице. - Измеряйте точность задач, использование токенов, задержку и стоимость по сравнению с прежними моделями.
- Усиливайте за счёт структурированного вывода, защит инструментов и одобрений человека для рискованных потоков.
- Скидки CometAPI могут помочь, если требования по стоимости или задержке диктуют такой выбор.
Разработчики уже могут получить доступ к GPT-5.4, GPT-5.4-pro и API через CometAPI. Чтобы начать, изучите возможности модели в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили API-ключ. CometAPI предлагает цены значительно ниже официальных, чтобы упростить интеграцию.
Готовы начать? → Зарегистрируйтесь для GPT-5.4 уже сегодня !
Если вы хотите больше советов, гайдов и новостей об ИИ, подписывайтесь на нас в VK, X и Discord!
