Как использовать API GPT-5.4: руководство по параметрам и использованию инструментов

5–7 марта 2026 года OpenAI публично представила GPT-5.4 — передовую модель, специально настроенную для профессиональных, документоёмких и агентных рабочих процессов. В релизе выделены три сходящихся улучшения: (1) существенно увеличенные контекстные окна (≈1 050 000 токенов), (2) новая возможность «reasoning», позволяющая разработчикам управлять внутренними затратами на рассуждение, и (3) первоклассные возможности computer-use / оркестрации инструментов и улучшённое мультимодальное понимание (текст + изображения + скриншоты). Эти функции делают GPT-5.4 особенно подходящей для задач вроде моделирования в таблицах, проверки контрактов, генерации слайдов, многошаговых агентных процессов и написания кода, управляющего живыми системами.

Вы можете попробовать GPT-5.4 в CometAPI. Вариант с более высоким вычислительным бюджетом — GPT-5.4 Pro — доступен для самых сложных задач рассуждения и многотуровых диалогов.

Что такое GPT-5.4 (включая варианты Thinking и Pro)

Семейство моделей, вкратце

GPT-5.4 позиционируется как «передовая» модель линейки GPT-5 для сложной профессиональной работы: длинные документы, код, многошаговое рассуждение и агентные процессы. Релиз объединяет возможности, ранее разделённые между Codex (кодирование) и линией GPT, — вы получаете одну модель, которая умеет писать код, рассуждать, использовать инструменты и работать с длинным контекстом. Официальный гид по моделям указывает gpt-5.4 как вариант по умолчанию для большинства задач и gpt-5.4-pro — для самых сложных проблем.

Ключевые характеристики (официальные):

Контекстное окно: ~1 050 000 токенов (≈ 700–800 тыс. английских слов), что позволяет подавать очень большие входы — целые черновики книг, многофайловые кодовые базы или длинные юридические документы.
Максимум токенов на вывод: по сообщениям, поддерживаются очень большие ответы (например, до 128 000 токенов в некоторых конфигурациях Pro).
Варианты: gpt-5.4 (по умолчанию), gpt-5.4-pro (больше вычислений, более длительное «мышление») и облегчённые/мини-модели для чувствительных к стоимости сценариев.

Пояснение «Thinking» и «Pro»

GPT-5.4 Thinking: режим, настроенный на интерактивное рассуждение. Делает упор на рабочие процессы «сначала план» — модель может представить краткий план (an “upfront plan”) перед полной генерацией, что позволяет управлять ходом работы в процессе и сокращает траты токенов на неверные направления. Этот режим повышает прозрачность намечаемых шагов и делает длинные задачи безопаснее и более контролируемыми.
GPT-5.4 Pro: высоковычислительный «собрат» для самых трудных задач — более глубокая цепочка рассуждений, большие внутренние вычислительные бюджеты и более детерминированные/стабильные результаты на сложных бенчмарках. Доступен в Responses API и предназначен для многотуровых, ресурсоёмких задач рассуждения (ожидайте более высокую задержку и стоимость).

Ключевые улучшения и новые возможности GPT-5.4

Огромные контекстные окна (≈1 050 000 токенов)

Это одно из главных улучшений: модель способна воспринимать и осмыслять целые книги, многофайловые кодовые базы или корпоративные наборы документов, не разбивая их на части при потоковой загрузке. На практике это упрощает задачи вроде сквозной проверки контракта, суммирования полного документа и много-документного Q&A. Сценарии: юридическая проверка (due diligence), технические аудиты и журналы агентов.

Практическое примечание: увеличенное контекстное окно меняет дизайн систем — вместо агрессивного чанкинга теперь можно держать больше «глобального» состояния в контексте, но всё же следует применять уплотнение (см. управление параметрами), чтобы держать затраты в разумных пределах.

Нативная работа с компьютером и интеграция инструментов

GPT-5.4 — первая универсальная модель с нативными возможностями работы с компьютером: генерация последовательностей действий в браузере или ОС (скрипты Playwright, события клавиатуры/мыши), чтение скриншотов, взаимодействие с веб-интерфейсами и оркестрация многоинструментных рабочих процессов. Это важный шаг к созданию автономных агентов, выполняющих реальные задачи «от и до».

GPT-5.4 включает встроенную computer use: модель может взаимодействовать с локальными/удалёнными софтовыми агентами, вызывать коннекторы, манипулировать таблицами, делать скриншоты и автоматизировать многошаговые процессы при наличии разрешений. Это уменьшает «клейкий» код: вместо хрупких обёрток инструкций модель работает в цикле build-run-verify-fix (агентное поведение), используя документированные API инструментов. Это большой шаг к безопасным, практичным автономным агентам.

Режимы рассуждения и `reasoning.effort`

Настраиваемый параметр reasoning.effort позволяет контролировать, сколько внутреннего вычисления модель вложит в цепочку рассуждений и поиск решения (варианты: none, low, medium, high, xhigh). Более высокий уровень даёт лучшие ответы для сложных задач, но стоит дороже и увеличивает задержку — идеально для gpt-5.4-pro.

Предварительное планирование / интерактивные планы

«Upfront plans» позволяют модели вывести короткий план до выполнения длинной генерации. План можно изучить и изменить разработчику или пользователю, минимизируя бесполезные ответы и позволяя корректировать курс по ходу задачи (отлично для длительного создания документов или многошаговых анализов).

Лучшие мультимодальные/документные навыки

Бенчмарки и внутренние оценки, опубликованные вместе с моделью, показывают большие приросты в задачах с электронными таблицами (пример внутреннего теста: среднее по GPT-5.4 — 87,3% против 68,4% у GPT-5.2) и предпочтения людей для презентаций (презентации GPT-5.4 предпочли в 68% случаев по сравнению с GPT-5.2). Также сообщается о снижении фактических ошибок (ложность отдельных утверждений на ~33% ниже, общая ошибка ответа — на ~18% ниже, чем у GPT-5.2).

Как использовать API GPT-5.4 (Responses API / Chat API)

GPT-5.4 pro поддерживает только доступ через response. GPT-5.4 (thinking) поддерживает chat и responses. CometAPI (универсальная платформа-агрегатор API крупных моделей со скидками) предлагает серию GPT-5.4, два метода доступа и удобные совместимые песочницы.

Примечание: Responses API — рекомендуемый способ интеграции для моделей GPT-5.x, поскольку он напрямую поддерживает параметры рассуждения, регистрацию инструментов и большие размеры контекста.

Python — Responses API (пример)

# pip install openai (or use the official package named in docs)
from openai import OpenAI
import os

api_key = os.environ.get("OPENAI_API_KEY")  # or set env var
client = OpenAI(api_key=api_key)

resp = client.responses.create(
     model="gpt-5.4-pro-2026-03-05",
    input="How much gold would it take to coat the Statue of Liberty in a 1mm layer?",
    reasoning={"effort": "high"},          # hidden internal reasoning tokens used
    max_output_tokens=4096,               # keep below max output limit for your use case
    temperature=0.0,                      # deterministic for legal/technical tasks
    tools=[                                # optionally register tools the model can call
        {
            "name": "file_search",
            "type": "file_search",
            "config": {"root": "/mnt/data/contracts"}
        }
    ],
    response_format={"type":"json", "json_schema":{
        "name":"redlines",
        "schema":{"type":"object","properties":{"summary":{"type":"string"},"redlines":{"type":"array","items":{"type":"object"}}}}
    }}
)

print(resp.output_text)  # final model answer

Примечания: reasoning — объект, управляющий внутренними затратами на рассуждение; tools регистрирует доступные инструментальные интерфейсы, которые модель может вызывать; response_format обеспечивает структурированный вывод. Доступные значения для reasoning.effort варьируются от none (самый быстрый) до xhigh (наибольшие внутренние усилия) в зависимости от поддержки SDK и провайдера. Используйте низкий уровень для простых суммаризаций; повышайте для сложных, многошаговых задач.

Crul— chat API (пример)

curl --location --request POST 'https://api.cometapi.com/v1/chat/completions' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-5.2\4",
  "messages": [
    {
      "role": "system",
      "content": "You are a helpful assistant."
    },
    {
      "role": "user",
      "content": "Hello!"
    }
  ]
}'

Использование инструментов с GPT-5.4 (Computer Use, коннекторы и агенты)

Самый практичный скачок GPT-5.4 — агентное, «инструменто-осознанное» поведение: модель может находить и вызывать нужный инструмент, работать с таблицами и интерфейсами при наличии разрешений и рассуждать о действиях, которые собирается выполнить.

GPT-5.4 специально создана для работы с инструментами. Есть три основных класса инструментов:

Хостинговые инструменты (например, web_search, file_search) — модель может вызывать их как часть цикла ответа. Подходят для получения актуальной информации или запросов к векторным БД.
Пользовательские инструменты / вызов функций — ваши собственные серверные эндпоинты или схемы функций. Объявляйте функции (схемы), чтобы модель возвращала структурированные выходы, которые исполняет ваш код.
Computer use — модель выдаёт действия для GUI и ожидает их исполнения обвязкой (клики, ввод, скриншоты). Это мощно, но высокорискованно.

Когда инструментов десятки/сотни, передавайте tool_search, и позвольте модели на лету находить релевантные схемы инструментов. Это снижает использование токенов и улучшает кэширование в разных развёртываниях.

Как работает интеграция инструментов (концептуально)

Обнаружение инструментов: модель находит доступные коннекторы (например, Google Sheets, Salesforce, внутренние БД) на основе каталога.
План и разрешение: модель выводит предварительный план с описанием, какие инструменты и зачем она вызовет; он проверяется и утверждается.
Вызов и проверка: модель вызывает инструменты (через коннекторы или action API), читает результаты и выполняет проверки (или запрашивает подтверждение человека).
Цикл исправлений: при сбоях модель пытается исправить проблемы или просит указаний.

Этот паттерн уменьшает хрупкую кастомную оркестрацию и переносит логику в модель, но требует строгого контроля доступа и журналов аудита.

Вызовы с tools (web_search / file_search / computer use)

Responses API позволяет передать массив tools. Модель может выбирать инструменты (встроенные, такие как web_search, file_search), или вы можете заранее задать и ограничить их. Пример: попросить модель использовать веб-поиск.

response = client.responses.create(    model="gpt-5.4",    input="What are the three most-cited 2025 papers on federated learning?",    tools=[{"type": "web_search", "name": "web_search"}],    tool_search={"enabled": True})

Если вы передаёте много определений инструментов, tool_search позволяет GPT-5.4 отложить загрузку большинства из них и подгрузить только релевантные — критично для больших экосистем инструментов.

Руководство по совместимости и управлению параметрами GPT-5.4

Традиционные параметры LLM сохраняются, но ограничены в зависимости от режима рассуждения.

Базовые параметры API GPT-5.4

reasoning.effort: следующие параметры полностью поддерживаются и рекомендуются при вызове GPT-5.4. Управляет тем, сколько внутреннего рассуждения выполняет модель перед финальным выводом.

Поддерживаемые значения:

nonelowmediumhighxhigh

Пример:

response = client.responses.create(    model="gpt-5.4",    reasoning={"effort": "high"},    input="Explain the Nash equilibrium in game theory.")

Эффекты:

Значение	Поведение
none	Самый быстрый ответ
low	Лёгкое рассуждение
medium	Баланс по умолчанию
high	Сильное рассуждение
xhigh	Максимальная глубина

Более высокий уровень рассуждения обычно увеличивает:

точность ответа
токены рассуждения
задержку
стоимость

Уровень по умолчанию обычно medium.

Tools

Определяет инструменты, которые может вызывать модель. tools + tool_search

tool_search откладывает загрузку определений инструментов для эффективности; включайте при больших наборах инструментов.
tools объявляет определения инструментов (web_search, file_search, пользовательские RPC).

Поддерживаемые встроенные инструменты включают:

веб-поиск
поиск по файлам
интерпретатор кода
генерация изображений

Пример:

tools=[{
   "name":"get_weather",
   "description":"Get current weather",
   "parameters":{
      "type":"object",
      "properties":{
         "city":{"type":"string"}
      }
   }
}

Параметры семплирования (контроль случайности)

Важное правило совместимости: когда reasoning.effort ≠ none, некоторые параметры семплирования могут не поддерживаться. Если reasoning.effort — high, запрос может завершиться с ошибкой или проигнорировать temperature.

Модели GPT-5.4 отключают такие параметры, как:

temperature
top_p
logprobs

поскольку модели рассуждения управляют семплированием внутренне.

temperature Управляет случайностью при семплировании токенов.

Значение	Эффект
0.0	детерминированно
0.2–0.4	стабильно
0.7	сбалансировано
1.0	высокая креативность

Пример:

{ "model": "gpt-5.4", "temperature": 0.2, "reasoning": { "effort": "none" }}

Если reasoning.effort — high, запрос может завершиться с ошибкой или проигнорировать temperature.

top_p: параметр nucleus-семплирования.

Значение	Значение
0.9	учитывать топ-90% вероятных токенов
0.5	консервативная генерация
1.0	полное распределение

stop: останавливает генерацию при встрече заданных токенов.

Полезно для:

генерации кода
конвейеров с инструментами
разделителей в чатах

Verbosity: управляет длиной ответа.

Начиная с моделей GPT-5, включая GPT-5.4, появился ряд новых параметров.

Значения:

lowmediumhigh

Пример:

verbosity="high"

Сценарии использования:

Значение	Поведение
low	лаконичные ответы
medium	сбалансировано
high	развернутые пояснения

Этот параметр помогает управлять длиной вывода без манипуляций лимитами токенов.

Отличия параметров GPT-5.4

Ниже упрощённая таблица совместимости.

Параметр	reasoning:none	reasoning:low+
temperature	✓	✗ / игнорируется
top_p	✓	✗
logprobs	✓	✗
max_output_tokens	✓	✓
tools	✓	✓
tool_choice	✓	✓
verbosity	✓	✓
reasoning.effort	✓	✓

Сравнение параметров и возможностей GPT-5.4 и GPT-5.4-Pro

Возможность	GPT-5.4	GPT-5.4-Pro
Гибкость рассуждения	Полный диапазон none → xhigh	Только medium → xhigh
Задержка	Ниже	Выше (сложные задачи могут занять минуты)
Стоимость	Ниже	Выше из-за дополнительных вычислений
Фоновое выполнение	По желанию	Рекомендуется для длинных задач
Поддерживаемые уровни рассужд.	none, low, medium, high, xhigh	medium, high, xhigh

Лучшие практики внедрения GPT-5.4 в продакшене

1) Начинайте с малого, затем повышайте рассуждение

Начните с reasoning.effort=none/low + text.verbosity=low для латентно- критичных конечных точек.
Для сложных сценариев переходите на medium, затем high только после A/B-тестов «стоимость против точности».

2) Предпочитайте структурированный вывод для программных задач

Используйте схемы функций или Pydantic/JSON-схемы, чтобы модель возвращала машинно парсимые результаты; это снижает ошибки последующего парсинга.

3) Держите человека в цикле для решений с высоким влиянием

Любой рабочий процесс, связанный с деньгами, юридическими последствиями или персональными данными, должен требовать одобрения человеком перед внешними эффектами.

4) Ограничивайте доступные возможности

Используйте списки allowed_tools (по умолчанию запрет) и гранулярные разрешения на инструменты. Для computer use применяйте строгий белый список действий.

5) Бюджетирование стоимости и токенов

Используйте max_output_tokens и text.verbosity для предсказуемых затрат. Для очень больших контекстов где уместно — пагинируйте или сжимайте контент; даже при 1M токенов стратегии уплотнения/отбора помогают снижать стоимость.

Заключение — миграция и дальнейшие шаги

GPT-5.4 — значимый шаг вперёд в построении ИИ-систем, которые могут думать больше, работать в разных приложениях и обрабатывать очень большие контексты. Для большинства команд рекомендуемый путь миграции:

Прототип на небольшом наборе рабочих процессов (например, проверка контрактов, генерация слайдов) с использованием алиаса gpt-5.4 в песочнице.
Измеряйте точность задач, использование токенов, задержку и стоимость по сравнению с прежними моделями.
Усиливайте за счёт структурированного вывода, защит инструментов и одобрений человека для рискованных потоков.
Скидки CometAPI могут помочь, если требования по стоимости или задержке диктуют такой выбор.

Разработчики уже могут получить доступ к GPT-5.4, GPT-5.4-pro и API через CometAPI. Чтобы начать, изучите возможности модели в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили API-ключ. CometAPI предлагает цены значительно ниже официальных, чтобы упростить интеграцию.

Готовы начать? → Зарегистрируйтесь для GPT-5.4 уже сегодня !

Если вы хотите больше советов, гайдов и новостей об ИИ, подписывайтесь на нас в VK, X и Discord!

Что такое GPT-5.4 (включая варианты Thinking и Pro)

Семейство моделей, вкратце

Пояснение «Thinking» и «Pro»

Ключевые улучшения и новые возможности GPT-5.4

Огромные контекстные окна (≈1 050 000 токенов)

Нативная работа с компьютером и интеграция инструментов

Режимы рассуждения и `reasoning.effort`

Предварительное планирование / интерактивные планы

Лучшие мультимодальные/документные навыки

Как использовать API GPT-5.4 (Responses API / Chat API)

Python — Responses API (пример)

Crul— chat API (пример)

Использование инструментов с GPT-5.4 (Computer Use, коннекторы и агенты)

Как работает интеграция инструментов (концептуально)

Вызовы с tools (web_search / file_search / computer use)

Руководство по совместимости и управлению параметрами GPT-5.4

Базовые параметры API GPT-5.4

Tools

Параметры семплирования (контроль случайности)

Verbosity: управляет длиной ответа.

Отличия параметров GPT-5.4

Сравнение параметров и возможностей GPT-5.4 и GPT-5.4-Pro

Лучшие практики внедрения GPT-5.4 в продакшене

1) Начинайте с малого, затем повышайте рассуждение

2) Предпочитайте структурированный вывод для программных задач

3) Держите человека в цикле для решений с высоким влиянием

4) Ограничивайте доступные возможности

5) Бюджетирование стоимости и токенов

Заключение — миграция и дальнейшие шаги

Доступ к топовым моделям по низкой цене

Читать далее

Как использовать API GPT-5.4: руководство по параметрам и использованию инструментов

Что такое GPT-5.4 (включая варианты Thinking и Pro)

Семейство моделей, вкратце

Пояснение «Thinking» и «Pro»

Ключевые улучшения и новые возможности GPT-5.4

Огромные контекстные окна (≈1 050 000 токенов)

Нативная работа с компьютером и интеграция инструментов

Режимы рассуждения и reasoning.effort

Предварительное планирование / интерактивные планы

Лучшие мультимодальные/документные навыки

Как использовать API GPT-5.4 (Responses API / Chat API)

Python — Responses API (пример)

Crul— chat API (пример)

Использование инструментов с GPT-5.4 (Computer Use, коннекторы и агенты)

Как работает интеграция инструментов (концептуально)

Вызовы с tools (web_search / file_search / computer use)

Руководство по совместимости и управлению параметрами GPT-5.4

Базовые параметры API GPT-5.4

Tools

Параметры семплирования (контроль случайности)

Verbosity: управляет длиной ответа.

Отличия параметров GPT-5.4

Сравнение параметров и возможностей GPT-5.4 и GPT-5.4-Pro

Лучшие практики внедрения GPT-5.4 в продакшене

1) Начинайте с малого, затем повышайте рассуждение

2) Предпочитайте структурированный вывод для программных задач

3) Держите человека в цикле для решений с высоким влиянием

4) Ограничивайте доступные возможности

5) Бюджетирование стоимости и токенов

Заключение — миграция и дальнейшие шаги

Доступ к топовым моделям по низкой цене

Читать далее

Огромные контекстные окна (≈1 050 000 токенов)

Режимы рассуждения и `reasoning.effort`