GPT-5.4 Mini и GPT-5.4 Nano — это новые компактные варианты семейства GPT-5.4 от OpenAI: Mini нацелен на лучший баланс производительности и задержки для кодинга, мультимодальных UI‑задач и сабагентных рабочих нагрузок; Nano нацелен на ультранизкую стоимость и задержку для классификации, извлечения, ранжирования и массово параллельных сабагентов. Mini обеспечивает точность, близкую к моделям переднего края, на многих разработческих бенчмарках, работая более чем в 2× быстрее, чем предыдущие mini; Nano заметно дешевле по цене за токен и идеален там, где важнее всего пропускная способность и отзывчивость. Эти модели доступны в API (GPT 5.4 Mini и Nano доступны в CometAPI).
Что такое GPT-5.4 Mini и GPT-5.4 Nano?
Краткое определение: GPT-5.4 Mini и GPT-5.4 Nano — это компактные, инженерно оптимизированные варианты семейства GPT-5.4, призванные перенести ключевые сильные стороны большой GPT-5.4 (рассуждение, кодинг, мультимодальное восприятие, использование инструментов) в более быстрые и дешевые модели, нацеленные на крупные по объему, низколатентные рабочие нагрузки. Модели были анонсированы OpenAI в рамках релиза GPT-5.4.
- GPT-5.4 Mini — производительная малая модель, которая «приближается к производительности GPT-5.4 по ряду оценок», при этом оптимизирована по скорости и стоимости. Она особенно выделяется в кодинге, рассуждении, мультимодальной интерпретации UI (скриншоты) и как сабагент в агентных системах. OpenAI сообщает, что она работает более чем в 2× быстрее предыдущих вариантов «mini».
- GPT-5.4 Nano — самая маленькая и дешевая версия GPT-5.4; рекомендуется для классификации, извлечения, ранжирования и «поддерживающих» сабагентов, обрабатывающих узкие, повторяемые задачи с очень высокой пропускной способностью. Ради более низкой задержки и стоимости она жертвует глубиной рассуждения.
Доступность и цены
OpenAI приводит два конкретных ориентира для сравнения стоимости:
- Цена ввода в API GPT-5.4 (полноценный флагман): $2.50 / 1M токенов (и более высокая цена вывода у флагмана).
- Цена ввода в API GPT-5.4 mini: $0.75 / 1M токенов, вывод — $4.50 / 1M токенов.
- Цена ввода в API GPT-5.4 nano: $0.20 / 1M, вывод — $1.25 / 1M.
Сопоставляя бок о бок: цена ввода токена у mini (0.75) составляет 30% от флагмана (2.50), то есть примерно треть стоимости ввода; цена вывода у mini (4.50) составляет около 32% от цены вывода флагмана, указанной в таблице цен API, — тоже примерно треть. Nano еще дешевле: стоимость ввода — около 8% от стоимости ввода флагмана, а стоимость вывода — менее 10% от стоимости вывода флагмана. Именно поэтому OpenAI говорит о mini как об «около одной трети» и о nano как о «доле» стоимости использования крупнейших моделей для высокообъемных задач. Цена токена nano выросла с $0.05 до $0.20, а цена токена mini — с $0.25 до $0.75 (для входных токенов).
На платформе OpenAI
GPT-5.4 mini доступна в трех местах: OpenAI API, Codex (разработческая IDE/платформа приложений OpenAI) и ChatGPT (доступна для Free и Go пользователей через опцию “Thinking” и как запасной вариант при ограничениях скорости для платных тарифов). В API она поддерживает текстовые и графические входы, использование инструментов (function calling), веб/файловый поиск, компьютерное использование и навыки — и предлагает очень большое контекстное окно (400k токенов) для сценариев с большим количеством документов и несколькими скриншотами. Цены в API — $0.75 за 1M входных токенов и $4.50 за 1M выходных.
GPT-5.4 nano доступна только через API. Ее прайсовые цены — $0.20 за 1M входных токенов и $1.25 за 1M выходных токенов — позиционируя ее как самый дешевый вход в семейство GPT-5.4. Модель nano намеренно обменивает возможности на стоимость и скорость.
На сторонней платформе
CometAPI — это мульти-модальная платформа агрегации AI API, которая запустила API серии GPT 5.4, включая GPT 5.4 Mini и GPT 5.4 Nano, со скидкой 20% от цены OpenAI.
GPT 5.4 Nano:
| Цена Comet (USD / M токенов) | Официальная цена (USD / M токенов) |
|---|---|
| Вход:$0.16/M; Выход:$1/M | Вход:$0.2/M; Выход:$1.25/M |
GPT 5.4 Nano:
| Цена Comet (USD / M токенов) | Официальная цена (USD / M токенов) |
|---|---|
| Вход:$0.6/M; Выход:$3.6/M | Вход:$0.75/M; Выход:$4.5/M |
Ключевые возможности и что нового
Ниже перечислены ключевые возможности — почему это важно инженерам и продакт‑командам.
Кодирование и поддержка длинного контекста
Контекстное окно: GPT-5.4 mini поддерживает контекстное окно в 400k токен (OpenAI явно указывает mini с контекстом 400k). Этого достаточно для многокомпонентных кодовых баз, больших документов или многотуровых агентных сессий, где важен контекст. Контекст у Nano меньше относительно полной GPT-5.4, но все еще достаточен для быстрых коротких задач.
Рассуждение
Уровни рассуждения: OpenAI предоставляет настраиваемый reasoning_effort (none → xhigh); mini и nano могут работать с разной «степенью усилия», но mini сокращает разрыв с полной GPT-5.4 на многих бенчмарках при более высоких настройках. На ряде интеллектуальных бенчмарков (например, GPQA Diamond) mini достигает 88.0% против 93.0% у GPT-5.4, а nano показывает 82.8%, что говорит о достойном уровне рассуждений для небольшой модели. Это результаты, опубликованные OpenAI в их запускном посте.
Мультимодальное понимание (зрение и UI)
Визуальное восприятие и UI‑задачи: GPT-5.4 mini показывает очень сильные мультимодальные результаты в UI‑задачах (скриншоты, плотные изображения документов). На OSWorld-Verified (бенчмарк «компьютерного использования») mini набирает 72.1%, что близко к 75.0% у GPT-5.4 и значительно выше прежних mini — поэтому mini позиционируется для автоматизаций на основе скриншотов и отзывчивых мультимодальных ассистентов. Nano показывает более низкие результаты на визуальных бенчмарках, но полезен для более простых задач с изображениями.
Вызов инструментов и использование компьютера
Нативные возможности инструментов/кликов: GPT-5.4 вводит и расширяет нативные средства «компьютерного использования»; mini наследует возможность вызывать инструменты, делать вызовы функций, интерпретировать скриншоты и оркестрировать сабагентов. В бенчмарках вызова инструментов (Toolathlon, MCP Atlas) mini и nano показывают достойные результаты (Toolathlon: mini 42.9%, nano 35.5%) — это количественно отражает их способность вызывать и координировать внешние инструменты. Эти метрики взяты из анонса OpenAI.
Галлюцинации / фактичность / уровень ошибок
OpenAI сообщает, что GPT-5.4 — «самая фактичная модель на сегодняшний день» и демонстрирует сокращение галлюцинаций по сравнению с GPT-5.2; mini и nano показывают более низкую абсолютную фактичность, чем полная модель (например, HLE с инструментами: GPT-5.4 52 Lawson.1%, mini 41.5%, nano 37.7%), что подразумевает повышенную потребность в верификации при использовании меньших моделей для задач с высокой требовательностью к фактам. Используйте верификацию на основе инструментов (вызовы инструментов, проверка цитирований), когда корректность критична.
Скорость
OpenAI сообщает, что GPT-5.4 mini работает более чем в 2× быстрее, чем предыдущая GPT-5 mini, по типичным продакшен‑оценкам задержек (они основаны на смоделированном продакшен‑поведении, включающем длительности вызовов инструментов и выборку токенов). Этот прирост скорости — центральное утверждение нового семейства и то, что позволяет использовать mini как отзывчивого сабагента внутри интерактивных приложений, таких как ассистенты по коду Sophronia.
NB how do mini pipelineИ nano perform — do they “approach” full GPT-5.4?
OpenAI опубликовала комплексный набор сравнения бенчмарков по кодингу, использованию инструментов, мультимодальным задачам «компьютерного использования», интеллектуальным тестам и длинному контексту. Ключевые цифры (xhigh reasoning effort, где применимо) включают:
| Бенчмарк | GPT-5.4 | GPT-5.4 Mini | GPT-5.4 Nano | GPT-5 Mini (старый) | Примечания |
|---|---|---|---|---|---|
| SWE-Bench Pro (Программирование) | 57.7% | 54.4% | 52.4% | 45.7% | Mini приближается к производительности флагмана в кодинге |
| Terminal-Bench 2.0 (Интерактивное программирование) | 75.1% | 60.0% | 46.3% | — | Сильные возможности реального времени у Mini |
| Toolathlon (Использование инструментов) | 54.6% | 42.9% | 35.5% | — | Измеряет оркестрацию и вызов инструментов |
| GPQA Diamond (Продвинутый QA) | 93.0% | 88.0% | 82.8% | — | Бенчмарк интеллекта и рассуждения |
| OSWorld-Verified (Задачи GUI) | 75.0% | 72.1% | 39.0% | 42.0% | Возможности UI/«компьютерного использования» |
Эти числа показывают, что mini часто значительно сокращает разрыв — особенно в кодинге и задачах компьютерного использования — в то время как nano занимает полезную середину между возможностями и стоимостью.
Что означают эти цифры простыми словами?
- GPT-5.4 Mini ≈ «почти флагман» во многих продакшен‑задачах. В SWE-Bench Pro (метрика pass-rate для кода) mini набирает 54.4% против 57.7% у флагмана — небольшой относительный разрыв для множества реальных задач кодинга, особенно когда важна задержка. В OSWorld (компьютерное использование) mini — 72.1% против 75.0% у флагмана — снова очень близко для задач с UI/скриншотами.
- GPT-5.4 Nano обменивает больше возможностей на скорость/стоимость. Результат Nano по кодингу (52.4% на SWE-Bench Pro) достойный относительно старых mini, но ее метрика OSWorld падает до 39.0%, показывая, что для задач, требующих сложного многошагового понимания UI или агентных цепочек инструментов, nano менее подходит. Nano сияет в одношаговой классификации, извлечении и маленьких вспомогательных задачах.
- Использование инструментов улучшилось, но остается чувствительным. Метрики Toolathlon и других бенчмарков выросли при переходе от GPT-5 mini к GPT-5.4 mini/nano, показывая, что инженерная работа OpenAI улучшила надежность вызовов инструментов в моделях меньшего размера, — но полная модель все еще лидирует в сложной оркестрации.

Как они работают в продакшене
Сжатие, дистилляция и инженерные оптимизации
Компактные модели, такие как mini/nano, обычно используют комбинацию дистилляции модели, квантования и архитектурной обрезки, чтобы сохранить наиболее ценные способности (кодовые эвристики, визуальные перцепты), одновременно снижая вычислительные затраты на инференс. Формулировки OpenAI указывают на целевую инженерию для сохранения конкретных навыков (кодинг, мультимодальное понимание UI) при меньших размерах.
Рекомендуемые паттерны
- Оркестратор + сабагенты: используйте GPT-5.4 (большую) как планировщика/судью и делегируйте работу сабагентам GPT-5.4 mini / nano для быстрой отработки (поиск, парсинг, правки). Это снижает общую стоимость и уменьшает задержку для пользователя. OpenAI явно поддерживает этот дизайн‑паттерн.
- Фолбэк и обработка rate limit: выставляйте mini как фолбэк при лимитах скорости в ChatGPT или Codex, чтобы чувствительные ко времени запросы все равно получали качественный ответ, когда полная модель недоступна.
- Многоуровневая архитектура для контроля стоимости: массовые конвейеры (индексация, извлечение) → GPT-5.4 nano; интерактивные UI‑компоненты → GPT-5.4 mini; финальная редакторская проверка / сложные цепочки → GPT-5.4 полная. Такой многоуровневый подход балансирует стоимость и возможности.
Задержка и параллелизм
Mini и nano оптимизированы для параллельных сабагентов, когда множество небольших рабочих процессов выполняются одновременно — например, параллельное сканирование тысяч PDF. Концепция OpenAI «tool yields» измеряет, как параллельные вызовы инструментов уменьшают wall‑clock задержку; mini/nano спроектированы так, чтобы сделать эти паттерны экономически эффективными.
Как использовать mini и nano на практике
Стоит ли повсюду заменить вызовы флагмана на mini/nano?
Не автоматически. Рекомендуемый OpenAI подход — делегирование: используйте большую модель для планирования, сложных суждений или финальной проверки, а множество поддерживающих, коротких подзадач отдавайте сабагентам mini или nano. Такой паттерн снижает стоимость и задержку, сохраняя защитные механизмы большой модели там, где это важнее всего. Сценарии:
- Интерактивные ассистенты по программированию: флагман планирует и ревьюит; mini обрабатывает быстрый поиск по коду, правки и короткие юнит‑тесты.
- Агенты «компьютерного использования» на основе скриншотов: mini быстро парсит плотные интерфейсы; флагман решает неоднозначности многошагового планирования.
- Высокообъемные конвейеры извлечения и классификации: nano обрабатывает массивные батчи входов (формы, логи) и возвращает структурированные результаты; флагман берет на себя исключения и сложные edge‑кейсы.
Можно ли использовать mini или nano для мультимодальных или визуальных задач?
Да — mini поддерживает вход изображений и хорошо показывает себя на мультимодальных/визуальных бенчмарках (MMMUPro/OmniDocBench), приближаясь к флагману на некоторых тестах. Мультимодальная сила nano более ограничена: хотя она улучшилась относительно предыдущих nano, это не лучший выбор для глубокого мультимодального рассуждения или агентных задач на основе изображений.
Гонка возможностей малых моделей усилилась
Три месяца назад малые модели считались «достаточно хорошими». Теперь GPT-5.4 mini приближается к флагманам по программным бенчмаркам и почти сравнивается с ними по вычислительной эффективности.
Тренд ясен: возможности флагманских моделей быстро переносятся в меньшие. OpenAI, Google и Anthropic делают одно и то же: дистиллируют ключевые способности больших моделей в более маленькие, быстрые и дешевые версии.

Заключение
Релиз этих двух моделей означает сдвиг в прикладном ИИ от фокуса на масштаб к фокусу на практическую эффективность. Благодаря быстрой реакции они обеспечивают более надежную базу для взаимодействия ИИ в реальном времени и декомпозиции сложных потоков задач.
Для разработчиков это означает, что структура затрат агентных систем переопределяется. Когда стоимость падает до такого уровня, многие агентные сценарии, ранее «теоретически возможные, но экономически невыгодные», становятся жизнеспособными.
Разработчики уже могут получить доступ к GPT 5.4 Mini и GPT-5.4 Nano через CometAPI (CometAPI — единая платформа‑агрегатор API больших моделей, таких как GPT API, Nano Banana API и др.). Перед доступом убедитесь, что вы вошли в CometAPI и получили ключ API. CometAPI предлагает цену значительно ниже официальной, чтобы помочь с интеграцией.
Готовы начать?
.png&w=3840&q=75)