GPT-5.2 — декабрьский релиз 2025 года от OpenAI в семействе GPT-5: флагманская мультимодальная линейка моделей (текст + визуальные данные + инструменты), настроенная для профессиональной работы с знаниями, рассуждений на длинном контексте, агентного использования инструментов и разработки ПО. OpenAI позиционирует GPT-5.2 как самую способную модель серии GPT-5 на сегодняшний день и заявляет, что она разработана с упором на надёжные многошаговые рассуждения, работу с очень большими документами и улучшенную безопасность/соответствие политике; релиз включает три пользовательских варианта — Instant, Thinking и Pro — и сначала раскатывается для платных подписчиков ChatGPT и клиентов API.
Что такое GPT-5.2 и почему это важно?
GPT-5.2 — новейший участник семейства GPT-5 — новая «фронтирная» серия моделей, созданная специально для того, чтобы сократить разрыв между одноходовыми разговорными ассистентами и системами, которым нужно рассуждать по длинным документам, вызывать инструменты, интерпретировать изображения и надёжно выполнять многошаговые рабочие процессы. OpenAI позиционирует 5.2 как свой наиболее сильный релиз для профессиональной работы с знаниями: он демонстрирует новые state-of-the-art результаты на внутренних бенчмарках (в частности, новый бенчмарк GDPval для knowledge work), показывает более высокие показатели кодирования на инженерных бенчмарках и предлагает значительно улучшенные возможности работы с длинным контекстом и зрением.
Практически GPT-5.2 — это больше, чем просто «большая чат-модель». Это семейство из трёх настроенных вариантов (Instant, Thinking, Pro), которые балансируют задержку, глубину рассуждений и стоимость — и которые вместе с API OpenAI и маршрутизацией в ChatGPT можно использовать для запуска длительных исследовательских задач, построения агентов, вызывающих внешние инструменты, интерпретации сложных изображений и диаграмм, а также генерации производственного кода с более высокой точностью, чем в предыдущих релизах. Модель поддерживает очень большие окна контекста (в документах OpenAI указано окно контекста в 400 000 токенов и предел максимального вывода 128 000 для флагманских моделей), новые функции API для явных уровней усилия рассуждений и «агентное» поведение при вызове инструментов.
5 ключевых улучшенных возможностей в GPT-5.2
1) Стал ли GPT-5.2 лучше в многошаговой логике и математике?
GPT-5.2 привносит более острые многошаговые рассуждения и заметно сильнее работает в математике и структурном решении задач. OpenAI заявляет, что добавила более тонкий контроль над усилием рассуждений (новые уровни, такие как xhigh), реализовала поддержку «reasoning tokens» и настроила модель на поддержание chain-of-thought по более длинным внутренним трассам рассуждений. Бенчмарки вроде FrontierMath и тесты в стиле ARC-AGI показывают существенные приросты по сравнению с GPT-5.1; модель даёт большие отрывы на отраслевых бенчмарках, используемых в научных и финансовых рабочих процессах. Короче: GPT-5.2 «думает дольше» по запросу и может выполнять более сложную символьную/математическую работу с лучшей стабильностью.

| RC-AGI-1 (Verified) Абстрактное мышление | 86.2% | 72.8% |
|---|---|---|
| ARC-AGI-2 (Verified) Абстрактное мышление | 52.9% | 17.6% |
GPT-5.2 Thinking устанавливает рекорды в нескольких продвинутых тестах по науке и математическим рассуждениям:
- GPQA Diamond Science Quiz: 92.4% (версия Pro — 93.2%)
- ARC-AGI-1 Abstract Reasoning: 86.2% (первая модель, преодолевшая порог 90%)
- ARC-AGI-2 Higher Order Reasoning: 52.9%, новый рекорд для Thinking Chain
- FrontierMath Advanced Mathematics Test: 40.3%, значительно превосходит предшественника
- HMMT Math Competition Problems: 99.4%
- AIME Math Test: 100% Complete Solution
Кроме того, GPT-5.2 Pro (High) является state-of-the-art на ARC-AGI-2, достигая 54.2% при стоимости $15.72 за задачу! Превосходит все другие модели.

Почему это важно: многие реальные задачи — финансовое моделирование, проектирование экспериментов, синтез программ, требующий формальных рассуждений — упираются в способность модели связывать множество правильных шагов. GPT-5.2 снижает количество «галлюцинированных» шагов и выдаёт более стабильные промежуточные трассы рассуждений, когда вы просите показать ход решения.
2) Как улучшились понимание длинных текстов и междокументные рассуждения?
Долгий контекст — одно из ключевых улучшений. Базовая модель GPT-5.2 поддерживает окно контекста в 400k токенов и — что важно — сохраняет более высокую точность, когда релевантное содержимое смещается глубоко в этом контексте. GDPval, набор задач для «хорошо специфицированной работы с знаниями» по 44 профессиям, где GPT-5.2 Thinking достигает паритета или превосходит экспертных человеческих судей на большой доле задач. Независимые отчёты подтверждают, что модель удерживает и синтезирует информацию по многим документам значительно лучше, чем предыдущие модели. Это реально практический шаг вперёд для задач вроде due diligence, юридических суммаризаций, обзоров литературы и понимания кодовых баз.
GPT-5.2 может обрабатывать контексты до 256 000 токенов (примерно более 200 страниц документов). Кроме того, в тесте «OpenAI MRCRv2» на понимание длинных текстов GPT-5.2 Thinking достигла точности, близкой к 100%.


Оговорка относительно «100% точности»: Улучшения описаны как «приближающиеся к 100%» для узких микрозадач; данные OpenAI корректнее описывать как «state-of-the-art и во многих случаях на уровне или выше уровня человеческих экспертов по оцененным задачам», а не буквально безошибочны во всех применениях. Бенчмарки показывают большие приросты, но не универсальное совершенство.
3) Что нового в визуальном понимании и мультимодальных рассуждениях?
Возможности зрения в GPT-5.2 стали более острыми и практичными. Модель лучше интерпретирует скриншоты, читает диаграммы и таблицы, распознаёт элементы интерфейса и комбинирует визуальный ввод с длинным текстовым контекстом. Это не просто подписи: GPT-5.2 умеет извлекать структурированные данные из изображений (например, таблицы из PDF), объяснять графики и рассуждать по диаграммам так, чтобы поддерживать последующие действия инструментов (например, генерировать электронную таблицу из сфотографированного отчёта).

.webp)
Практический эффект: команды могут подавать в модель целые презентации, отсканированные исследовательские отчёты или насыщенные изображениями документы и просить о междокументных синтезах — серьёзно сокращая ручную работу по извлечению данных.
4) Как изменились вызов инструментов и выполнение задач?
GPT-5.2 продвигается дальше в агентное поведение: лучше планирует многошаговые задачи, решает, когда вызывать внешние инструменты, и выполняет последовательности вызовов API/инструментов, чтобы довести работу до конца. Улучшения «агентного вызова инструментов»: модель предложит план, вызовет инструменты (базы данных, вычисления, файловые системы, браузер, раннеры кода) и синтезирует результаты в финальный артефакт надёжнее, чем ранние модели. API вводит маршрутизацию и контроли безопасности (списки разрешённых инструментов, инструментальная обвязка), а интерфейс ChatGPT может автоматически маршрутизировать запросы к подходящему варианту 5.2 (Instant vs Thinking).
GPT-5.2 набрала 98.7% в бенчмарке Tau2-Bench Telecom, демонстрируя зрелые возможности вызова инструментов в сложных многоходовых задачах.


Почему это важно: это делает GPT-5.2 более полезной как автономный ассистент для рабочих процессов вроде «загрузить эти контракты, извлечь положения, обновить электронную таблицу и написать итоговое письмо» — задачи, которые раньше требовали тщательной оркестрации.
5) Эволюция возможностей программирования
GPT-5.2 заметно лучше в задачах разработки ПО: пишет более завершённые модули, надёжнее генерирует и запускает тесты, понимает сложные графы зависимостей проектов и меньше склонна к «ленивому кодированию» (пропуску шаблонного кода или невязке модулей между собой). На отраслевых бенчмарках по кодированию (SWE-bench Pro и др.) GPT-5.2 устанавливает новые рекорды. Для команд, использующих LLM как напарников-программистов, это улучшение может снизить объём ручной проверки и доработки после генерации.
В тесте SWE-Bench Pro (реальная промышленных задачах по разработке ПО) показатель GPT-5.2 Thinking улучшился до 55.6%, а также достиг нового максимума в 80% в тесте SWE-Bench Verified.
_Software%20engineering.webp)
На практике это означает:
- Автоматическая отладка кода в промышленной среде обеспечивает большую стабильность;
- Поддержка многоязычного программирования (не только Python);
- Способность самостоятельно выполнять сквозные задачи по исправлению.
В чём различия между GPT-5.2 и GPT-5.1?
Короткий ответ: GPT-5.2 — итерационное, но существенное улучшение. Она сохраняет архитектуру семейства GPT-5 и мультимодальные основы, но продвигает четыре практических измерения:
- Глубина и согласованность рассуждений. 5.2 вводит более высокие уровни усилия рассуждений и лучшую цепочку для многошаговых задач; 5.1 ранее улучшала рассуждения, но 5.2 поднимает потолок для сложной математики и многоэтапной логики.
- Надёжность на длинном контексте. Обе версии расширяли контекст, но 5.2 настроена на поддержание точности глубоко в очень длинных входах (OpenAI заявляет улучшенную удерживаемость вплоть до сотен тысяч токенов).
- Визуальная и мультимодальная точность. 5.2 улучшает перекрёстную ссылку между изображениями и текстом — например, считывание диаграммы и интеграцию этих данных в электронную таблицу — показывая более высокую точность на уровне задач.
- Агентное поведение при вызове инструментов и функции API. 5.2 раскрывает новые параметры усилия рассуждений (
xhigh) и функции уплотнения контекста в API, а OpenAI улучшила логику маршрутизации в ChatGPT, чтобы интерфейс мог автоматически выбирать лучший вариант. - Меньше ошибок, выше стабильность: GPT-5.2 снижает свой «уровень иллюзий» (уровень ложных ответов) на 38%. Она надёжнее отвечает на исследовательские, писательские и аналитические вопросы, уменьшая случаи «сфабрикованных фактов». В сложных задачах её структурированный вывод более чёток, а логика более стабильна. При этом безопасность ответов модели значительно улучшена в задачах, связанных с психическим здоровьем. Она работает более устойчиво в чувствительных сценариях, таких как психическое здоровье, самоповреждение, суицид и эмоциональная зависимость.
В системных оценках GPT-5.2 Instant получила 0.995 (из 1.0) в задаче «Mental Health Support», значительно выше, чем GPT-5.1 (0.883).
Количественно опубликованные бенчмарки OpenAI показывают измеримые приросты на GDPval, математических бенчмарках (FrontierMath) и оценках по разработке ПО. GPT-5.2 превосходит GPT-5.1 в задачах «табличная работа» уровня младшего аналитика инвестбанкинга на несколько процентных пунктов.
Бесплатна ли GPT-5.2 — сколько это стоит?
Могу ли я использовать GPT-5.2 бесплатно?
OpenAI начала раскатку GPT-5.2 с платных планов ChatGPT и доступа к API. Исторически OpenAI удерживает самые быстрые/самые глубокие модели за платными уровнями, а облегчённые варианты делает доступными шире позже; в случае 5.2 компания заявила, что раскатка начнётся на платных планах (Plus, Pro, Business, Enterprise), а API доступен разработчикам. Это значит, что немедленный бесплатный доступ ограничен: бесплатный тариф может получить ухудшенный или маршрутизированный доступ (например, к более лёгким подвариантам) позже по мере масштабирования.
Хорошая новость: CometAPI теперь интегрируется с GPT-5.2, и сейчас действует рождественская распродажа. Теперь вы можете использовать GPT-5.2 через CometAPI; песочница позволяет свободно взаимодействовать с GPT-5.2, а разработчики могут использовать API GPT-5.2 (CometAPI стоит 20% от цены OpenAI) для построения рабочих процессов.
Сколько это стоит через API (для разработчиков/продакшена)?
Использование API тарифицируется по токенам. Опубликованная платформа OpenAI на запуске показывает (CometAPI стоит 20% от цены OpenAI):
- GPT-5.2 (standard chat) — $1.75 за 1M входных токенов и $14 за 1M выходных токенов (применяются скидки на кэшированные входы).
- GPT-5.2 Pro (флагман) — $21 за 1M входных токенов и $168 за 1M выходных токенов (значительно дороже, поскольку предназначена для высокоточных, ресурсоёмких нагрузок).
- Для сравнения, GPT-5.1 была дешевле (например, $1.25 вход / $10 выход за 1M токенов).
Интерпретация: Стоимость API выросла по сравнению с предыдущими поколениями; цена сигнализирует, что премиальные рассуждения и производительность на длинном контексте в 5.2 — отдельный продуктовый уровень. Для производственных систем стоимость плана сильно зависит от количества входных/выходных токенов и частоты повторного использования кэшированных входов (кэшированные входы получают большие скидки).
Что это значит на практике
- Для повседневного использования через интерфейс ChatGPT основным путём служат ежемесячные подписки (Plus, Pro, Business, Enterprise). Цены подписок ChatGPT не изменились с релизом 5.2 (OpenAI сохраняет цены планов стабильными, даже если предложение моделей меняется).
- Для производственного и разработческого использования закладывайте бюджет на токены. Если ваше приложение стримит много длинных ответов или обрабатывает длинные документы, стоимость выходных токенов ($14 / 1M токенов для Thinking) будет доминировать, если вы не будете тщательно кэшировать входы и переиспользовать выводы.
GPT-5.2 Instant vs GPT-5.2 Thinking vs GPT-5.2 Pro
OpenAI запустила GPT-5.2 с тремя вариантами, ориентированными на разные задачи: Instant, Thinking и Pro:
- GPT-5.2 Instant: Быстрая, экономичная, настроенная под повседневную работу — FAQ, инструкции, переводы, быстрые черновики. Низкая задержка; хорошие первые версии и простые рабочие процессы.
- GPT-5.2 Thinking: Более глубокие, качественные ответы для длительной работы — суммаризация длинных документов, многошаговое планирование, подробные ревью кода. Сбалансированная задержка и качество; «рабочая лошадка» для профессиональных задач.
- GPT-5.2 Pro: Максимальное качество и надёжность. Медленнее и дороже; лучше для сложных, высокорисковых задач (сложная инженерия, юридический синтез, решения высокой ценности), где требуется уровень усилия рассуждений ‘xhigh’.
Таблица сравнения
| Характеристика / Метрика | GPT-5.2 Instant | GPT-5.2 Thinking | GPT-5.2 Pro |
|---|---|---|---|
| Предназначение | Повседневные задачи, быстрые черновики | Глубокий анализ, длинные документы | Максимальное качество, сложные задачи |
| Задержка | Самая низкая | Умеренная | Самая высокая |
| Усилие рассуждений | Стандартное | Высокое | доступен xHigh |
| Лучше всего для | FAQ, инструкции, переводы, короткие промпты | Суммаризации, планирование, таблицы, задачи кодинга | Сложная инженерия, юридический синтез, исследования |
| Примеры имён API | gpt-5.2-chat-latest | gpt-5.2 | gpt-5.2-pro |
| Цена входного токена (API) | $1.75 / 1M | $1.75 / 1M | $21 / 1M |
| Цена выходного токена (API) | $14 / 1M | $14 / 1M | $168 / 1M |
| Доступность (ChatGPT) | Роллаут; сначала платные планы, затем шире | Роллаут на платные планы | Пользователи Pro / Enterprise (платно) |
| Пример типового кейса | Черновики писем, небольшие сниппеты кода | Построение многолистовой финансовой модели, Q&A по длинному отчёту | Аудит кодовой базы, генерация продвинутого системного дизайна |
Кому подходит использование GPT-5.2?
GPT-5.2 создана для широкой аудитории целевых пользователей. Ниже — рекомендации по ролям:
Предприятия и продуктовые команды
Если вы строите продукты для работы с знаниями (исследовательские помощники, ревизия контрактов, аналитические пайплайны или инструменты разработчика), длинный контекст и агентные возможности GPT-5.2 могут значительно снизить сложность интеграции. Предприятия, которым нужна надёжная работа с документами, автоматизированная отчётность или интеллектуальные копилоты, найдут полезными Thinking/Pro. Microsoft и другие платформенные партнёры уже интегрируют 5.2 в производственные стеки (например, Microsoft 365 Copilot).
Разработчики и инженерные команды
Командам, желающим использовать LLM как напарников-программистов или автоматизировать генерацию/тестирование кода, пригодится улучшенная точность программирования в 5.2. Доступ к API (с режимами thinking или pro) позволяет выполнять более глубокие синтезы больших кодовых баз благодаря окну контекста в 400k токенов. Ожидайте более высокую стоимость API при использовании Pro, но сокращение ручной отладки и ревью может оправдать эти расходы для сложных систем.
Исследователи и аналитики, работающие с данными
Если вы регулярно синтезируете литературу, разбираете длинные технические отчёты или хотите помощи модели в проектировании экспериментов, длинный контекст и математические улучшения GPT-5.2 ускорят рабочие процессы. Для воспроизводимых исследований сочетайте модель с тщательным проектированием промптов и шагами проверки.
Малый бизнес и продвинутые пользователи
ChatGPT Plus (и Pro для продвинутых пользователей) получит маршрутизированный доступ к вариантам 5.2; это делает продвинутую автоматизацию и высококачественные ответы доступными для небольших команд без интеграции API. Для нетехнических пользователей, которым нужны лучшая суммаризация документов или построение слайдов, GPT-5.2 даёт заметную практическую ценность.
Практические заметки для разработчиков и операторов
Возможности API, на которые стоит обратить внимание
reasoning.effortуровни (например,medium,high,xhigh) позволяют указать модели, сколько вычислительных ресурсов тратить на внутренние рассуждения; используйте это, чтобы балансировать задержку и точность на уровне запроса.- Уплотнение контекста: API включает инструменты для сжатия и компакта истории, чтобы сохранять действительно релевантное содержание в длинных цепочках. Это критично, когда важно удерживать эффективное использование токенов в разумных пределах.
- Обвязка инструментов и контроль списков разрешённых инструментов: в продакшене следует явно вайтлистить, что модель может вызывать, и логировать вызовы инструментов для аудита.
Советы по контролю затрат
- Кэшируйте часто используемые эмбеддинги документов и используйте кэшированные входы (на них действуют большие скидки) для повторных запросов к одному и тому же корпусу. Платформенная цена OpenAI включает значительные скидки для кэшированных входов.
- Маршрутизируйте исследовательские/низкоценные запросы в Instant, а Thinking/Pro оставляйте для пакетных задач или финальных проходов.
- Тщательно оценивайте использование токенов (вход + выход) при планировании стоимости API, поскольку длинные ответы многократно увеличивают стоимость.
Итог — стоит ли обновиться до GPT-5.2?
Если ваша работа зависит от рассуждений по длинным документам, междокументного синтеза, мультимодальной интерпретации (изображения + текст) или построения агентов, вызывающих инструменты, GPT-5.2 — очевидное обновление: повышает практическую точность и снижает ручную интеграционную работу. Если вы в основном запускаете высокообъёмные, низкозадержные чат-боты или строго ограничены бюджетом, Instant (или более ранние модели) могут оставаться разумным выбором.
GPT-5.2 представляет осознанный поворот от «лучшего чата» к «лучшему профессиональному ассистенту»: больше вычислений, больше возможностей и более высокие ценовые уровни — но также реальные выигрыши в продуктивности для команд, которые могут использовать надёжный длинный контекст, улучшенные математику/рассуждения, понимание изображений и агентное выполнение инструментов.
Для начала изучите возможности моделей GPT-5.2 (GPT-5.2;GPT-5.2 pro, GPT-5.2 chat) в Playground и обратитесь к API guide за подробными инструкциями. Перед доступом убедитесь, что вы вошли в CometAPI и получили API-ключ. CometAPI предлагает цену намного ниже официальной, чтобы помочь вам с интеграцией.
Готовы начать?→ Free trial of gpt-5.2 models !
