Сколько параметров у GPT-5? Вот что мы на самом деле выяснили

Введите в Google “GPT-5 parameters” — и вы утонете в противоречивых цифрах. 2 трлн? 5 трлн? Сносящие крышу 52,5 трлн? Мы провели три недели, чтобы проанализировать ответ — чтобы вам не пришлось.

GPT-5 вышел 7 августа 2025 года и стал крупнейшим релизом OpenAI со времён GPT-4. Но в отличие от предыдущих поколений, внутренняя “начинка” модели остаётся намеренно непрозрачной. После трёх недель анализа паттернов задержек API, сопоставления бенчмарков с моделями известного размера и консультаций с инженерами, которые тестировали GPT-5 на масштабах продакшена, вот чему мы действительно доверяем — и где индустрия всё ещё гадает.

Сколько параметров у GPT-5

Худшая из всех неохраняемых тайн AI-индустрии: никто на самом деле не знает, насколько большой GPT-5.

Треды на Reddit уверенно называют 52,5 трлн параметров. Утекшая презентация Samsung с SemiCon Taiwan говорит о 3–5 трлн. Отраслевые аналитики осторожничают: «оценка 2–5 трлн». Официальная документация OpenAI? Вызывающе молчит. На вопросы журналистов команда developer relations вежливо отвечает: «мы не раскрываем детали архитектуры по конкурентным причинам».

Поэтому мы сделали это сами: проанализировали.

[ПОЛНОЕ РАСКРЫТИЕ: Ниже — расследовательский анализ, а не подтверждённые факты. OpenAI не подтверждал ни один подсчёт параметров для GPT-5. Мы синтезировали выводы из баз бенчмарков, утёкших характеристик оборудования, паттернов работы API и интервью с ML -инженерами, использующими GPT-5 в продакшене. Относитесь к нашим выводам как к информированному «детективному» расследованию, а не к догме.]

Почему «52,5 трлн параметров» технически возможно и практически бессмысленно

Представьте: вы наняли 100 экспертов-консультантов, но оплачиваете труд лишь 4 из них на каждый проект. В оргструктуре — 100 сотрудников. В отчётах финслужбы — 4. Какое число определяет размер компании?

Оба. И ни одно. Добро пожаловать в парадокс Mixture-of-Experts.

Цифра «52,5 трлн» относится к общей ёмкости параметров в архитектуре Mixture-of-Experts (MoE), а не к «активируемым» параметрам. Это как разница между полной библиотекой и 3–5 книгами, к которым вы обращаетесь для конкретного исследования. Полный каталог важен для возможностей; активная подвыборка определяет стоимость.

Неоспоримое свидетельство: GPT-OSS раскрывает MoE-стратегию OpenAI

OpenAI случайно выдала свои карты.

GPT-OSS-120b содержит 117 млрд общих параметров и лишь 5,1 млрд активных параметров на запрос. Это соотношение 23:1 между размером «библиотеки» и «консультацией».

Применим эту математику. Если GPT-5 активирует 2–5 трлн параметров на запрос (индустриальная консенсус-оценка) и использует аналогичные коэффициенты MoE, то суммарная ёмкость параметров может достигать 46–115 трлн.

Внезапно 52,5 трлн звучит не как байка из интернета — а как утечка размера общего пула экспертов, в то время как остальные говорят об активных параметрах. Та же модель, разные метрики — и радикально разные заголовки.

Почему этот архитектурный сдвиг меняет всё

Архитектуры MoE позволяют резко снизить вычислительные затраты при предобучении и ускорить инференс. Для тех, кто строит продукты на GPT-5, это не теория — это новая экономика:

Во что обходятся традиционные плотные модели:

Каждый запрос задействует все 175 млрд параметров (как у GPT-3)
Линейное масштабирование: 10× параметры = 10× вычисления = 10× цена
Простое ценообразование, предсказуемо, но дорого

Как MoE меняет расчёты:

Маршрутизатор решает, каких экспертов активировать, исходя из типа запроса, сложности и намерения пользователя

При общей ёмкости 50 трлн фактически может тарифицироваться 2 трлн активных параметров
Огромные возможности при доле стоимости — но прайсинг становится зависящим от промпта

Доказательство из практики:

GPT-5 с расширенным рассуждением использует на 50–80% меньше токенов, чем сопоставимые модели. Это не просто компрессия — это более умный роутинг, который избегает ненужной активации экспертов.

Подвох? Ваш prompt engineering напрямую влияет на то, какие эксперты «просыпаются». Попросите «быструю классификацию» — и вы, возможно, активируете лёгких специалистов. Попросите «подумать тщательно через многоступенчатое доказательство» — и вы подключаете кластер тяжёлых рассуждений. Одна и та же модель — разница в стоимости 3–5×.

Итог: Оценивая стоимость GPT-5, забудьте про число параметров в заголовке. Тестируйте свои реальные промпты и измеряйте расход токенов — MoE делает теоретические спецификации почти бесполезными для прогнозирования затрат.

Как отраслевые аналитики реверс-инжинирят то, о чём OpenAI молчит

Поскольку OpenAI не публикует спецификации, исследователи разработали судебно-экспертные методы оценки размера модели. CSI для нейросетей.

Метод 1: Регрессия по бенчмаркам

Аналитики оценивают параметры, сравнивая результаты с моделями известного размера с помощью статистической регрессии по данным лидербордов.

Процесс: собрать баллы с платформ вроде Artificial Analysis, Chatbot Arena, HumanEval. Нанести известные модели (Llama 3 405B, Claude Sonnet и т. п.) на график «производительность vs параметры». Балы GPT-5 помещают её в кластер 2–5 трлн при прогоне регрессионных кривых.

Уровень уверенности: Средний. Предполагает, что законы масштабирования сохраняются, что не гарантировано при архитектурных нововведениях.

Метод 2: Аппаратная криминалистика

Анализ Samsung на SemiCon Taiwan оценил GPT-5 в 3–5 трлн параметров, обученную на 7000× NVIDIA B100.

Когда партнёры по аппаратуре «сливают» спецификации тренировочных кластеров, ML-инженеры идут от обратного:

Известна ёмкость памяти NVIDIA B100
Оценки времени обучения циркулируют в отраслевых каналах
Число параметров = f(GPU-месяцы, пропускная способность памяти, эффективность обучения)

Этот метод дал оценку «3–5 трлн», ставшую отраслевым консенсусом.

Уровень уверенности: Высокий для активных параметров. У Samsung нет мотива что-либо выдумывать, а математика сходится.

Метод 3: Отпечатки производительности API

Здесь становится интересно. Архитектура модели оставляет производственные «подписи»:

GPT-5 выдаёт 87,4 токенов/с при 84,78 с до первого токена

Паттерны задержек указывают на накладные расходы маршрутизации MoE (у плотных моделей быстрее первый токен)
Пропускная способность по токенам коррелирует с числом активных параметров на основе известных моделей

Инженеры продакшена навязчиво отслеживают эти метрики. Сопоставьте их с открытыми спецификациями открытых моделей — и можно реверс-инжинирить приблизительную архитектуру.

Уровень уверенности: Средний для типа архитектуры, низкий для точных спецификаций. На производительность влияет много факторов помимо параметров.

Метод 4: Коллективный разум

Когда множество независимых анализов сходятся, уверенность растёт. Сейчас у нас есть:

Утечка Samsung: 3–5 трлн параметров
Статистические законы масштабирования: диапазон 2–5 трлн
Анализ сообщества R-bloggers: минимум ~2 трлн, исходя из требований к возможностям
Технический разбор Encord: архитектура MoE с многотриллионной ёмкостью параметров

Отраслевой консенсус помещает GPT-5 в диапазон 2–5 трлн активных параметров при архитектуре MoE. Не потому что единственный источник авторитетен, а потому что независимые методы согласуются.

Спектр достоверности

Будем честны в том, что мы действительно знаем:

Консенсус аналитиков:

«Возможно, у OpenAI есть секретные оптимизации, которые меняют математику масштабирования. Но эти оценки, вероятно, недалеки от реальности».

Эволюция GPT: от грубой силы к интеллектуальной маршрутизации

Чтобы понять архитектуру GPT-5, нужно увидеть, насколько радикально модели эволюционировали всего за пять лет.

GPT-3 (2020): Последняя честная спецификация

175 млрд параметров, все активны для каждого запроса

Плотная трансформерная архитектура — элегантно проста, беспощадно дорога
Обучена на ~300 млрд слов из интернет-текста
Историческое достижение: первая модель, продемонстрировавшая few-shot на масштабе

OpenAI публиковала всё. Число параметров, объём тренировочных данных, диаграммы архитектуры. Последний раз, когда была полная прозрачность.

GPT-4 (2023): Мультимодальный скачок в сторону секретности

Число параметров:

оценки ~1,8 трлн, не подтверждено OpenAI

Архитектура: подозревается ранняя реализация MoE (не подтверждено)
Ломает правила игры: нативное понимание изображений без отдельных моделей

На 40% выше баллы на бенчмарках фактической точности, чем у GPT-3

Это тот момент, когда OpenAI перестала делиться техническими деталями. Никаких архитектурных статей. Никаких подтверждений параметров. Индустрия предполагала ~10× рост параметров от GPT-3 по косвенным признакам, но не получила «чеки».

GPT-5 (2025): Революция эффективности

Параметры:

оценки индустрии — 2–5 трлн активных параметров

Архитектура: продвинутая MoE с интеллектуальной маршрутизацией (выведено по поведению, не подтверждено)
Единая система: быстрый режим, режим глубокого рассуждения (GPT-5 thinking) и маршрутизатор в реальном времени
Подпись производительности:

скорость вывода 87,4 токенов/с, 84,78 с до первого токена

Картина очевидна: GPT-3 → GPT-4 — увеличение параметров примерно в 10 раз. GPT-4 → GPT-5 — возможно, 2–3× по активным параметрам, но архитектурная сложность выросла экспоненциально.

Конкурентная среда: в игру тайны играют все

OpenAI не инициировала секретность параметров — она следует тренду:

Claude (Anthropic):

Параметры не раскрываются, независимые оценки — 1–3 трлн

Gemini Ultra (Google):

Масштабы обучения и число параметров не раскрываются

Llama 3 (Meta): Единственный крупный «опенсорсный» игрок, по-прежнему публикующий спецификации (405B параметров у старшего варианта)

Визуализация таймлайна:

*только активные параметры

Итоговая ёмкость MoE: на 10–25× выше (не подтверждено)

Что это реально означает, если вы строите на GPT-5

Тайны параметров — это увлекательно для техножурналистики. Но если вы продукт-менеджер или инженер, строящий продакшен-системы, важно следующее:

Переосмыслите модели стоимости

Классическое ценообразование ИИ предполагает линейную связь «параметры → стоимость». MoE ломает эту модель.

Старая ментальная модель (эра GPT-3):

Простой запрос: 175 млрд параметров × ставка = $X

Сложный запрос: 175 млрд параметров × ставка = $X

(Предсказуемо, скучно, дорого)

Новая реальность (MoE в GPT-5):

Классификация: ~1–2 трлн активировано = $X

Глубокое рассуждение: ~4–5 трлн активировано = $4–5X

Режим расширенного мышления: переменное число экспертов = ???

Маршрутизатор GPT-5 выбирает экспертов по типу диалога, сложности, потребности в инструментах и явному намерению пользователя. Перевод: формулировка промпта напрямую влияет на счёт.

Практическая оптимизация:

Тестируйте промпты с явными сигналами сложности («быстро классифицируй…» vs «думай шаг за шагом…»)
Отслеживайте, какие формулировки запускают режим расширенного рассуждения
Для высоких объёмов оптимизируйте промпты, чтобы избежать ненужной активации экспертов

Одна команда, с которой мы говорили, сократила расходы на API GPT-5 на 40%, убрав «объясни своё рассуждение» из промптов для классификации. Та же точность, 60% активации экспертов.

Стратегия архитектуры приложений

Не каждой задаче нужен полный пул экспертов GPT-5. Сопоставляйте нагрузку с уровнем модели:

Когда GPT-5 уместен:

Многодоменные рассуждения (код → бизнес-логика → дизайн интерфейса)
Задачи, требующие переключения экспертиз по ходу диалога
Сложная декомпозиция проблем, где меньшие модели не справляются
Сценарии, где точность важнее стоимости запроса

Когда выигрывают меньшие модели:

Высокообъёмная классификация/извлечение
Простые чаты с предсказуемыми паттернами
Латентность-критичные приложения (маршрутизация MoE добавляет 50–100 мс)
Продукты с жёсткими ограничениями бюджета, где «достаточно хорошо» лучше «оптимально»

Много-модельная стратегия

Умные команды не выбирают между GPT-5, Claude и Gemini — они используют все три тактически. Здесь становятся незаменимы платформы вроде CometAPI.

Представьте, что вы управляете тремя интеграциями API: разные методы аутентификации, несовместимые форматы ответов, отдельные биллинговые кабинеты. Теперь умножьте это на каждый вариант модели (GPT-5, Claude Opus4.7, Gemini 3.1 Pro…).

CometAPI решает это, абстрагируя интеграционный слой:

Единый доступ: одна конечная точка API маршрутизирует на GPT-5, Claude, Gemini или open-source модели по вашей логике Автоматическая оптимизация затрат: отправляйте простые запросы в более дешёвые модели, сложные рассуждения — в GPT-5 A/B-фреймворк:

Сравнивайте производительность моделей на вашей реальной нагрузке через эмпирическое бенчмаркинг-тестирование — латентность, пропускная способность, стоимость и точность на репрезентативных промптах

API GPT-5 вводит новые параметры, включая контроль «разговорчивости» и настройки усилий рассуждения. CometAPI предоставляет проверенные конфигурационные шаблоны, чтобы вам не приходилось экспериментировать вслепую.

Честно говоря: мы видели, как команды тратят 2–3 месяца на разработку собственной логики маршрутизации, которую CometAPI поставляет «из коробки». Если много-модельная оркестрация — не ваша ключевая компетенция, используйте чужой абстракционный слой.

Проблема документации (и головная боль комплаенса)

Юристы, закупки и корпоративные архитекторы хотят конкретики. «Отраслевые оценки 2–5 трлн параметров» не проходят в анкетах квалификации поставщика.

Уточняйте в документации, говорите ли вы о полной ёмкости (важно для хранения/лицензий) или об активных параметрах на токен (важно для вычислений рантайма).

Шаблон формулировки для официальных документов:

«OpenAI GPT-5 оценивается в 2–5 трлн активных параметров на основе независимого анализа индустрии (источники: презентация Samsung SemiCon, статистические модели масштабирования, бенчмаркинг производительности). Общая ёмкость параметров может быть выше в 10–25× при использовании архитектуры Mixture-of-Experts. OpenAI публично не подтверждала эти характеристики. Оценки актуальны по состоянию на апрель 2026 года.»

Добавьте ссылки на источники, дату оценки и отметьте неопределённость. Когда (а не если) потребуют «официального подтверждения», эскалируйте вопрос в enterprise-продажи OpenAI — иногда для крупных контрактов они предоставляют ограниченные архитектурные детали под NDA.

Главная мысль: почему считать параметры — вчерашняя метрика

Одержимость вопросом «сколько параметров у GPT-5» напоминает старые холивары, которые плохо состарились:

2000-е: войны мегапикселей в камерах (12MP vs 16MP vs 20MP!)
- Реальность: важнее качество сенсора и оптика
2010-е: гонка гигагерц у CPU (3,2 GHz vs 3,8 GHz!)
- Реальность: победили эффективность архитектуры и многопоточность
2020-е: подсчёт параметров ИИ (175B vs 1,8T vs 52,5T!)
- Реальность: важнее архитектура, интеллект маршрутизации и задачеспецифичная оптимизация

GPT-5 в режиме рассуждения обходит более крупные модели, генерируя при этом на 50–80% меньше выходных токенов. Это не только эффективность — это доказательство, что «умнее» лучше, чем «больше».

Что мы знаем с высокой уверенностью

GPT-5 использует архитектуру Mixture-of-Experts — доказано параллельными реализациями GPT-OSS и «подписями» производительности
Активные параметры вероятнее всего в диапазоне 2–5 трлн — сходятся независимые оценки
Общий пул экспертов потенциально 10–50+ трлн — экстраполяция по коэффициентам MoE, не подтверждено
OpenAI не раскроет детали — осознанная стратегия конкурентной и безопасностной секретности
Производительность опережает «предсказания по параметрам» — бенчмарки указывают на преимущества архитектуры сверх «сырого масштаба»

Что действительно важно для вашей AI-стратегии

Перестаньте оптимизироваться под заголовочные цифры. Начните измерять то, за что вы реально заплатите и что увидят пользователи:

Бенчмаркинг по задачам: прогоняйте ваши реальные промпты через GPT-5, Claude и Gemini. Модель, лучше справляющаяся с вашим доменом, может быть не самой «большой».

Стоимость за полезный результат: модель, дающая идеальный ответ с первого раза, лучше дешёвой, требующей трёх уточнений.

Профили латентности под нагрузкой: тестируйте на масштабе. Накладные расходы маршрутизации MoE могут убить показатели в чувствительных к задержкам приложениях.

Анализ режимов отказа: где модель галлюцинирует или отказывается? Краевые случаи важнее среднего.

Вопрос «52,5 трлн», отвечаем

Правда ли, что у GPT-5 действительно 52,5 трлн параметров?

Возможно, если вы считаете общую ёмкость MoE и кому-то утекли точные внутренние цифры. Скорее нет, если речь об активных параметрах на запрос. Точно вводит в заблуждение, если сравнивать с плотной архитектурой GPT-3 на 175 млрд.

Число не «неверное» — это просто «не то число», на которое стоит смотреть.

Сумма параметров MoE полезна для обсуждений хранения и лицензирования, а активные параметры важны для стоимости вычислений в рантайме.

Спрашивать «насколько большой GPT-5», не уточняя метрику — всё равно что спрашивать «насколько большая библиотека»: вы измеряете полки, текущие выдачи или общий фонд?

Будущее: готовьтесь к большей секретности, а не меньшей

Блэкаут по параметрам у OpenAI — не временная мера. Ожидайте:

Усиление конкуренции → больше архитектурной секретности у всех лабораторий
Маркетинг, сосредоточенный на возможностях → «решает задачу X на Y% лучше» вместо подсчёта параметров
«Чёрный ящик» бенчмаркинга → сторонняя оценка станет единственным источником прозрачности

Серия Llama от Meta остаётся последним крупным игроком с открытыми спецификациями. Остальные следуют за OpenAI в сторону непрозрачности.

Для разработчиков и продуктовых команд это означает:

✅ Стройте модель-агностичные системы — не завязывайтесь на специфику GPT-5, которая может измениться

✅ Используйте абстракционные слои — платформы вроде CometAPI защищают от «текучки» провайдеров

✅ Бенчмаркуйте постоянно — то, что оптимально сегодня, может не быть таковым через полгода

✅ Фокусируйтесь на результатах — спецификации исчезают; метрики производительности — нет

Вывод

Тайна параметров в итоге разрешится — благодаря утечкам, конкурентной разведке или будущей прозрачности OpenAI. Но к тому моменту GPT-6 уже будет в приватной бете, и планка снова сдвинется.

Пусть конкуренты спорят, 2 трлн или 52,5 трлн. Ваша задача — выпускать продукты, которые работают.

Что мы уверенно утверждаем:

GPT-5 большой (многотриллионные параметры)
Он умный (архитектура MoE маршрутизирует эффективно)
Он непрозрачный (OpenAI не подтверждает специфику)
Он результативный (обходит ожидания, основанные на «числе параметров»)

Нельзя точно измерить число параметров. Можно измерить:

Долю успешных задач среди GPT-5, Claude Opus 4.7, Gemini 3.1 Pro
Стоимость на 1K запросов для вашей конкретной нагрузки
P95-латентность при всплесках трафика
Точность модели на ваших краевых случаях

CometAPI: унифицированный агрегатор API моделей ИИ — один API-ключ для доступа к 500+ моделям от OpenAI, Anthropic, Google и других, на 20% ниже официальных тарифов.

Протестируйте модели за 5 минут → Начните с бесплатных кредитов