Введите в Google “GPT-5 parameters” — и вы утонете в противоречивых цифрах. 2 трлн? 5 трлн? Сносящие крышу 52,5 трлн? Мы провели три недели, чтобы проанализировать ответ — чтобы вам не пришлось.
GPT-5 вышел 7 августа 2025 года и стал крупнейшим релизом OpenAI со времён GPT-4. Но в отличие от предыдущих поколений, внутренняя “начинка” модели остаётся намеренно непрозрачной. После трёх недель анализа паттернов задержек API, сопоставления бенчмарков с моделями известного размера и консультаций с инженерами, которые тестировали GPT-5 на масштабах продакшена, вот чему мы действительно доверяем — и где индустрия всё ещё гадает.
Сколько параметров у GPT-5
Худшая из всех неохраняемых тайн AI-индустрии: никто на самом деле не знает, насколько большой GPT-5.
Треды на Reddit уверенно называют 52,5 трлн параметров. Утекшая презентация Samsung с SemiCon Taiwan говорит о 3–5 трлн. Отраслевые аналитики осторожничают: «оценка 2–5 трлн». Официальная документация OpenAI? Вызывающе молчит. На вопросы журналистов команда developer relations вежливо отвечает: «мы не раскрываем детали архитектуры по конкурентным причинам».
Поэтому мы сделали это сами: проанализировали.
[ПОЛНОЕ РАСКРЫТИЕ: Ниже — расследовательский анализ, а не подтверждённые факты. OpenAI не подтверждал ни один подсчёт параметров для GPT-5. Мы синтезировали выводы из баз бенчмарков, утёкших характеристик оборудования, паттернов работы API и интервью с ML -инженерами, использующими GPT-5 в продакшене. Относитесь к нашим выводам как к информированному «детективному» расследованию, а не к догме.]
Почему «52,5 трлн параметров» технически возможно и практически бессмысленно
Представьте: вы наняли 100 экспертов-консультантов, но оплачиваете труд лишь 4 из них на каждый проект. В оргструктуре — 100 сотрудников. В отчётах финслужбы — 4. Какое число определяет размер компании?
Оба. И ни одно. Добро пожаловать в парадокс Mixture-of-Experts.
Цифра «52,5 трлн» относится к общей ёмкости параметров в архитектуре Mixture-of-Experts (MoE), а не к «активируемым» параметрам. Это как разница между полной библиотекой и 3–5 книгами, к которым вы обращаетесь для конкретного исследования. Полный каталог важен для возможностей; активная подвыборка определяет стоимость.
Неоспоримое свидетельство: GPT-OSS раскрывает MoE-стратегию OpenAI
OpenAI случайно выдала свои карты.
GPT-OSS-120b содержит 117 млрд общих параметров и лишь 5,1 млрд активных параметров на запрос. Это соотношение 23:1 между размером «библиотеки» и «консультацией».
Применим эту математику. Если GPT-5 активирует 2–5 трлн параметров на запрос (индустриальная консенсус-оценка) и использует аналогичные коэффициенты MoE, то суммарная ёмкость параметров может достигать 46–115 трлн.
Внезапно 52,5 трлн звучит не как байка из интернета — а как утечка размера общего пула экспертов, в то время как остальные говорят об активных параметрах. Та же модель, разные метрики — и радикально разные заголовки.
Почему этот архитектурный сдвиг меняет всё
Архитектуры MoE позволяют резко снизить вычислительные затраты при предобучении и ускорить инференс. Для тех, кто строит продукты на GPT-5, это не теория — это новая экономика:
Во что обходятся традиционные плотные модели:
- Каждый запрос задействует все 175 млрд параметров (как у GPT-3)
- Линейное масштабирование: 10× параметры = 10× вычисления = 10× цена
- Простое ценообразование, предсказуемо, но дорого
Как MoE меняет расчёты:
Маршрутизатор решает, каких экспертов активировать, исходя из типа запроса, сложности и намерения пользователя
- При общей ёмкости 50 трлн фактически может тарифицироваться 2 трлн активных параметров
- Огромные возможности при доле стоимости — но прайсинг становится зависящим от промпта
Доказательство из практики:
GPT-5 с расширенным рассуждением использует на 50–80% меньше токенов, чем сопоставимые модели. Это не просто компрессия — это более умный роутинг, который избегает ненужной активации экспертов.
Подвох? Ваш prompt engineering напрямую влияет на то, какие эксперты «просыпаются». Попросите «быструю классификацию» — и вы, возможно, активируете лёгких специалистов. Попросите «подумать тщательно через многоступенчатое доказательство» — и вы подключаете кластер тяжёлых рассуждений. Одна и та же модель — разница в стоимости 3–5×.
Итог: Оценивая стоимость GPT-5, забудьте про число параметров в заголовке. Тестируйте свои реальные промпты и измеряйте расход токенов — MoE делает теоретические спецификации почти бесполезными для прогнозирования затрат.
Как отраслевые аналитики реверс-инжинирят то, о чём OpenAI молчит
Поскольку OpenAI не публикует спецификации, исследователи разработали судебно-экспертные методы оценки размера модели. CSI для нейросетей.
Метод 1: Регрессия по бенчмаркам
Аналитики оценивают параметры, сравнивая результаты с моделями известного размера с помощью статистической регрессии по данным лидербордов.
Процесс: собрать баллы с платформ вроде Artificial Analysis, Chatbot Arena, HumanEval. Нанести известные модели (Llama 3 405B, Claude Sonnet и т. п.) на график «производительность vs параметры». Балы GPT-5 помещают её в кластер 2–5 трлн при прогоне регрессионных кривых.
Уровень уверенности: Средний. Предполагает, что законы масштабирования сохраняются, что не гарантировано при архитектурных нововведениях.
Метод 2: Аппаратная криминалистика
Анализ Samsung на SemiCon Taiwan оценил GPT-5 в 3–5 трлн параметров, обученную на 7000× NVIDIA B100.
Когда партнёры по аппаратуре «сливают» спецификации тренировочных кластеров, ML-инженеры идут от обратного:
- Известна ёмкость памяти NVIDIA B100
- Оценки времени обучения циркулируют в отраслевых каналах
- Число параметров = f(GPU-месяцы, пропускная способность памяти, эффективность обучения)
Этот метод дал оценку «3–5 трлн», ставшую отраслевым консенсусом.
Уровень уверенности: Высокий для активных параметров. У Samsung нет мотива что-либо выдумывать, а математика сходится.
Метод 3: Отпечатки производительности API
Здесь становится интересно. Архитектура модели оставляет производственные «подписи»:
GPT-5 выдаёт 87,4 токенов/с при 84,78 с до первого токена
- Паттерны задержек указывают на накладные расходы маршрутизации MoE (у плотных моделей быстрее первый токен)
- Пропускная способность по токенам коррелирует с числом активных параметров на основе известных моделей
Инженеры продакшена навязчиво отслеживают эти метрики. Сопоставьте их с открытыми спецификациями открытых моделей — и можно реверс-инжинирить приблизительную архитектуру.
Уровень уверенности: Средний для типа архитектуры, низкий для точных спецификаций. На производительность влияет много факторов помимо параметров.
Метод 4: Коллективный разум
Когда множество независимых анализов сходятся, уверенность растёт. Сейчас у нас есть:
- Утечка Samsung: 3–5 трлн параметров
- Статистические законы масштабирования: диапазон 2–5 трлн
- Анализ сообщества R-bloggers: минимум ~2 трлн, исходя из требований к возможностям
- Технический разбор Encord: архитектура MoE с многотриллионной ёмкостью параметров
Отраслевой консенсус помещает GPT-5 в диапазон 2–5 трлн активных параметров при архитектуре MoE. Не потому что единственный источник авторитетен, а потому что независимые методы согласуются.
Спектр достоверности
Будем честны в том, что мы действительно знаем:
Консенсус аналитиков:
«Возможно, у OpenAI есть секретные оптимизации, которые меняют математику масштабирования. Но эти оценки, вероятно, недалеки от реальности».
Эволюция GPT: от грубой силы к интеллектуальной маршрутизации
Чтобы понять архитектуру GPT-5, нужно увидеть, насколько радикально модели эволюционировали всего за пять лет.
GPT-3 (2020): Последняя честная спецификация
175 млрд параметров, все активны для каждого запроса
- Плотная трансформерная архитектура — элегантно проста, беспощадно дорога
- Обучена на ~300 млрд слов из интернет-текста
- Историческое достижение: первая модель, продемонстрировавшая few-shot на масштабе
OpenAI публиковала всё. Число параметров, объём тренировочных данных, диаграммы архитектуры. Последний раз, когда была полная прозрачность.
GPT-4 (2023): Мультимодальный скачок в сторону секретности
- Число параметров:
оценки ~1,8 трлн, не подтверждено OpenAI
- Архитектура: подозревается ранняя реализация MoE (не подтверждено)
- Ломает правила игры: нативное понимание изображений без отдельных моделей
На 40% выше баллы на бенчмарках фактической точности, чем у GPT-3
Это тот момент, когда OpenAI перестала делиться техническими деталями. Никаких архитектурных статей. Никаких подтверждений параметров. Индустрия предполагала ~10× рост параметров от GPT-3 по косвенным признакам, но не получила «чеки».
GPT-5 (2025): Революция эффективности
- Параметры:
оценки индустрии — 2–5 трлн активных параметров
- Архитектура: продвинутая MoE с интеллектуальной маршрутизацией (выведено по поведению, не подтверждено)
- Единая система: быстрый режим, режим глубокого рассуждения (GPT-5 thinking) и маршрутизатор в реальном времени
- Подпись производительности:
скорость вывода 87,4 токенов/с, 84,78 с до первого токена
Картина очевидна: GPT-3 → GPT-4 — увеличение параметров примерно в 10 раз. GPT-4 → GPT-5 — возможно, 2–3× по активным параметрам, но архитектурная сложность выросла экспоненциально.
Конкурентная среда: в игру тайны играют все
OpenAI не инициировала секретность параметров — она следует тренду:
- Claude (Anthropic):
Параметры не раскрываются, независимые оценки — 1–3 трлн
- Gemini Ultra (Google):
Масштабы обучения и число параметров не раскрываются
- Llama 3 (Meta): Единственный крупный «опенсорсный» игрок, по-прежнему публикующий спецификации (405B параметров у старшего варианта)
Визуализация таймлайна:
*только активные параметры
Итоговая ёмкость MoE: на 10–25× выше (не подтверждено)
Что это реально означает, если вы строите на GPT-5
Тайны параметров — это увлекательно для техножурналистики. Но если вы продукт-менеджер или инженер, строящий продакшен-системы, важно следующее:
Переосмыслите модели стоимости
Классическое ценообразование ИИ предполагает линейную связь «параметры → стоимость». MoE ломает эту модель.
Старая ментальная модель (эра GPT-3):
Простой запрос: 175 млрд параметров × ставка = $X
Сложный запрос: 175 млрд параметров × ставка = $X
(Предсказуемо, скучно, дорого)
Новая реальность (MoE в GPT-5):
Классификация: ~1–2 трлн активировано = $X
Глубокое рассуждение: ~4–5 трлн активировано = $4–5X
Режим расширенного мышления: переменное число экспертов = ???
Маршрутизатор GPT-5 выбирает экспертов по типу диалога, сложности, потребности в инструментах и явному намерению пользователя. Перевод: формулировка промпта напрямую влияет на счёт.
Практическая оптимизация:
- Тестируйте промпты с явными сигналами сложности («быстро классифицируй…» vs «думай шаг за шагом…»)
- Отслеживайте, какие формулировки запускают режим расширенного рассуждения
- Для высоких объёмов оптимизируйте промпты, чтобы избежать ненужной активации экспертов
Одна команда, с которой мы говорили, сократила расходы на API GPT-5 на 40%, убрав «объясни своё рассуждение» из промптов для классификации. Та же точность, 60% активации экспертов.
Стратегия архитектуры приложений
Не каждой задаче нужен полный пул экспертов GPT-5. Сопоставляйте нагрузку с уровнем модели:
Когда GPT-5 уместен:
- Многодоменные рассуждения (код → бизнес-логика → дизайн интерфейса)
- Задачи, требующие переключения экспертиз по ходу диалога
- Сложная декомпозиция проблем, где меньшие модели не справляются
- Сценарии, где точность важнее стоимости запроса
Когда выигрывают меньшие модели:
- Высокообъёмная классификация/извлечение
- Простые чаты с предсказуемыми паттернами
- Латентность-критичные приложения (маршрутизация MoE добавляет 50–100 мс)
- Продукты с жёсткими ограничениями бюджета, где «достаточно хорошо» лучше «оптимально»
Много-модельная стратегия
Умные команды не выбирают между GPT-5, Claude и Gemini — они используют все три тактически. Здесь становятся незаменимы платформы вроде CometAPI.
Представьте, что вы управляете тремя интеграциями API: разные методы аутентификации, несовместимые форматы ответов, отдельные биллинговые кабинеты. Теперь умножьте это на каждый вариант модели (GPT-5, Claude Opus4.7, Gemini 3.1 Pro…).
CometAPI решает это, абстрагируя интеграционный слой:
Единый доступ: одна конечная точка API маршрутизирует на GPT-5, Claude, Gemini или open-source модели по вашей логике Автоматическая оптимизация затрат: отправляйте простые запросы в более дешёвые модели, сложные рассуждения — в GPT-5 A/B-фреймворк:
Сравнивайте производительность моделей на вашей реальной нагрузке через эмпирическое бенчмаркинг-тестирование — латентность, пропускная способность, стоимость и точность на репрезентативных промптах
API GPT-5 вводит новые параметры, включая контроль «разговорчивости» и настройки усилий рассуждения. CometAPI предоставляет проверенные конфигурационные шаблоны, чтобы вам не приходилось экспериментировать вслепую.
Честно говоря: мы видели, как команды тратят 2–3 месяца на разработку собственной логики маршрутизации, которую CometAPI поставляет «из коробки». Если много-модельная оркестрация — не ваша ключевая компетенция, используйте чужой абстракционный слой.
Проблема документации (и головная боль комплаенса)
Юристы, закупки и корпоративные архитекторы хотят конкретики. «Отраслевые оценки 2–5 трлн параметров» не проходят в анкетах квалификации поставщика.
Уточняйте в документации, говорите ли вы о полной ёмкости (важно для хранения/лицензий) или об активных параметрах на токен (важно для вычислений рантайма).
Шаблон формулировки для официальных документов:
«OpenAI GPT-5 оценивается в 2–5 трлн активных параметров на основе независимого анализа индустрии (источники: презентация Samsung SemiCon, статистические модели масштабирования, бенчмаркинг производительности). Общая ёмкость параметров может быть выше в 10–25× при использовании архитектуры Mixture-of-Experts. OpenAI публично не подтверждала эти характеристики. Оценки актуальны по состоянию на апрель 2026 года.»
Добавьте ссылки на источники, дату оценки и отметьте неопределённость. Когда (а не если) потребуют «официального подтверждения», эскалируйте вопрос в enterprise-продажи OpenAI — иногда для крупных контрактов они предоставляют ограниченные архитектурные детали под NDA.
Главная мысль: почему считать параметры — вчерашняя метрика
Одержимость вопросом «сколько параметров у GPT-5» напоминает старые холивары, которые плохо состарились:
- 2000-е: войны мегапикселей в камерах (12MP vs 16MP vs 20MP!)
- Реальность: важнее качество сенсора и оптика
- 2010-е: гонка гигагерц у CPU (3,2 GHz vs 3,8 GHz!)
- Реальность: победили эффективность архитектуры и многопоточность
- 2020-е: подсчёт параметров ИИ (175B vs 1,8T vs 52,5T!)
- Реальность: важнее архитектура, интеллект маршрутизации и задачеспецифичная оптимизация
GPT-5 в режиме рассуждения обходит более крупные модели, генерируя при этом на 50–80% меньше выходных токенов. Это не только эффективность — это доказательство, что «умнее» лучше, чем «больше».
Что мы знаем с высокой уверенностью
- GPT-5 использует архитектуру Mixture-of-Experts — доказано параллельными реализациями GPT-OSS и «подписями» производительности
- Активные параметры вероятнее всего в диапазоне 2–5 трлн — сходятся независимые оценки
- Общий пул экспертов потенциально 10–50+ трлн — экстраполяция по коэффициентам MoE, не подтверждено
- OpenAI не раскроет детали — осознанная стратегия конкурентной и безопасностной секретности
- Производительность опережает «предсказания по параметрам» — бенчмарки указывают на преимущества архитектуры сверх «сырого масштаба»
Что действительно важно для вашей AI-стратегии
Перестаньте оптимизироваться под заголовочные цифры. Начните измерять то, за что вы реально заплатите и что увидят пользователи:
Бенчмаркинг по задачам: прогоняйте ваши реальные промпты через GPT-5, Claude и Gemini. Модель, лучше справляющаяся с вашим доменом, может быть не самой «большой».
Стоимость за полезный результат: модель, дающая идеальный ответ с первого раза, лучше дешёвой, требующей трёх уточнений.
Профили латентности под нагрузкой: тестируйте на масштабе. Накладные расходы маршрутизации MoE могут убить показатели в чувствительных к задержкам приложениях.
Анализ режимов отказа: где модель галлюцинирует или отказывается? Краевые случаи важнее среднего.
Вопрос «52,5 трлн», отвечаем
Правда ли, что у GPT-5 действительно 52,5 трлн параметров?
Возможно, если вы считаете общую ёмкость MoE и кому-то утекли точные внутренние цифры. Скорее нет, если речь об активных параметрах на запрос. Точно вводит в заблуждение, если сравнивать с плотной архитектурой GPT-3 на 175 млрд.
Число не «неверное» — это просто «не то число», на которое стоит смотреть.
Сумма параметров MoE полезна для обсуждений хранения и лицензирования, а активные параметры важны для стоимости вычислений в рантайме.
Спрашивать «насколько большой GPT-5», не уточняя метрику — всё равно что спрашивать «насколько большая библиотека»: вы измеряете полки, текущие выдачи или общий фонд?
Будущее: готовьтесь к большей секретности, а не меньшей
Блэкаут по параметрам у OpenAI — не временная мера. Ожидайте:
- Усиление конкуренции → больше архитектурной секретности у всех лабораторий
- Маркетинг, сосредоточенный на возможностях → «решает задачу X на Y% лучше» вместо подсчёта параметров
- «Чёрный ящик» бенчмаркинга → сторонняя оценка станет единственным источником прозрачности
Серия Llama от Meta остаётся последним крупным игроком с открытыми спецификациями. Остальные следуют за OpenAI в сторону непрозрачности.
Для разработчиков и продуктовых команд это означает:
✅ Стройте модель-агностичные системы — не завязывайтесь на специфику GPT-5, которая может измениться
✅ Используйте абстракционные слои — платформы вроде CometAPI защищают от «текучки» провайдеров
✅ Бенчмаркуйте постоянно — то, что оптимально сегодня, может не быть таковым через полгода
✅ Фокусируйтесь на результатах — спецификации исчезают; метрики производительности — нет
Вывод
Тайна параметров в итоге разрешится — благодаря утечкам, конкурентной разведке или будущей прозрачности OpenAI. Но к тому моменту GPT-6 уже будет в приватной бете, и планка снова сдвинется.
Пусть конкуренты спорят, 2 трлн или 52,5 трлн. Ваша задача — выпускать продукты, которые работают.
Что мы уверенно утверждаем:
- GPT-5 большой (многотриллионные параметры)
- Он умный (архитектура MoE маршрутизирует эффективно)
- Он непрозрачный (OpenAI не подтверждает специфику)
- Он результативный (обходит ожидания, основанные на «числе параметров»)
Нельзя точно измерить число параметров. Можно измерить:
- Долю успешных задач среди GPT-5, Claude Opus 4.7, Gemini 3.1 Pro
- Стоимость на 1K запросов для вашей конкретной нагрузки
- P95-латентность при всплесках трафика
- Точность модели на ваших краевых случаях
CometAPI: унифицированный агрегатор API моделей ИИ — один API-ключ для доступа к 500+ моделям от OpenAI, Anthropic, Google и других, на 20% ниже официальных тарифов.
Протестируйте модели за 5 минут → Начните с бесплатных кредитов
