МоделиПоддержкаПредприятиеБлог
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Ресурсы
AI МоделиБлогПредприятиеЖурнал измененийО нас
2025 CometAPI. Все права защищены.Политика конфиденциальностиУсловия обслуживания
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

Ввод:$0.2/M
Вывод:$1.6/M
Контекст:400K
Максимальный вывод:128K
GPT-5 mini — оптимизированный по стоимости и задержке представитель семейства GPT-5 от OpenAI, предназначенный для предоставления значительной части мультимодальных возможностей и качества следования инструкциям, присущих GPT-5, при значительно более низкой стоимости для крупномасштабного промышленного применения. Он ориентирован на среды, где основными ограничениями являются пропускная способность, предсказуемая цена за токен и быстрые ответы, при этом сохраняя мощные универсальные возможности.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API

Основная информация и ключевые особенности

GPT-5 mini — это оптимизированная по стоимости и задержке модель семейства GPT-5 от OpenAI, предназначенная для того, чтобы обеспечивать значительную часть мультимодальных возможностей и сильных сторон в следовании инструкциям, присущих GPT-5, при существенно более низкой стоимости для крупномасштабного производственного использования. Она ориентирована на сценарии, где основными ограничениями являются пропускная способность, предсказуемая цена за токен и быстрые ответы, при этом сохраняя сильные универсальные возможности.

  • Название модели: gpt-5-mini
  • Контекстное окно: 400 000 токенов
  • Максимум выходных токенов: 128 000
  • Ключевые особенности: скорость, пропускная способность, экономичность, детерминированные ответы для кратких запросов

Как работает gpt-5-mini?

Оптимизированный путь инференса и развертывания. Практическое ускорение достигается за счет слияния ядер, тензорного параллелизма, настроенного для меньшего графа, и среды выполнения инференса, которая предпочитает более короткие внутренние циклы «размышления», если только разработчик не запрашивает более глубокое рассуждение. Поэтому mini обеспечивает заметно меньшие вычислительные затраты на один вызов и предсказуемую задержку при высоконагруженном трафике. Этот компромисс сделан намеренно: меньше вычислений на один прямой проход → ниже стоимость и ниже средняя задержка.

Управление со стороны разработчика. GPT-5 mini предоставляет такие параметры, как verbosity (управляет детализацией/длиной) и reasoning_effort (баланс между скоростью и глубиной), а также надежную поддержку вызова инструментов (вызовы функций, параллельные цепочки инструментов и структурированная обработка ошибок), что позволяет производственным системам точно настраивать баланс между точностью и стоимостью.

Производительность в бенчмарках — ключевые показатели и интерпретация

GPT-5 mini обычно достигает примерно ~85–95% уровня GPT-5 high на общих бенчмарках, при этом значительно выигрывая по задержке и цене. Материалы запуска платформы указывают на очень высокие абсолютные результаты GPT-5 high (AIME ≈ 94.6% для топовой версии), тогда как mini показывает несколько более низкие результаты, но все равно остается лидером отрасли в своей ценовой категории.

На ряде стандартизированных и внутренних бенчмарков GPT-5 mini показывает:

  • Интеллект (AIME ’25): 91.1% (против 94.6% у GPT-5 high)
  • Мультимодальность (MMMU): 81.6% (против 84.2% у GPT-5 high)
  • Программирование (SWE-bench Verified): 71.0% (против 74.9% у GPT-5 high)
  • Следование инструкциям (Scale MultiChallenge): 62.3% (против 69.6%)
  • Вызов функций (τ²-bench telecom): 74.1% (против 96.7%)
  • Уровень галлюцинаций (LongFact-Concepts): 0.7% (меньше — лучше)([OpenAI][4])

Эти результаты демонстрируют надежный баланс GPT-5 mini между производительностью, стоимостью и скоростью.

Ограничения

Известные ограничения: GPT-5 mini обладает сниженной способностью к глубокому рассуждению по сравнению с полной GPT-5, более чувствителен к неоднозначным запросам и по-прежнему подвержен рискам галлюцинаций.

  • Сниженная глубина рассуждения: Для многошаговых задач рассуждения с длинным горизонтом полная reasoning-модель или варианты с «мышлением» превосходят mini.
  • Галлюцинации и чрезмерная уверенность: Mini снижает уровень галлюцинаций по сравнению с очень маленькими моделями, но не устраняет их полностью; результаты следует проверять в сценариях с высокой ответственностью (юридическая, клиническая, комплаенс-сфера).
  • Чувствительность к контексту: Для очень длинных, сильно взаимозависимых цепочек контекста лучше подходят полные варианты GPT-5 с более крупными контекстными окнами или модель с «мышлением».
  • Ограничения безопасности и политик: Те же защитные механизмы безопасности и ограничения по скорости/использованию, которые применяются к другим моделям GPT-5, применяются и к mini; чувствительные задачи требуют участия человека.

Что делает gpt-5-mini?

  • Высоконагруженные разговорные агенты: низкая задержка, предсказуемая стоимость.
  • Суммаризация документов и мультимодального контента: суммаризация длинного контекста, отчеты по изображениям и тексту.
  • Инструменты для разработчиков в масштабе: проверки кода в CI, автоматическое ревью, облегченная генерация кода.
  • Оркестрация агентов: вызов инструментов с параллельными цепочками там, где не требуется глубокое рассуждение.

Как начать использовать API gpt-5-mini?

Обязательные шаги

  • Войдите в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь
  • Получите учетные данные доступа — API key интерфейса. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте его.
  • Получите URL этого сайта: https://api.cometapi.com/

Способ использования

  1. Выберите endpoint “gpt-5-mini“ / "gpt-5-mini-2025-08-07" для отправки API-запроса и настройте тело запроса. Метод запроса и тело запроса можно получить из API-документации на нашем сайте. На нашем сайте также доступен тест Apifox для вашего удобства.
  2. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашей учетной записи.
  3. Вставьте ваш вопрос или запрос в поле content — именно на него модель ответит.
  4. . Обработайте API-ответ, чтобы получить сгенерированный ответ.

CometAPI предоставляет полностью совместимый REST API — для бесшовной миграции. Основные сведения см. в  API doc:

  • Основные параметры: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Параметр модели: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • Аутентификация:  Bearer YOUR_CometAPI_API_KEY 
  • Content-Type: application/json .

Инструкции по вызову API: gpt-5-chat-latest следует вызывать, используя стандартный формат /v1/chat/completions format. Для других моделей (gpt-5, gpt-5-mini, gpt-5-nano и их датированных версий) рекомендуется использовать the /v1/responses format is recommended. В настоящее время доступны два режима.

Функции для GPT-5 mini

Изучите ключевые функции GPT-5 mini, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для GPT-5 mini

Изучите конкурентоспособные цены на GPT-5 mini, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как GPT-5 mini может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$0.2/M
Вывод:$1.6/M
Ввод:$0.25/M
Вывод:$2/M
-20%

Пример кода и API для GPT-5 mini

GPT-5 mini — легковесный, оптимизированный по стоимости вариант флагманской модели GPT-5 от OpenAI, предназначенный для обеспечения высокого качества рассуждений и мультимодальных возможностей при меньшей задержке и меньших затратах.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Больше моделей

A

Claude Opus 4.6

Ввод:$4/M
Вывод:$20/M
Claude Opus 4.6 — большая языковая модель класса «Opus» компании Anthropic, выпущенная в феврале 2026 года. Она позиционируется как «рабочая лошадка» для интеллектуального труда и исследовательских рабочих процессов — ориентирована на улучшение рассуждений на длинных контекстах, многошагового планирования, использования инструментов (включая агентные программные рабочие процессы) и выполнения компьютерных задач, таких как автоматизированное создание слайдов и электронных таблиц.
A

Claude Sonnet 4.6

Ввод:$2.4/M
Вывод:$12/M
Claude Sonnet 4.6 — наша самая мощная на сегодняшний день модель Sonnet. Это полноценное обновление навыков модели в областях программирования, использования компьютера, рассуждений с длинным контекстом, агентного планирования, интеллектуальной работы и дизайна. Sonnet 4.6 также поддерживает окно контекста на 1M токенов в бета-версии.
O

GPT-5.4 nano

Ввод:$0.16/M
Вывод:$1/M
GPT-5.4 nano предназначен для задач, в которых наибольшее значение имеют скорость и затраты, таких как классификация, извлечение данных, ранжирование и подагенты.
O

GPT-5.4 mini

Ввод:$0.6/M
Вывод:$3.6/M
GPT-5.4 mini сочетает сильные стороны GPT-5.4 с более быстрой и эффективной моделью, разработанной для высоконагруженных сценариев использования.
A

Claude Mythos Preview

A

Claude Mythos Preview

Скоро
Ввод:$60/M
Вывод:$240/M
Claude Mythos Preview является нашей самой мощной на сегодняшний день передовой моделью и демонстрирует поразительный скачок в результатах на многих оценочных бенчмарках по сравнению с нашей предыдущей передовой моделью Claude Opus 4.6.
X

mimo-v2-pro

Ввод:$0.8/M
Вывод:$2.4/M
MiMo-V2-Pro — флагманская базовая модель Xiaomi с более чем 1T общих параметров и длиной контекста 1M, глубоко оптимизированная для агентных сценариев. Она обладает высокой адаптивностью к универсальным агентным фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она входит в число мировых лидеров, а по воспринимаемой производительности приближается к уровню Opus 4.6. MiMo-V2-Pro создана, чтобы служить мозгом агентных систем, оркестрировать сложные рабочие процессы, обеспечивать выполнение инженерных задач в production-среде и надежно выдавать результаты.