МоделиЦеныПредприятие
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Компания
О насПредприятие
Ресурсы
AI МоделиБлогЖурнал измененийПоддержка
Условия обслуживанияПолитика конфиденциальности
© 2026 CometAPI · All rights reserved
Home/Models/OpenAI/GPT-5 nano
O

GPT-5 nano

Ввод:$0.04/M
Вывод:$0.32/M
Контекст:400K
Максимальный вывод:128K
GPT-5 Nano — модель искусственного интеллекта, предоставляемая OpenAI.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API

GPT-5 Nano — это ультралёгкий вариант семейства GPT-5 компании OpenAI с низкой задержкой, разработанный для чувствительных к стоимости, работающих в реальном времени и высокопоточных приложений, где скорость и цена важнее глубокого многошагового рассуждения. Он сохраняет улучшения GPT-5 в следовании инструкциям и безопасности, но жертвует глубиной рассуждений и частью возможностей длинного контекста, чтобы обеспечить очень низкую задержку и очень низкую стоимость токена.

Основная информация и возможности

  • Model Name: gpt-5-nano
  • Multimodal Support: Текст и изображение (до 400K токенов контекста)
  • Context Window: 400,000 входных токенов; 128,000 выходных токенов
  • Цены
    :
    • Ввод: $0.05 за 1M токенов
    • Вывод: $0.40 за 1M токенов

По сравнению с GPT-5 main, GPT-5 nano жертвует сырой мощностью ради ультранизкой задержки и снижения стоимости, что делает его идеальным для интерактивных приложений, где критичны скорость и бюджет.

Технические детали

GPT-5 nano использует ту же трансформерную архитектуру, что и старшие модели, но включает продвинутые техники квантизации и прореживания параметров для уменьшения размера. Он предлагает:

  • Минимальные рассуждения: упрощённый путь рассуждений, оптимизированный для одношагового вывода, эмулирующий «встроенное мышление» GPT-5 при сниженных вычислительных затратах.
  • Контроль многословности: настраиваемый параметр многословности для тонкой настройки длины и детализации ответа.
  • Эффективное внимание: специальные ядра внимания для развёртывания с низкими требованиями к памяти без ущерба для способности модели обрабатывать длинные последовательности.

В сравнении с GPT-4 o mini, GPT-5 nano демонстрирует до 2× более высокую пропускную способность на идентичном оборудовании благодаря легковесному дизайну.


Производительность в бенчмарках

Хотя GPT-5 main лидирует по абсолютным показателям, GPT-5 nano обеспечивает конкурентную точность на ключевых бенчмарках:

  • SWE-Bench (инженерия программного обеспечения): достигает ~75% точности генерации кода от GPT-5 main при сокращении времени инференса примерно на ~50%.
  • HealthBench: сохраняет ~80% уровня клинических рассуждений GPT-5 main, подходит для базового триажа и задач суммирования.
  • Многоязычные тесты: удерживает надёжную поддержку 12 языков, с падением качества перевода менее чем на 10% по сравнению с GPT-5 main.

Эти результаты подчёркивают пригодность GPT-5 nano для сред, чувствительных к стоимости, и критичных к задержке, где небольшие компромиссы в точности приемлемы.


Версия модели и место в линейке

  • Model Card Name: gpt-5-nano
  • Граница знаний: 30 мая 2024 года для варианта nano
  • Положение в семействе
    :
    • Заменяет GPT-4.1 nano как начальный уровень
    • Находится ниже GPT-5 mini и GPT-5 main в иерархии производительности

Вариант nano наследует улучшения из обучения GPT-5 main, включая сниженную склонность к галлюцинациям и структурные рассуждения, хотя и в меньшем масштабе.


Ограничения

Хотя GPT-5 nano превосходит по скорости и стоимости, у него есть врождённые недостатки:

  • Сниженная глубина: ограниченная способность к многошаговым рассуждениям по сравнению с GPT-5 main, что делает его менее подходящим для сложных задач планирования.
  • Более высокая склонность к галлюцинациям: слегка повышенный риск генерации неверных деталей при неоднозначных запросах.
  • Ниже воспоминаемость контекста: хотя окно токенов велико, внутренние механизмы отдают приоритет недавнему контексту, что может приводить к упущению более ранних деталей в очень длинных диалогах.

Разработчикам следует учитывать эти ограничения при выборе GPT-5 nano для приложений, требующих высокой фактической достоверности.


Сценарии использования

GPT-5 nano особенно эффективен в сценариях, где первостепенны реакции в реальном времени и контроль затрат:

  1. Мобильные ассистенты: чат-боты на устройстве для мессенджеров, обеспечивающие мгновенные ответы без облачных накладных расходов.
  2. Интерфейсы IoT: голосовое управление в устройствах умного дома, использующее низкую задержку инференса.
  3. Аналитика на периферии: суммирование данных датчиков локально перед пакетной выгрузкой, сокращая использование пропускной способности.
  4. Образовательные инструменты: облегчённые обучающие боты, работающие в браузере или на маломощном железе, обеспечивая интерактивное обучение.

По сравнению с запуском GPT-5 main в тяжёлой облачной среде, nano обеспечивает распределённое развёртывание в масштабе с предсказуемой стоимостью за токен.

Как начать использовать API gpt-5-nano?

Обязательные шаги

  • Войдите на cometapi.com. Если вы ещё не наш пользователь, пожалуйста, сначала зарегистрируйтесь.
  • Получите учётные данные — ключ API интерфейса. Нажмите "Add Token" в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.
  • Получите URL этого сайта: https://api.cometapi.com/

Способ использования

  1. Выберите endpoint “**gpt-5-nano**” / "gpt-5-nano-2025-08-07" для отправки API-запроса и задайте тело запроса. Метод и тело запроса берите из документации API на нашем сайте. Для вашего удобства на нашем сайте также доступно тестирование в Apifox.
  2. Замените <YOUR_API_KEY> на ваш фактический ключ CometAPI из вашего аккаунта.
  3. Вставьте ваш вопрос или запрос в поле content — на него модель и ответит.
  4. . Обработайте ответ API, чтобы получить сгенерированный ответ.

CometAPI предоставляет полностью совместимый REST API — для бесшовной миграции. Ключевые детали см. в документации API:

  • Core Parameters: prompt, max_tokens_to_sample, temperature, stop_sequences
  • Endpoint: https://api.cometapi.com/v1/chat/completions
  • Model Parameter: “gpt-5-nano” / "gpt-5-nano-2025-08-07"
  • Authentication: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

Инструкции по вызовам API: gpt-5-chat-latest следует вызывать, используя стандартный /v1/chat/completions format. Для прочих моделей (gpt-5, gpt-5-mini, gpt-5-nano и их датированных версий) использование the /v1/responses format рекомендуется.В настоящее время доступны два режима.

Цены для GPT-5 nano

Изучите конкурентоспособные цены на GPT-5 nano, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как GPT-5 nano может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$0.04/M
Вывод:$0.32/M
Ввод:$0.05/M
Вывод:$0.4/M
-20%

Пример кода и API для GPT-5 nano

GPT-5 Nano — это ультралёгкий вариант с низкой задержкой из семейства GPT-5 от OpenAI, предназначенный для приложений, чувствительных к стоимости, работающих в реальном времени и с высокой пропускной способностью, где скорость и цена важнее, чем глубокое многошаговое рассуждение. Он сохраняет улучшения GPT-5 в следовании инструкциям и безопасности, но ради обеспечения очень низкой задержки и очень низкой стоимости токенов жертвует глубиной рассуждения и частью возможностей работы с длинным контекстом.
POST
/v1/chat/completions
POST
/v1/responses
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-nano-2025-08-07", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-nano-2025-08-07", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-nano-2025-08-07",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-nano-2025-08-07",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'