МоделиПоддержкаПредприятиеБлог
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Ресурсы
AI МоделиБлогПредприятиеЖурнал измененийО нас
2025 CometAPI. Все права защищены.Политика конфиденциальностиУсловия обслуживания
Home/Models/OpenAI/GPT-5.1
O

GPT-5.1

Ввод:$1/M
Вывод:$8/M
GPT-5.1 — универсальная инструкционно дообученная языковая модель, ориентированная на генерацию текста и рассуждение в рамках продуктовых рабочих процессов. Она поддерживает многоходовой диалог, форматирование структурированного вывода и ориентированные на код задачи, такие как подготовка черновиков, рефакторинг и объяснение. Типичные сценарии использования включают чат-ассистенты, вопросно-ответные системы, дополненные поиском, преобразование данных и автоматизацию в агентном стиле с использованием инструментов или API при наличии поддержки. К ключевым техническим особенностям относятся текстоцентричная модальность, следование инструкциям, вывод в стиле JSON и совместимость с вызовом функций в распространённых оркестрационных фреймворках.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API

GPT 5.1 API — это... GPT-5.1 Thinking — продвинутая версия рассуждений в семействе OpenAI GPT-5.1; она отдает приоритет адаптивному, более качественному рассуждению и предоставляет разработчикам явный контроль над компромиссом между задержкой и вычислениями.

Basic features

  • Adaptive reasoning: модель динамически регулирует глубину размышлений для каждого запроса — быстрее на рутинных задачах, более настойчива на сложных. Это сокращает задержку и использование токенов для типовых запросов. Явно выделяет больше времени на рассуждение для сложных подсказок и является более настойчивой в многошаговых задачах; может работать медленнее на трудных задачах, но дает более глубокие ответы.
  • Reasoning modes: none / low / medium / high (GPT-5.1 по умолчанию использует none для сценариев с низкой задержкой; выбирайте более высокие уровни для более требовательных задач). Responses API предоставляет параметр reasoning для управления этим.
  • Тон и стиль по умолчанию: более понятно изложение сложных тем (меньше жаргона), более объяснительный и «терпеливый» стиль.
  • Context window (tokens / long context) Thinking: значительно больше — контекст 400K токенов для платных тарифов.

Key technical details

  • Adaptive compute allocation — архитектура обучения и инференса приводит к тому, что модель тратит меньше токенов рассуждения на тривиальные задачи и пропорционально больше — на сложные. Это не отдельный «движок мышления», а динамическое распределение внутри конвейера рассуждений.
  • Reasoning parameter in the Responses API — клиенты передают объект reasoning (например, reasoning: { "effort": "high" }), чтобы запросить более глубокие внутренние рассуждения; установка reasoning: { "effort": "none" } фактически отключает расширенный проход внутренних рассуждений для снижения задержки. Responses API также возвращает метаданные о рассуждении/токенах (полезно для оценки стоимости и отладки). )
  • Tools & parallel tool calls — GPT-5.1 улучшает параллельные вызовы инструментов и включает именованные инструменты (например, apply_patch), которые сокращают сценарии отказов при программных правках; параллелизация повышает сквозную пропускную способность в рабочих процессах с интенсивным использованием инструментов.
  • Prompt cache and persistence — поддерживается prompt_cache_retention='24h' в эндпойнтах Responses и Chat Completions для сохранения контекста между несколькими репликами в сессии (уменьшает повторное кодирование токенов).

Benchmark performance

Примеры задержки / эффективности по токенам (предоставлены вендором): на рутинных запросах OpenAI сообщает о существенном снижении времени/токенов (пример: команда списка npm, занимавшая ~10 с / ~250 токенов на GPT-5, теперь выполняется ~2 с / ~50 токенов на GPT-5.1 в их репрезентативном тесте). Ранние сторонние тестировщики (например, управляющие активами, компании по разработке ПО) сообщили об ускорении в 2–3 раза на многих задачах и росте эффективности по токенам в сценариях с активным использованием инструментов.

OpenAI и ранние партнеры опубликовали репрезентативные заявления о бенчмарках и измеренные улучшения:

ОценкаGPT‑5.1 (high)GPT‑5 (high)
SWE-bench Verified (all 500 problems)76.3%72.8%
GPQA Diamond (no tools)88.1%85.7%
AIME 2025 (no tools)94.0%94.6%
FrontierMath (with Python tool)26.7%26.3%
MMMU85.4%84.2%
Tau2-bench Airline67.0%62.6%
Tau2-bench Telecom*95.6%96.7%
Tau2-bench Retail77.9%81.1%
BrowseComp Long Context 128k90.0%90.0%

Limitations & safety considerations

  • Риск галлюцинаций сохраняется. Адаптивное рассуждение помогает на сложных задачах, но не устраняет галлюцинации; более высокий reasoning_effort улучшает проверки, но не гарантирует корректность. Всегда проверяйте результаты в критичных случаях.
  • Компромиссы по ресурсам и стоимости: хотя GPT-5.1 может быть значительно эффективнее по токенам на простых сценариях, включение высокого уровня рассуждений или длительного агентного использования инструментов может увеличить потребление токенов и задержку. Используйте кеширование подсказок, чтобы снизить повторяющиеся затраты, где это уместно.
  • Безопасность инструментов: инструменты apply_patch и shell повышают степень автоматизации (и риск). В продакшене следует ограничивать выполнение инструментов (просматривать diff/команды перед запуском), применять наименьшие привилегии и обеспечивать надежные CI/CD и операционные меры защиты.

Comparison with other models

  • vs GPT-5: GPT-5.1 улучшает адаптивное рассуждение и следование инструкциям; OpenAI сообщает о более быстрых ответах на простых задачах и лучшей настойчивости на сложных. GPT-5.1 также добавляет опцию рассуждения none и расширенное кеширование подсказок.
  • vs GPT-4.x / 4.1: GPT-5.1 разработан для более агентных, инструментально-насыщенных и кодовых задач; OpenAI и партнеры сообщают о росте показателей на бенчмарках по программированию и многошаговым рассуждениям. Для многих стандартных разговорных задач GPT-5.1 Instant может быть сопоставим с ранними чат-моделями GPT-4.x, но с улучшенной управляемостью и предустановками «личности».
  • vs Anthropic / Claude / other LLMs: архитектура MoA у ChatGPT 5.1 дает ему заметное преимущество в задачах, требующих сложных многошаговых рассуждений. Он набрал беспрецедентные 98.20 на бенчмарке HELM для сложных рассуждений, по сравнению с 95.60 у Claude 4 и 94.80 у Gemini 2.0 Ultra.

Функции для GPT-5.1

Изучите ключевые функции GPT-5.1, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для GPT-5.1

Изучите конкурентоспособные цены на GPT-5.1, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как GPT-5.1 может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$1/M
Вывод:$8/M
Ввод:$1.25/M
Вывод:$10/M
-20%

Пример кода и API для GPT-5.1

Что такое GPT-5.1 API? GPT-5.1 Thinking — это вариант с продвинутым рассуждением из семейства OpenAI GPT-5.1; он отдает приоритет адаптивным, более качественным рассуждениям и предоставляет разработчикам явный контроль над компромиссом между задержкой и вычислительными затратами.
POST
/v1/responses
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5.1", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5.1",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5.1",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

Больше моделей

A

Claude Opus 4.6

Ввод:$4/M
Вывод:$20/M
Claude Opus 4.6 — большая языковая модель класса «Opus» компании Anthropic, выпущенная в феврале 2026 года. Она позиционируется как «рабочая лошадка» для интеллектуального труда и исследовательских рабочих процессов — ориентирована на улучшение рассуждений на длинных контекстах, многошагового планирования, использования инструментов (включая агентные программные рабочие процессы) и выполнения компьютерных задач, таких как автоматизированное создание слайдов и электронных таблиц.
A

Claude Sonnet 4.6

Ввод:$2.4/M
Вывод:$12/M
Claude Sonnet 4.6 — наша самая мощная на сегодняшний день модель Sonnet. Это полноценное обновление навыков модели в областях программирования, использования компьютера, рассуждений с длинным контекстом, агентного планирования, интеллектуальной работы и дизайна. Sonnet 4.6 также поддерживает окно контекста на 1M токенов в бета-версии.
O

GPT-5.4 nano

Ввод:$0.16/M
Вывод:$1/M
GPT-5.4 nano предназначен для задач, в которых наибольшее значение имеют скорость и затраты, таких как классификация, извлечение данных, ранжирование и подагенты.
O

GPT-5.4 mini

Ввод:$0.6/M
Вывод:$3.6/M
GPT-5.4 mini сочетает сильные стороны GPT-5.4 с более быстрой и эффективной моделью, разработанной для высоконагруженных сценариев использования.
A

Claude Mythos Preview

A

Claude Mythos Preview

Скоро
Ввод:$60/M
Вывод:$240/M
Claude Mythos Preview является нашей самой мощной на сегодняшний день передовой моделью и демонстрирует поразительный скачок в результатах на многих оценочных бенчмарках по сравнению с нашей предыдущей передовой моделью Claude Opus 4.6.
X

mimo-v2-pro

Ввод:$0.8/M
Вывод:$2.4/M
MiMo-V2-Pro — флагманская базовая модель Xiaomi с более чем 1T общих параметров и длиной контекста 1M, глубоко оптимизированная для агентных сценариев. Она обладает высокой адаптивностью к универсальным агентным фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она входит в число мировых лидеров, а по воспринимаемой производительности приближается к уровню Opus 4.6. MiMo-V2-Pro создана, чтобы служить мозгом агентных систем, оркестрировать сложные рабочие процессы, обеспечивать выполнение инженерных задач в production-среде и надежно выдавать результаты.

Связанные блоги

GPT 5.2 Codex выпущен: возможности, бенчмарки и доступ
Dec 22, 2025

GPT 5.2 Codex выпущен: возможности, бенчмарки и доступ

OpenAI выпустила GPT-5.2-Codex — версию GPT-5.2, оптимизированную под Codex, специально предназначенную для долгосрочных агентных задач программирования, масштабных рефакторингов и миграций, надежного использования инструментов в терминальных средах, улучшенного нативного поведения в Windows и усиленных возможностей в области кибербезопасности. Бенчмарки, такие как SWE-Bench Pro и Terminal-Bench 2.0, показывают, что GPT-5.2-Codex находится на передовом уровне среди агентных моделей программирования.
Сколько воды ChatGPT потребляет в день?
Dec 6, 2025
chat-gpt

Сколько воды ChatGPT потребляет в день?

Короткий ответ: глобальный сервис ChatGPT, вероятно, потребляет порядка 2–160 миллионов литров воды каждый день — очень широкий диапазон, обусловленный
Что такое GPT-5.1 Pro? Профессиональный обзор и отчёт о состоянии
Nov 28, 2025
gpt-5-1
gpt-5-1-instant
gpt-5-1-pro

Что такое GPT-5.1 Pro? Профессиональный обзор и отчёт о состоянии

GPT-5.1 Pro от OpenAI — это последняя инкрементальная версия семейства GPT-5: обновление модели производственного уровня, которое улучшает логику, задержку и пропускную способность.
Claude Opus 4.5: что это такое — и сколько это будет стоить?
Nov 23, 2025
gemini-3-pro
gpt-5-1

Claude Opus 4.5: что это такое — и сколько это будет стоить?

Публикации в соцсетях и расследовательские материалы указывают на скорый выход Claude Opus 4.5 (часто сокращаемого до «Opus 4.5») — который, по данным некоторых источников, внутри компании обозначается как Neptune V6 — а также на передачу модели внешним редтимерам для тестирования джейлбрейков. Публичные подробности пока фрагментарны, поэтому в этой статье собраны доступные сообщения, объясняется, что утечка говорит о возможностях и безопасности, и дана обоснованная оценка вероятного ценообразования и того, как Opus 4.5 может выглядеть на фоне Google Gemini 3 и OpenAI GPT‑5.1.
Gemini 3 Pro против GPT 5.1: что лучше? Полное сравнение
Nov 18, 2025
gemini-3-pro-preview
gpt-5-1

Gemini 3 Pro против GPT 5.1: что лучше? Полное сравнение

Как GPT-5.1 от OpenAI, так и Gemini 3 Pro от Google представляют собой постепенные, но значимые шаги в продолжающейся гонке вооружений за мультимодальный ИИ общего назначения.