модели

Nano Banana 2
G

Nano Banana 2

Ввод:$0.4/M
Вывод:$2.4/M
Обзор основных возможностей: Разрешение: до 4K (4096×4096), на уровне Pro. Согласованность референс-изображений: до 14 референс-изображений (10 объектов + 4 персонажа), с сохранением согласованности стиля/персонажей. Экстремальные соотношения сторон: добавлены новые соотношения 1:4, 4:1, 1:8, 8:1, подходят для длинных изображений, постеров и баннеров. Рендеринг текста: продвинутая генерация текста, подходит для инфографики и макетов маркетинговых постеров. Расширение поиска: интегрированы Google Search + Image Search. Граундирование: встроенный процесс рассуждения; сложные запросы анализируются перед генерацией.
Claude Opus 4.6
A

Claude Opus 4.6

Ввод:$4/M
Вывод:$20/M
Claude Opus 4.6 — большая языковая модель класса «Opus» компании Anthropic, выпущенная в феврале 2026 года. Она позиционируется как «рабочая лошадка» для интеллектуального труда и исследовательских рабочих процессов — ориентирована на улучшение рассуждений на длинных контекстах, многошагового планирования, использования инструментов (включая агентные программные рабочие процессы) и выполнения компьютерных задач, таких как автоматизированное создание слайдов и электронных таблиц.
Claude Sonnet 4.6
A

Claude Sonnet 4.6

Ввод:$2.4/M
Вывод:$12/M
Claude Sonnet 4.6 — наша самая мощная на сегодняшний день модель Sonnet. Это полноценное обновление навыков модели в областях программирования, использования компьютера, рассуждений с длинным контекстом, агентного планирования, интеллектуальной работы и дизайна. Sonnet 4.6 также поддерживает окно контекста на 1M токенов в бета-версии.
GPT-5.4 nano
O

GPT-5.4 nano

Контекст:400,000
Ввод:$0.16/M
Вывод:$1/M
GPT-5.4 nano предназначен для задач, в которых наибольшее значение имеют скорость и затраты, таких как классификация, извлечение данных, ранжирование и подагенты.
GPT-5.4 mini
O

GPT-5.4 mini

Контекст:400,000
Ввод:$0.6/M
Вывод:$3.6/M
GPT-5.4 mini сочетает сильные стороны GPT-5.4 с более быстрой и эффективной моделью, разработанной для высоконагруженных сценариев использования.
A

Claude Mythos Preview

A

Claude Mythos Preview

Скоро
Ввод:$60/M
Вывод:$240/M
Claude Mythos Preview является нашей самой мощной на сегодняшний день передовой моделью и демонстрирует поразительный скачок в результатах на многих оценочных бенчмарках по сравнению с нашей предыдущей передовой моделью Claude Opus 4.6.
mimo-v2-pro
X

mimo-v2-pro

Ввод:$0.8/M
Вывод:$2.4/M
MiMo-V2-Pro — флагманская базовая модель Xiaomi с более чем 1T общих параметров и длиной контекста 1M, глубоко оптимизированная для агентных сценариев. Она обладает высокой адаптивностью к универсальным агентным фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она входит в число мировых лидеров, а по воспринимаемой производительности приближается к уровню Opus 4.6. MiMo-V2-Pro создана, чтобы служить мозгом агентных систем, оркестрировать сложные рабочие процессы, обеспечивать выполнение инженерных задач в production-среде и надежно выдавать результаты.
mimo-v2-omni
X

mimo-v2-omni

Ввод:$0.32/M
Вывод:$1.6/M
MiMo-V2-Omni — это передовая омнимодальная модель, которая изначально обрабатывает входные данные в виде изображений, видео и аудио в рамках единой архитектуры. Она сочетает мощное мультимодальное восприятие с агентными возможностями — визуальной привязкой, многошаговым планированием, использованием инструментов и выполнением кода, — что делает её хорошо подходящей для сложных реальных задач, охватывающих разные модальности. Контекстное окно: 256K.
MiniMax-M2.7
M

MiniMax-M2.7

Ввод:$0.24/M
Вывод:$0.96/M
MiniMax-M2.7 обеспечивает тот же первоклассный интеллект, что и стандартная версия — включая рекурсивную самоэволюцию и экспертный уровень эффективности в офисных задачах, — но разработана для приложений, требующих субсекундной задержки и высокоскоростной генерации токенов. Благодаря улучшенной базовой архитектуре инференса скорость вывода на 66% выше, чем у стандартной модели (до 100 tps). Это предпочтительный выбор для интерактивных ассистентов программирования, выполнения циклов агента в реальном времени и высокопроизводительных корпоративных пайплайнов с жесткими требованиями к времени завершения.
GLM 5 Turbo
Z

GLM 5 Turbo

Контекст:200k
Ввод:$0.96/M
Вывод:$3.264/M
GLM-5 Turbo — новая модель от Z.ai, разработанная для быстрого инференса и высокой производительности в агентно-ориентированных средах, таких как сценарии OpenClaw.
GPT-5.4 pro
O

GPT-5.4 pro

Контекст:1,050,000
Ввод:$24/M
Вывод:$144/M
Версия GPT-5.4, которая выдает более умные и точные ответы.
GPT-5.4
O

GPT-5.4

Контекст:1,050,000
Ввод:$2/M
Вывод:$12/M
GPT-5.4 — передовая модель для сложной профессиональной работы. Reasoning.effort поддерживает: none (по умолчанию), low, medium, high и xhigh.
GPT-5.3 Chat
O

GPT-5.3 Chat

Ввод:$1.4/M
Вывод:$11.2/M
Модель GPT-5.3 Instant, используемая в ChatGPT
Gemini 3.1 Flash-Lite
G

Gemini 3.1 Flash-Lite

Ввод:$0.2/M
Вывод:$1.2/M
Gemini 3.1 Flash-Lite — это экономически эффективная и с низкой задержкой модель Tier-3 в серии Google Gemini 3, предназначенная для производственных рабочих процессов ИИ с большим объемом, где пропускная способность и скорость важнее максимальной глубины рассуждений. Она сочетает большое мультимодальное контекстное окно с эффективной производительностью инференса при более низкой стоимости, чем у большинства флагманских аналогов.
Claude Haiku 4.5
C

Claude Haiku 4.5

Контекст:200K
Ввод:$0.8/M
Вывод:$4/M
Самая быстрая, наиболее экономически эффективная модель.
Sora 2 Pro
O

Sora 2 Pro

В секунду:$0.24
Sora 2 Pro — наша самая передовая и мощная модель генерации медиаконтента, способная создавать видео с синхронизированным звуком. Она может создавать детализированные, динамичные видеоролики из текста на естественном языке или из изображений.
Sora 2
O

Sora 2

В секунду:$0.08
Сверхмощная модель для генерации видео со звуковыми эффектами, поддерживает формат чата.
mj_fast_video
M

mj_fast_video

За запрос:$0.6
Midjourney video generation
Q

Qwen 3.5 Flash

Q

Qwen 3.5 Flash

Ввод:$0.16/M
Вывод:$0.96/M
Как нативная мультимодальная модель, QWEN3.5-397B-A17B серии Qwen3.5 превосходно показывает себя в комплексных бенчмарках, включая логический вывод, программирование, агентные возможности и мультимодальное понимание, помогая разработчикам и предприятиям значительно повышать производительность. Модель использует инновационную гибридную архитектуру, которая сочетает линейное внимание (Gated Delta Networks) с разреженными гибридными экспертами (MoE), чтобы обеспечить выдающуюся эффективность инференса: 397 миллиардов параметров всего и только 17 миллиардов параметров, активируемых при каждом прямом проходе, что оптимизирует скорость и стоимость при сохранении возможностей. Мы также расширили поддержку языков и диалектов со 119 до 201, обеспечивая более широкую доступность и лучшую поддержку для пользователей по всему миру.
Grok 4.20
X

Grok 4.20

Контекст:2,000,000
Ввод:$1.6/M
Вывод:$4.8/M
Релиз Grok 4.20 вводит многоагентную архитектуру (несколько специализированных агентов, координируемых в реальном времени), расширенные контекстные режимы и целевые улучшения в следовании инструкциям, снижении галлюцинаций и формировании структурированных/инструментальных выходных данных.
Grok Imagine Video
X

Grok Imagine Video

В секунду:$0.04
Создавайте видео на основе текстовых подсказок, анимируйте статические изображения или редактируйте существующие видео с помощью естественного языка. API позволяет настраивать длительность, соотношение сторон и разрешение создаваемых видео — при этом SDK автоматически выполняет асинхронный опрос.
gpt-realtime-1.5
O

gpt-realtime-1.5

Контекст:32,000
Ввод:$3.2/M
Вывод:$12.8/M
Лучшая модель речи для ввода и вывода аудио.
gpt-audio-1.5
O

gpt-audio-1.5

Ввод:$2/M
Вывод:$8/M
Лучшая голосовая модель для ввода и вывода аудио с Chat Completions.
GPT 5.3 Codex
O

GPT 5.3 Codex

Контекст:400,000
Ввод:$1.4/M
Вывод:$11.2/M
GPT-5.3-Codex оптимизирован для агентных задач программирования в Codex или аналогичных средах. GPT-5.3-Codex поддерживает уровни интенсивности рассуждения: low, medium, high и xhigh.
Doubao Seedream 5
D

Doubao Seedream 5

За запрос:$0.028
Seedream 5.0 Lite — единая мультимодальная модель генерации изображений, обладающая возможностями глубокого мышления и онлайн-поиска, с всесторонним улучшением возможностей понимания, рассуждения и генерации.
Gemini 3.1 Pro
G

Gemini 3.1 Pro

Ввод:$1.6/M
Вывод:$9.6/M
Gemini 3.1 Pro — следующее поколение в линейке моделей Gemini, набор мощных, нативно мультимодальных моделей рассуждения. Gemini 3 Pro — теперь самая передовая модель Google для сложных задач и способна работать с обширными наборами данных и сложными задачами из различных источников информации, включая текст, аудио, изображения, видео и целые репозитории кода.
qwen3.5-plus
Q

qwen3.5-plus

Ввод:$0.32/M
Вывод:$1.92/M
Нативные визуально-языковые модели Qwen3.5 серии Plus построены на гибридной архитектуре, которая объединяет механизмы линейного внимания с разрежёнными моделями смеси экспертов, обеспечивая более высокую эффективность инференса.
qwen3.5-397b-a17b
Q

qwen3.5-397b-a17b

Ввод:$0.48/M
Вывод:$2.88/M
Нативная визуально-языковая модель Qwen3.5 серии 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разрежённой моделью смеси экспертов, обеспечивая более высокую эффективность инференса.
Doubao-Seed-2.0
D

Doubao-Seed-2.0

Ввод:$0.024/M
Вывод:$0.24/M
🔹 Серия Doubao Seed 2.0 doubao-seed-2-0-code-preview-260215 Сфокусирована на возможностях работы с длинными цепочками рассуждений и устойчивости при выполнении сложных задач, адаптирована для сложных сценариев в реальной бизнес-среде. Как версия Seed 2.0, усиленная для кодирования, она лучше подходит для Agentic Coding. doubao-seed-2-0-lite-260215 Балансирует качество генерации и скорость отклика, что делает её подходящей в качестве универсальной модели промышленного уровня. doubao-seed-2-0-mini-260215 Предназначена для сценариев с низкой задержкой, высокой параллельностью и чувствительностью к затратам. Делает упор на быстрый отклик и гибкое развертывание инференса, поддерживает четырёхуровневое мышление и возможности мультимодального понимания.
MiniMax M2.5
M

MiniMax M2.5

Ввод:$0.24/M
Вывод:$0.96/M
MiniMax-M2.5 — передовая большая языковая модель, ориентированная на продуктивность в реальных условиях. Обученная в широком спектре сложных реальных цифровых рабочих сред, M2.5 опирается на экспертизу M2.1 в области программирования и расширяется в сферу общего офисного труда, достигая высокой компетентности в создании и работе с файлами Word, Excel и Powerpoint, переключении контекста между разнообразными программными средами и работе в различных командах агентов и людей.