модели
Обзор основных возможностей: Разрешение: до 4K (4096×4096), на уровне Pro. Согласованность референс-изображений: до 14 референс-изображений (10 объектов + 4 персонажа), с сохранением согласованности стиля/персонажей. Экстремальные соотношения сторон: добавлены новые соотношения 1:4, 4:1, 1:8, 8:1, подходят для длинных изображений, постеров и баннеров. Рендеринг текста: продвинутая генерация текста, подходит для инфографики и макетов маркетинговых постеров. Расширение поиска: интегрированы Google Search + Image Search. Граундирование: встроенный процесс рассуждения; сложные запросы анализируются перед генерацией. Claude Opus 4.6 — большая языковая модель класса «Opus» компании Anthropic, выпущенная в феврале 2026 года. Она позиционируется как «рабочая лошадка» для интеллектуального труда и исследовательских рабочих процессов — ориентирована на улучшение рассуждений на длинных контекстах, многошагового планирования, использования инструментов (включая агентные программные рабочие процессы) и выполнения компьютерных задач, таких как автоматизированное создание слайдов и электронных таблиц. Claude Sonnet 4.6 — наша самая мощная на сегодняшний день модель Sonnet. Это полноценное обновление навыков модели в областях программирования, использования компьютера, рассуждений с длинным контекстом, агентного планирования, интеллектуальной работы и дизайна. Sonnet 4.6 также поддерживает окно контекста на 1M токенов в бета-версии. Контекст:400,000
GPT-5.4 nano предназначен для задач, в которых наибольшее значение имеют скорость и затраты, таких как классификация, извлечение данных, ранжирование и подагенты.Контекст:400,000
GPT-5.4 mini сочетает сильные стороны GPT-5.4 с более быстрой и эффективной моделью, разработанной для высоконагруженных сценариев использования.Claude Mythos Preview является нашей самой мощной на сегодняшний день передовой моделью и демонстрирует
поразительный скачок в результатах на многих оценочных бенчмарках по сравнению с нашей предыдущей передовой моделью Claude Opus 4.6. MiMo-V2-Pro — флагманская базовая модель Xiaomi с более чем 1T общих параметров и длиной контекста 1M, глубоко оптимизированная для агентных сценариев. Она обладает высокой адаптивностью к универсальным агентным фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она входит в число мировых лидеров, а по воспринимаемой производительности приближается к уровню Opus 4.6. MiMo-V2-Pro создана, чтобы служить мозгом агентных систем, оркестрировать сложные рабочие процессы, обеспечивать выполнение инженерных задач в production-среде и надежно выдавать результаты. MiMo-V2-Omni — это передовая омнимодальная модель, которая изначально обрабатывает входные данные в виде изображений, видео и аудио в рамках единой архитектуры. Она сочетает мощное мультимодальное восприятие с агентными возможностями — визуальной привязкой, многошаговым планированием, использованием инструментов и выполнением кода, — что делает её хорошо подходящей для сложных реальных задач, охватывающих разные модальности. Контекстное окно: 256K. Ввод:$0.24/M
Вывод:$0.96/M
MiniMax-M2.7 обеспечивает тот же первоклассный интеллект, что и стандартная версия — включая рекурсивную самоэволюцию и экспертный уровень эффективности в офисных задачах, — но разработана для приложений, требующих субсекундной задержки и высокоскоростной генерации токенов. Благодаря улучшенной базовой архитектуре инференса скорость вывода на 66% выше, чем у стандартной модели (до 100 tps). Это предпочтительный выбор для интерактивных ассистентов программирования, выполнения циклов агента в реальном времени и высокопроизводительных корпоративных пайплайнов с жесткими требованиями к времени завершения.Контекст:200k
Ввод:$0.96/M
Вывод:$3.264/M
GLM-5 Turbo — новая модель от Z.ai, разработанная для быстрого инференса и высокой производительности в агентно-ориентированных средах, таких как сценарии OpenClaw.Контекст:1,050,000
Версия GPT-5.4, которая выдает более умные и точные ответы.Контекст:1,050,000
GPT-5.4 — передовая модель для сложной профессиональной работы. Reasoning.effort поддерживает: none (по умолчанию), low, medium, high и xhigh.Модель GPT-5.3 Instant, используемая в ChatGPT Gemini 3.1 Flash-Lite — это экономически эффективная и с низкой задержкой модель Tier-3 в серии Google Gemini 3, предназначенная для производственных рабочих процессов ИИ с большим объемом, где пропускная способность и скорость важнее максимальной глубины рассуждений. Она сочетает большое мультимодальное контекстное окно с эффективной производительностью инференса при более низкой стоимости, чем у большинства флагманских аналогов. Контекст:200K
Самая быстрая, наиболее экономически эффективная модель.В секунду:$0.24
Sora 2 Pro — наша самая передовая и мощная модель генерации медиаконтента, способная создавать видео с синхронизированным звуком. Она может создавать детализированные, динамичные видеоролики из текста на естественном языке или из изображений.В секунду:$0.08
Сверхмощная модель для генерации видео со звуковыми эффектами, поддерживает формат чата.За запрос:$0.6
Midjourney video generationВвод:$0.16/M
Вывод:$0.96/M
Как нативная мультимодальная модель, QWEN3.5-397B-A17B серии Qwen3.5 превосходно показывает себя в комплексных бенчмарках, включая логический вывод, программирование, агентные возможности и мультимодальное понимание, помогая разработчикам и предприятиям значительно повышать производительность. Модель использует инновационную гибридную архитектуру, которая сочетает линейное внимание (Gated Delta Networks) с разреженными гибридными экспертами (MoE), чтобы обеспечить выдающуюся эффективность инференса: 397 миллиардов параметров всего и только 17 миллиардов параметров, активируемых при каждом прямом проходе, что оптимизирует скорость и стоимость при сохранении возможностей. Мы также расширили поддержку языков и диалектов со 119 до 201, обеспечивая более широкую доступность и лучшую поддержку для пользователей по всему миру.Контекст:2,000,000
Релиз Grok 4.20 вводит многоагентную архитектуру (несколько специализированных агентов, координируемых в реальном времени), расширенные контекстные режимы и целевые улучшения в следовании инструкциям, снижении галлюцинаций и формировании структурированных/инструментальных выходных данных.В секунду:$0.04
Создавайте видео на основе текстовых подсказок, анимируйте статические изображения или редактируйте существующие видео с помощью естественного языка. API позволяет настраивать длительность, соотношение сторон и разрешение создаваемых видео — при этом SDK автоматически выполняет асинхронный опрос.Контекст:32,000
Лучшая модель речи для ввода и вывода аудио.Лучшая голосовая модель для ввода и вывода аудио с Chat Completions. Контекст:400,000
GPT-5.3-Codex оптимизирован для агентных задач программирования в Codex или аналогичных средах. GPT-5.3-Codex поддерживает уровни интенсивности рассуждения: low, medium, high и xhigh.За запрос:$0.028
Seedream 5.0 Lite — единая мультимодальная модель генерации изображений, обладающая возможностями глубокого мышления и онлайн-поиска, с всесторонним улучшением возможностей понимания, рассуждения и генерации.Gemini 3.1 Pro — следующее поколение в линейке моделей Gemini, набор мощных, нативно мультимодальных моделей рассуждения. Gemini 3 Pro — теперь самая передовая модель Google для сложных задач и способна работать с обширными наборами данных и сложными задачами из различных источников информации, включая текст, аудио, изображения, видео и целые репозитории кода. Ввод:$0.32/M
Вывод:$1.92/M
Нативные визуально-языковые модели Qwen3.5 серии Plus построены на гибридной архитектуре, которая объединяет механизмы линейного внимания с разрежёнными моделями смеси экспертов, обеспечивая более высокую эффективность инференса.Ввод:$0.48/M
Вывод:$2.88/M
Нативная визуально-языковая модель Qwen3.5 серии 397B-A17B построена на гибридной архитектуре, которая объединяет механизм линейного внимания с разрежённой моделью смеси экспертов, обеспечивая более высокую эффективность инференса.Ввод:$0.024/M
Вывод:$0.24/M
🔹 Серия Doubao Seed 2.0
doubao-seed-2-0-code-preview-260215
Сфокусирована на возможностях работы с длинными цепочками рассуждений и устойчивости при выполнении сложных задач, адаптирована для сложных сценариев в реальной бизнес-среде. Как версия Seed 2.0, усиленная для кодирования, она лучше подходит для Agentic Coding.
doubao-seed-2-0-lite-260215
Балансирует качество генерации и скорость отклика, что делает её подходящей в качестве универсальной модели промышленного уровня.
doubao-seed-2-0-mini-260215
Предназначена для сценариев с низкой задержкой, высокой параллельностью и чувствительностью к затратам. Делает упор на быстрый отклик и гибкое развертывание инференса, поддерживает четырёхуровневое мышление и возможности мультимодального понимания.Ввод:$0.24/M
Вывод:$0.96/M
MiniMax-M2.5 — передовая большая языковая модель, ориентированная на продуктивность в реальных условиях. Обученная в широком спектре сложных реальных цифровых рабочих сред, M2.5 опирается на экспертизу M2.1 в области программирования и расширяется в сферу общего офисного труда, достигая высокой компетентности в создании и работе с файлами Word, Excel и Powerpoint, переключении контекста между разнообразными программными средами и работе в различных командах агентов и людей.