МоделиПоддержкаПредприятиеБлог
500+ API моделей ИИ, всё в одном API. Только в CometAPI
API моделей
Разработчик
Быстрый стартДокументацияПанель управления API
Ресурсы
AI МоделиБлогПредприятиеЖурнал измененийО нас
2025 CometAPI. Все права защищены.Политика конфиденциальностиУсловия обслуживания
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

Ввод:$0.2/M
Вывод:$1.6/M
Контекст:256k
Максимальный вывод:224k
Doubao-Seed-1.8 оптимизирован для мультимодальных сценариев работы агентов. В плане агентных возможностей существенно улучшены навыки использования инструментов и выполнения сложных команд. Что касается мультимодального понимания, значительно улучшены базовые визуальные возможности, что обеспечивает понимание чрезвычайно длинных видео при низкой частоте кадров. Также оптимизированы понимание движения на видео, понимание сложных пространственных отношений и возможности разбора структуры документов, а интеллектуальное управление контекстом теперь поддерживается нативно, что позволяет пользователям настраивать стратегии управления контекстом.
Новый
Коммерческое использование
Playground
Обзор
Функции
Цены
API

Технические характеристики API Seed 1.8

ПараметрХарактеристика / примечание
Название модели / семействоDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Поддерживаемые модальностиТекст, изображения, видео (мультимодальные возможности VLM), инструменты для аудио в экосистеме (отдельные модели для генерации аудио/видео).
Контекстное окно (текст)256K токенов
Видео / визуальные возможностиСпроектирована для рассуждений по длинным видео, поддерживает эффективное визуальное кодирование и большие бюджеты видео‑токенов (в карточке модели указаны эксперименты с видео‑токенами и бенчмарки по длинным видео).
Форматы вводаСвободные текстовые подсказки; загрузка изображений (скриншоты, диаграммы, фотографии); видео как токенизированные кадры / видеоинструменты для проверки сегментов; загрузка файлов (документы).
Форматы выводаТекст на естественном языке, структурированные ответы (structured-output beta), вызовы функций/инструментов, код и мультимодальные результаты через оркестрацию.
Режимы мышления/инференцииno_think, think-low, think-medium, think-high — баланс точности и задержки/стоимости.

Что такое Doubao Seed 1.8?

Doubao Seed 1.8 — это релиз 1.8 команды Seed: унифицированная LLM+VLM, которая нацелена на обобщённую «агентность» в реальном мире — то есть восприятие (изображения/видео), рассуждения, оркестрацию инструментов (поиск, вызовы функций, выполнение кода, привязка к GUI) и многошаговое принятие решений в рамках одной модели. Архитектура подчёркивает настраиваемые «режимы мышления» (компромиссы между задержкой и глубиной), эффективное визуальное кодирование и нативную поддержку длинного контекста и мультимодальных входов, чтобы модель могла работать как автономный помощник/агент в производственных рабочих процессах.

Основные возможности API Seed 1.8

  1. Единая мультимодальная агентная модель. Интегрирует восприятие (изображения/видео), рассуждения (LLM) и действия (вызовы инструментов/G U I, выполнение кода) в одной модели, а не в разделённом конвейере. Это позволяет строить компактные агентные сценарии и снижать сложность оркестрации.
  2. Сверхдлинный контекст и работа с длинными видео. Длинный контекст (поддержка продукта до 256k токенов) и специализированные бенчмарки по длинным видео (Seed1.8 демонстрирует высокую эффективность использования видео‑токенов). Модель поддерживает выборочные видеоинструменты (VideoCut) для фокуса рассуждений на временных метках.
  3. Агентная автоматизация GUI и использование инструментов. Бенчмарки и внутренние тесты (OSWorld, AndroidWorld, LiveCodeBench, бенчмарки по привязке к GUI) показывают улучшения в задачах GUI‑агентов и многошаговой автоматизации. Модель может выдавать команды для привязки к GUI и работать в симулированных контекстах ОС/веб/мобайл.
  4. Настраиваемые режимы мышления для контроля задержки/стоимости. Четыре режима инференции позволяют разработчикам настраивать вычисления на этапе выполнения для интерактивных задач и высококачественных пакетных задач. Это полезно для продакшн‑систем со строгими бюджетами по задержке.
  5. Улучшенная эффективность токенов (мультимодальная). Seed 1.8 демонстрирует лучшую эффективность токенов на мультимодальных бенчмарках по сравнению с предшественниками (серии Seed-1.5/1.6), достигая высокой точности при меньших бюджетах токенов в ряде задач по длинным видео.
  6. Настраиваемые режимы мышления: балансируйте глубину инференции и задержку/стоимость с помощью различных режимов (no_think → think-high) для настройки под интерактивное продакшн‑использование.
  7. Технические возможности
  • Эффективность токенов: Seed1.8 демонстрирует заметный прирост эффективности токенов по сравнению с предшественниками (Seed-1.5/1.6), обеспечивая более высокую точность при меньших бюджетах токенов в задачах по длинным видео (например, конкурентная точность даже при 32K видео‑токенов). Это снижает стоимость инференции для длинных входов.
  • Мультимодальные рассуждения и восприятие: Модель достигает SOTA на ряде задач VQA с несколькими изображениями и задачах по движению/восприятию и занимает второе место или близко к SOTA на многих мультимодальных бенчмарках; при этом она превосходит предшественника почти по всем измеряемым визуальным/видео аспектам.
  • Агентное использование инструментов и привязка к GUI: Задокументирована поддержка привязки к GUI и бенчмарков экранной работы (ScreenSpot-Pro, GUI‑агентирование) с высокими оценками привязки (например, улучшение по сравнению с Seed-1.5-VL на ScreenSpot-Pro).
  • Параллельные / пошаговые рассуждения: Увеличение вычислений на этапе инференции (параллельное мышление) даёт измеримые улучшения на бенчмарках по математике, программированию и мультимодальным рассуждениям

Отдельные публичные результаты бенчмарков Seed1.8

  • VCRBench (визуальные рассуждения о здравом смысле): Seed1.8 получил 59.8 (Pass@1, указанный в таблице карточки модели), улучшение по сравнению с Seed-1.5-VL и конкурентоспособность с топ‑моделями
  • VideoHolmes (видео‑рассуждения): Seed1.8 65.5, превосходит Seed-1.5-VL и приближается к профессиональным конкурентам.
  • MMLB-NIAH (мультимодальный длинный контекст, 128k): Seed1.8 достиг 72.2 Pass@1 при контексте 128k в MMLB-NIAH, обгоняя некоторые современные pro‑модели.
  • Набор по движению и восприятию: SOTA в 5 из 6 оценённых задач; среди примеров — TVBench, TempCompass и TOMATO, где Seed1.8 показывает существенные улучшения временного восприятия.
  • Агентные рабочие процессы: На BrowseComp и других агентных бенчмарках по поиску/коду Seed1.8 часто занимает места рядом с или выше конкурирующих pro‑моделей

Seed 1.8 по сравнению с Gemini 3 Pro / GPT-5.x

  • Seed1.8 vs Seed-1.5-VL / Seed-1.6: Очевидные улучшения в мультимодальном восприятии, эффективности токенов для длинных видео и агентном выполнении.
  • Seed1.8 vs Gemini 3 Pro / GPT-5.x: На многих мультимодальных бенчмарках Seed1.8 соответствует или превосходит Gemini 3 Pro (SOTA на нескольких задачах VQA/движения; лучше на прогоне MMLB-NIAH 128k). Однако карточка также показывает области, где модели семейства Gemini сохраняют преимущества в отдельных дисциплинарных задачах — так что относительный порядок зависит от бенчмарка.
  • Вариант Seed-Code (Doubao-Seed-Code): специализирован для задач программирования/агентного кода (большой контекст для кодовых баз; специализированные SWE‑бенчмарки). Seed1.8 — это универсальная агентная мультимодальная модель, тогда как Seed-Code — вариант, ориентированный на программирование.

Практические сценарии использования Seedream 4.5 API на CometAPI

  • Мультимодальные исследовательские ассистенты и анализ документов: извлечение, суммирование и рассуждения по длинным документам, презентациям и многостраничным отчётам.
  • Понимание и мониторинг длинных видео: аналитика для безопасности/спорта, суммирование длинных встреч, потоковый анализ, где важна эффективность работы с видео‑токенами.
  • Агентные рабочие процессы / автоматизация: многошаговый веб‑поиск + выполнение кода + извлечение данных (например, автоматизированный конкурентный анализ, планирование поездок, исследовательские пайплайны, продемонстрированные на внутренних бенчмарках).
  • Инструменты для разработчиков (при использовании Seed-Code): анализ больших кодовых баз, помощники в IDE и агентное выполнение кода для тестирования и исправлений (Seed-Code — рекомендуемый специализированный вариант).
  • Автоматизация GUI и RPA: бенчмарки по привязке к экрану и GUI‑агентам показывают, что модель выполняет структурированные GUI‑задачи лучше, чем предыдущие релизы Seed.

Как использовать doubao Seed 1.8 API через CometAPI

Doubao seed1.8 коммерчески доступна через CometAPI как размещённый API для инференции. API поддерживает мультимодальные полезные нагрузки (текст + изображения + фрагменты видео/временные метки) и настраиваемые режимы инференции для балансировки задержки и вычислений относительно качества ответа.

Паттерны вызовов: API поддерживает стандартные запросы в стиле чата/завершения, потоковую выдачу и агентные потоки, где модель инициирует вызовы инструментов (поиск, выполнение кода, действия в GUI) и принимает результаты инструментов как последующий контекст.

Потоковая передача и работа с длинным контекстом: API поддерживает стриминг и имеет встроенные примитивы управления контекстом для долгих сессий (чтобы обеспечивать контекст 100K+ и многошаговые трассы агента).

Шаг 1: Получите ключ API

Войдите на cometapi.com. Если вы ещё не наш пользователь, сначала зарегистрируйтесь. Войдите в свою консоль CometAPI. Получите ключ API для доступа к интерфейсу. Нажмите “Add Token” в разделе API token в личном кабинете, получите ключ токена: sk-xxxxx и отправьте.

Шаг 2: Отправьте запросы к doubao Seed 1.8 API

Выберите “doubao-seed-1-8-251228 ” эндпоинт для отправки API‑запроса и задайте тело запроса. Метод запроса и тело запроса берутся из документации API на нашем сайте. На нашем сайте также доступен тест через Apifox для вашего удобства. Замените <YOUR_API_KEY> на ваш реальный ключ CometAPI из вашего аккаунта. Совместимость с API Чат.

Вставьте ваш вопрос или запрос в поле content — на него модель и ответит. Обработайте ответ API, чтобы получить сгенерированный ответ.

Шаг 3: Получите и проверьте результаты

Обработайте ответ API, чтобы получить сгенерированный результат. После обработки API возвращает статус задачи и выходные данные.

ЧАВО

What variants exist of Seed 1.8 and when to use each?

Seed1.8 — универсальный мультимодальный агент. Связанные варианты включают: Seed-Code / Doubao-Seed-Code: специализирован для очень больших контекстов кода (некоторые SKU заявляют 256K контекстов) и рабочих процессов программирования. Seedance / Seedream: варианты, специализированные на медиа/генерации (генерация видео/изображений). Выбирайте Seed-Code для задач в IDE/кодовой базе; выбирайте Seed1.8 для широких мультимодальных агентных задач. Подтвердите размеры контекстных окон и возможности SKU в документации по продукту.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 делает упор на агентную интеграцию (использование инструментов, работа агента в GUI, многошаговые рабочие процессы), улучшенную работу с длинным контекстом и лучшее восприятие длинных видео/движения по сравнению с более ранними моделями Seed 1.x. Модель позиционируется как обновление мультимодальных/агентных возможностей в линейке Seed.

What input/output modalities does Seed1.8 support?

Нативная поддержка мультимодальности: текст + изображения + видео. На выходе доступны ответы на естественном языке, структурированные результаты (JSON/планы действий), код и ссылки на визуальные сегменты/метки времени для агентных рабочих процессов. Модель специально спроектирована для мультимодальной цепочки восприятие → рассуждение → действие.

What are the “thinking” or inference modes of Seed1.8?

Существуют настраиваемые режимы «мышления» — они предназначены для выбора компромисса между задержкой/вычислительными затратами и глубиной рассуждений (полезно, когда нужно балансировать между интерактивностью и качеством решения). Используйте эти режимы, чтобы настроить работу для интерактивных UI или более глубокого пакетного рассуждения.

Функции для Doubao-Seed-1.8

Изучите ключевые функции Doubao-Seed-1.8, разработанные для повышения производительности и удобства использования. Узнайте, как эти возможности могут принести пользу вашим проектам и улучшить пользовательский опыт.

Цены для Doubao-Seed-1.8

Изучите конкурентоспособные цены на Doubao-Seed-1.8, разработанные для различных бюджетов и потребностей использования. Наши гибкие планы гарантируют, что вы платите только за то, что используете, что упрощает масштабирование по мере роста ваших требований. Узнайте, как Doubao-Seed-1.8 может улучшить ваши проекты, сохраняя при этом управляемые расходы.
Цена Comet (USD / M Tokens)Официальная цена (USD / M Tokens)Скидка
Ввод:$0.2/M
Вывод:$1.6/M
Ввод:$0.25/M
Вывод:$2/M
-20%

Пример кода и API для Doubao-Seed-1.8

Doubao seed1.8 теперь коммерчески доступен через CometAPI как размещённый API инференса. API поддерживает мультимодальные полезные нагрузки (текст + изображения + видеофрагменты / метки времени) и настраиваемые режимы инференса, позволяющие настраивать компромисс между задержкой и потреблением вычислительных ресурсов, с одной стороны, и качеством ответов — с другой.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

Больше моделей

A

Claude Opus 4.6

Ввод:$4/M
Вывод:$20/M
Claude Opus 4.6 — большая языковая модель класса «Opus» компании Anthropic, выпущенная в феврале 2026 года. Она позиционируется как «рабочая лошадка» для интеллектуального труда и исследовательских рабочих процессов — ориентирована на улучшение рассуждений на длинных контекстах, многошагового планирования, использования инструментов (включая агентные программные рабочие процессы) и выполнения компьютерных задач, таких как автоматизированное создание слайдов и электронных таблиц.
A

Claude Sonnet 4.6

Ввод:$2.4/M
Вывод:$12/M
Claude Sonnet 4.6 — наша самая мощная на сегодняшний день модель Sonnet. Это полноценное обновление навыков модели в областях программирования, использования компьютера, рассуждений с длинным контекстом, агентного планирования, интеллектуальной работы и дизайна. Sonnet 4.6 также поддерживает окно контекста на 1M токенов в бета-версии.
O

GPT-5.4 nano

Ввод:$0.16/M
Вывод:$1/M
GPT-5.4 nano предназначен для задач, в которых наибольшее значение имеют скорость и затраты, таких как классификация, извлечение данных, ранжирование и подагенты.
O

GPT-5.4 mini

Ввод:$0.6/M
Вывод:$3.6/M
GPT-5.4 mini сочетает сильные стороны GPT-5.4 с более быстрой и эффективной моделью, разработанной для высоконагруженных сценариев использования.
A

Claude Mythos Preview

A

Claude Mythos Preview

Скоро
Ввод:$60/M
Вывод:$240/M
Claude Mythos Preview является нашей самой мощной на сегодняшний день передовой моделью и демонстрирует поразительный скачок в результатах на многих оценочных бенчмарках по сравнению с нашей предыдущей передовой моделью Claude Opus 4.6.
X

mimo-v2-pro

Ввод:$0.8/M
Вывод:$2.4/M
MiMo-V2-Pro — флагманская базовая модель Xiaomi с более чем 1T общих параметров и длиной контекста 1M, глубоко оптимизированная для агентных сценариев. Она обладает высокой адаптивностью к универсальным агентным фреймворкам, таким как OpenClaw. В стандартных бенчмарках PinchBench и ClawBench она входит в число мировых лидеров, а по воспринимаемой производительности приближается к уровню Opus 4.6. MiMo-V2-Pro создана, чтобы служить мозгом агентных систем, оркестрировать сложные рабочие процессы, обеспечивать выполнение инженерных задач в production-среде и надежно выдавать результаты.

Связанные блоги

Как использовать API Doubao Seed 1.8?  Подробное руководство
Jan 12, 2026

Как использовать API Doubao Seed 1.8? Подробное руководство

Doubao Seed 1.8 — часть семейства Doubao от ByteDance и исследовательской линейки Seed — привлекает внимание тем, что спроектирована как «агентная» мультимодальная модель с возможностью обработки очень большого контекста и улучшенной поддержкой инструментов и агентов.