МодельдерҚолдауКәсіпорынБлог
500+ AI Model API, Барлығы Бір API-да. Тек CometAPI-де
Модельдер API
Әзірлеуші
Жылдам бастауҚұжаттамаAPI Бақылау Тақтасы
Ресурстар
AI МодельдеріБлогКәсіпорынӨзгерістер журналыБіз туралы
2025 CometAPI. Барлық құқықтар қорғалған.Құпиялылық саясатыҚызмет көрсету шарттары
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

Енгізу:$0.2/M
Шығыс:$1.6/M
Контекст:256k
Максималды шығыс:224k
Doubao-Seed-1.8 мультимодальды агент сценарийлеріне оңтайландырылған. Агент мүмкіндіктері тұрғысынан құралдарды пайдалану және күрделі командаларды дәл орындау айтарлықтай жетілдірілді. Мультимодальды түсіну бойынша негізгі көру мүмкіндіктері айтарлықтай жақсартылды, бұл өте ұзақ бейнелерді төмен кадр жиілігінде түсінуге мүмкіндік береді. Бейне қозғалысын түсіну, күрделі кеңістіктік түсіну және құжат құрылымын талдау мүмкіндіктері де оңтайландырылды, сондай-ақ интеллектуалды контексті басқару енді нативті түрде қолдау табады, бұл пайдаланушыларға контекст стратегияларын теңшеуге мүмкіндік береді.
Жаңа
Коммерциялық пайдалану
Playground
Шолу
Мүмкіндіктер
Баға белгілеу
API

Seed 1.8 API техникалық сипаттамалары

ItemSpecification / note
Model name / familyDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Modalities supportedМәтін, суреттер, бейне (көпмодальды VLM мүмкіндіктері), экожүйедегі аудио құралдары (аудио/бейне генерациясына арналған бөлек модельдер).
Context window (text)256K токен
Video / visual capacityҰзын бейне бойынша пайымдауға арналған, тиімді визуалды кодтауды және үлкен бейне-токен бюджеттерін қолдайды (модель картасында бейне токен эксперименттері мен ұзын бейне бенчмарктары келтірілген).
Input formatsЕркін мәтіндік сұраулар; сурет жүктеулері (скриншоттар, диаграммалар, фотолар); токенизацияланған кадрлар түріндегі бейне / сегменттерді тексеруге арналған бейне құралдары; файл жүктеулері (құжаттар).
Output formatsТабиғи тілдегі мәтін, құрылымдалған шығыстар (structured-output beta), function calls / tool calls, код және оркестрация арқылы көпмодальды шығыстар.
Thinking / inference modesno_think, think-low, think-medium, think-high — дәлдік пен кідіріс/құн арасындағы тепе-теңдік.

Doubao Seed 1.8 дегеніміз не?

Doubao Seed 1.8 — Seed командасының 1.8 нұсқасы: жалпыланған шынайы ортадағы агенттілікке нақты бағытталған бірыңғай LLM+VLM, яғни қабылдау (суреттер/бейне), пайымдау, құралдарды оркестрациялау (іздеу, function calls, код орындау, GUI grounding) және бір модельдің ішінде көпқадамды шешім қабылдау. Дизайн конфигурацияланатын “thinking modes” ұғымына (кідіріс пен тереңдік арасындағы айырбас), тиімді визуалды кодтауға және ұзын контекст пен көпмодальды кірістерді табиғи қолдауға басымдық береді, сондықтан модель өндірістік жұмыс процестерінде автономды көмекші/агент ретінде жұмыс істей алады.

Seed 1.8 API негізгі мүмкіндіктері

  1. Бірыңғай көпмодальды агенттік модель. Қабылдауды (сурет/бейне), пайымдауды (LLM) және әрекетті (tool/G U I calls, код орындау) бөлінген pipeline орнына бір модельге біріктіреді. Бұл ықшам агенттік жұмыс процестерін және оркестрацияның төмен күрделілігін қамтамасыз етеді.
  2. Өте ұзын контекст және ұзын бейнені өңдеу. Ұзын контекст (өнім 256k токенге дейін қолдайды) және ұзын бейнеге арналған арнайы бенчмарктар (Seed1.8 ұзын бейне токендерінің тиімділігін жоғары көрсетеді). Модель reasoning-ті нақты уақыт белгілеріне шоғырландыру үшін таңдаулы бейне құралдарын (VideoCut) қолдайды.
  3. Агенттік GUI автоматтандыруы және құралдарды пайдалану. Бенчмарктар мен ішкі сынақтар (OSWorld, AndroidWorld, LiveCodeBench, GUI grounding benchmarks) GUI агенттік тапсырмаларында және көпқадамды автоматтандыруда жақсаруларды көрсетеді. Модель GUI grounding командаларын шығарып, симуляцияланған OS/web/mobile контексттерінде жұмыс істей алады.
  4. Кідіріс/құнды басқаруға арналған конфигурацияланатын ойлау режимдері. Төрт inference режимі әзірлеушілерге интерактивті тапсырмалар мен жоғары сапалы пакеттік тапсырмалар үшін есептеуді test-time кезінде баптауға мүмкіндік береді. Бұл қатаң кідіріс бюджеті бар өндірістік жүйелер үшін пайдалы.
  5. Жақсартылған токен тиімділігі (көпмодальды). Seed 1.8 алдыңғы нұсқаларымен (Seed-1.5/1.6 сериясы) салыстырғанда көпмодальды бенчмарктарда жоғары токен тиімділігін көрсетеді, бірнеше ұзын бейне тапсырмаларында аз токен бюджетімен жоғары дәлдікке жетеді.
  6. Конфигурацияланатын ойлау режимдері: интерактивті өндірістік пайдалануға бейімдеу үшін inference тереңдігі мен кідіріс/құн арасындағы айырбасты айқын режимдер (no_think → think-high) арқылы реттейді.
  7. Техникалық мүмкіндіктер
  • Токен тиімділігі: Seed1.8 алдыңғы нұсқалармен (Seed-1.5/1.6) салыстырғанда айтарлықтай токен тиімділігін көрсетеді, ұзын бейне тапсырмаларында төмен токен бюджетін қолдана отырып жоғарырақ дәлдік береді (мысалы, 32K бейне токенінде де бәсекеге қабілетті дәлдікке жету). Бұл ұзын кірістер үшін inference құнын азайтады.
  • Көпмодальды пайымдау және қабылдау: Модель бірнеше multi-image VQA және motion/perception тапсырмаларында SOTA нәтижелеріне жетеді және көптеген көпмодальды пайымдау бенчмарктарында екінші орынға немесе SOTA-ға жақын көрсеткіштерге ие; нақтырақ айтқанда, өлшенген визуалды/бейне өлшемдерінің барлығы дерлік бойынша ол өзінен бұрынғы нұсқадан асып түседі.
  • Агенттік құрал пайдалану және GUI grounding: GUI grounding пен экранға негізделген операциялар бенчмарктарына (ScreenSpot-Pro, GUI agenting) арналған құжатталған қолдау бар, grounding ұпайлары жоғары (мысалы, ScreenSpot-Pro бойынша Seed-1.5-VL нұсқасынан жақсы).
  • Параллель / сатылы пайымдау: test-time compute көлемін арттыру (parallel thinking) математика, кодтау және көпмодальды пайымдау бенчмарктарында өлшенетін өсім береді

Seed1.8-дің таңдалған ашық бенчмарк нәтижелері

  • VCRBench (визуалды commonsense reasoning): Seed1.8 59.8 ұпай жинады (модель картасы кестесінде Pass@1 ретінде берілген), бұл Seed-1.5-VL-ден жоғары және жетекші модельдермен бәсекеге қабілетті
  • VideoHolmes (бейне пайымдау): Seed1.8 65.5, Seed-1.5-VL-ден жоғары және pro-grade бәсекелес модельдерге жақындайды.
  • MMLB-NIAH (көпмодальды ұзын контекст, 128k): Seed1.8 MMLB-NIAH-та 128k контексте 72.2 Pass@1 нәтижесіне жетіп, кейбір заманауи pro модельдерден асып түсті.
  • Motion & Perception жиынтығы: бағаланған 6 тапсырманың 5-інде SOTA; мысалдарға TVBench, TempCompass және TOMATO жатады, мұнда Seed1.8 уақыттық қабылдауда елеулі өсім көрсетеді.
  • Агенттік жұмыс процестері: BrowseComp және басқа агенттік іздеу/код бенчмарктарында Seed1.8 жиі бәсекелес pro модельдер деңгейінде немесе олардан жоғары орын алады

Seed 1.8 пен Gemini 3 Pro / GPT-5.x салыстыруы

  • Seed1.8 vs Seed-1.5-VL / Seed-1.6: Көпмодальды қабылдау, ұзын бейнелер үшін токен тиімділігі және агенттік орындау бойынша айқын жақсартулар.
  • Seed1.8 vs Gemini 3 Pro / GPT-5.x: Көптеген көпмодальды бенчмарктарда Seed1.8 Gemini 3 Pro-мен теңеседі немесе одан асып түседі (бірнеше VQA / motion тапсырмаларында SOTA; MMLB-NIAH 128k жүгірісінде жақсырақ). Дегенмен, картада Gemini модельдер отбасының кейбір салалық білім тапсырмаларында артықшылықтарын сақтайтын аймақтары да көрсетілген — сондықтан салыстырмалы рет бенчмаркке тәуелді.
  • Seed-Code нұсқасы (Doubao-Seed-Code): бағдарламалау/агенттік код тапсырмаларына маманданған (код базалары үшін үлкен контекст; мамандандырылған SWE бенчмарктары). Seed1.8 — жалпы мақсаттағы агенттік көпмодальды модель, ал Seed-Code — бағдарламалауға бағытталған нұсқа.

CometAPI жүйесіндегі Seedream 4.5 API арқылы практикалық қолдану сценарийлері

  • Көпмодальды зерттеу көмекшілері және құжаттарды талдау: ұзын құжаттар, слайдтар топтамалары және көпбеттік есептер бойынша ақпаратты шығару, қорытындылау және пайымдау.
  • Ұзын бейнені түсіну және мониторинг: қауіпсіздік/спорттық трансляция аналитикасы, ұзақ кездесулерді қорытындылау және модельдің ұзын бейне токен тиімділігі маңызды болатын ағындық талдау.
  • Агенттік жұмыс процестері / автоматтандыру: көпқадамды веб-іздеу + код орындау + деректер шығару сценарийлері (мысалы, автоматтандырылған бәсекелік талдау, сапарды жоспарлау, ішкі бенчмарктарда көрсетілген зерттеу pipeline-дары).
  • Әзірлеуші құралдары (егер Seed-Code қолданылса): үлкен код базасын талдау, IDE көмекшілері және тестілеу мен жөндеуге арналған агенттік код орындау (ұсынылатын мамандандырылған нұсқа — Seed-Code).
  • GUI автоматтандыруы және RPA: экранға бекіту және GUI агент бенчмарктары модельдің құрылымдалған GUI тапсырмаларын алдыңғы Seed шығарылымдарына қарағанда жақсы орындай алатынын көрсетеді.

CometAPI арқылы doubao Seed 1.8 API қалай қолдануға болады

Doubao seed1.8 қазір коммерциялық түрде CometAPI арқылы орналастырылған inference API ретінде ұсынылады. API көпмодальды payload-тарды (мәтін + суреттер + бейне фрагменттері / уақыт белгілері) және жауап сапасына қарсы кідіріс пен есептеуді теңестіруге арналған конфигурацияланатын inference режимдерін қолдайды.

Қоңырау үлгілері: API стандартты chat/completion стиліндегі сұрауларды, streaming жауаптарын және модель tool calls (іздеу, код орындау, GUI әрекеттері) шығарып, кейінгі контекст ретінде құрал шығыстарын қабылдайтын агенттік ағындарды қолдайды.

Streaming және ұзын контексті өңдеу: API streaming-ті қолдайды және ұзын сессияларға арналған кірістірілген контекст басқару примитивтеріне ие (100K+ контексттерді / көпқадамды агент іздерін қолдау үшін).

1-қадам: API кілтін алу үшін тіркелу

cometapi.com сайтына кіріңіз. Егер сіз әлі біздің пайдаланушымыз болмасаңыз, алдымен тіркеліңіз. CometAPI console жүйесіне кіріңіз. Интерфейстің қол жеткізу тіркелгі дерегі API key-ін алыңыз. Жеке орталықтағы API token бөлімінен “Add Token” түймесін басып, token key алыңыз: sk-xxxxx және жіберіңіз.

2-қадам: doubao Seed 1.8 API-ге сұраулар жіберу

API сұрауын жіберу және сұрау денесін орнату үшін “doubao-seed-1-8-251228 ” endpoint-ін таңдаңыз. Сұрау әдісі мен сұрау денесі біздің веб-сайттағы API doc құжатынан алынады. Ыңғайлылығыңыз үшін веб-сайтымыз Apifox тестін де ұсынады. <YOUR_API_KEY> орнын тіркелгіңіздегі нақты CometAPI кілтімен ауыстырыңыз. Chat API-лерімен үйлесімді.

Сұрағыңызды немесе өтінішіңізді content өрісіне енгізіңіз — модель соған жауап береді. Жасалған жауапты алу үшін API жауабын өңдеңіз.

3-қадам: Нәтижелерді алу және тексеру

Жасалған жауапты алу үшін API жауабын өңдеңіз. Өңдеуден кейін API тапсырма күйі мен шығыс деректерін қайтарады.

ЖҚС

What variants exist of Seed 1.8 and when to use each?

Seed1.8 — жалпы мақсаттағы мультимодальды агент. Қатысты нұсқаларға мыналар кіреді: Seed-Code / Doubao-Seed-Code: өте үлкен код контексттері (кейбір SKU-ларда 256K контекст деп көрсетіледі) және кодтау жұмыс ағындары үшін мамандандырылған. Seedance / Seedream: медиа/генерацияға маманданған нұсқалар (бейне/сурет генерациясы). IDE/код базасы тапсырмалары үшін Seed-Code таңдаңыз; кең мультимодальды агент тапсырмалары үшін Seed1.8 таңдаңыз. SKU-дың контекст терезелері мен мүмкіндіктерін өнім құжаттамасынан нақтылаңыз.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 агенттік интеграцияға (құралдарды пайдалану, GUI агенттеу, көпқадамды жұмыс ағындары) басымдық береді, ұзын контекстті өңдеуді жақсартқан және алдыңғы Seed 1.x үлгілерімен салыстырғанда ұзақ бейнелерді/қозғалысты қабылдауы жақсарған. Ол Seed желісінде мультимодальды/агенттік жаңарту ретінде ұсынылады.

What input/output modalities does Seed1.8 support?

Ендірілген мультимодальды қолдау: мәтін + суреттер + бейне. Шығыстарға табиғи тілдегі жауаптар, құрылымдық нәтижелер (JSON/әрекет жоспарлары), код және агенттік жұмыс ағындары үшін визуалды сегменттерге/уақыт белгілеріне сілтемелер кіреді. Үлгі мультимодальды қабылдау → пайымдау → әрекет үшін арнайы жобаланған.

What are the “thinking” or inference modes of Seed1.8?

Реттелетін “ойлау” режимдері бар — кідіріс/есептеу шығыны мен пайымдау тереңдігі арасындағы ымыраны баптауға арналған (интерактивтілік пен шешім сапасының тепе-теңдігін қажет еткенде пайдалы). Бұл режимдерді интерактивті UI-ларға немесе тереңірек пакеттік пайымдауға бейімдеп баптаңыз.

Doubao-Seed-1.8 үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

Doubao-Seed-1.8 үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.
Комета бағасы (USD / M Tokens)Ресми баға (USD / M Tokens)Жеңілдік
Енгізу:$0.2/M
Шығыс:$1.6/M
Енгізу:$0.25/M
Шығыс:$2/M
-20%

Doubao-Seed-1.8 үшін үлгі код және API

Doubao seed1.8 қазір CometAPI арқылы хостингте орналастырылған инференс API ретінде коммерциялық түрде ұсынылады. Бұл API мультимодальды енгізу деректерін (мәтін + суреттер + бейне фрагменттері/уақыт белгілері) және жауап сапасына қатысты кідіріс пен есептеу ресурстарын теңгеруге мүмкіндік беретін бапталатын инференс режимдерін қолдайды.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

Көбірек модельдер

A

Claude Opus 4.6

Енгізу:$4/M
Шығыс:$20/M
Claude Opus 4.6 — Anthropic компаниясының «Opus» санатындағы үлкен тілдік моделі, 2026 жылғы ақпанда шығарылған. Ол зияткерлік еңбек пен зерттеу процестеріне арналған сенімді жұмыс құралы ретінде позицияланған — ұзақ контексттегі пайымдау, көпқадамды жоспарлау, құралдарды қолдану (агенттік бағдарламалық қамтамасыз ету жұмыс процестерін қоса), сондай-ақ слайдтар мен электрондық кестелерді автоматты түрде жасау сияқты компьютерді пайдалану тапсырмалары бойынша мүмкіндіктерін жақсартады.
A

Claude Sonnet 4.6

Енгізу:$2.4/M
Шығыс:$12/M
Claude Sonnet 4.6 — әзірге біздің ең қабілетті Sonnet моделіміз. Ол кодтау, компьютерді пайдалану, ұзақ контекст бойынша пайымдау, агенттік жоспарлау, білімге негізделген жұмыс және дизайн бойынша модельдің дағдыларын толық жаңартуды қамтиды. Sonnet 4.6 сондай-ақ бета нұсқасында 1M токендік контекст терезесін ұсынады.
O

GPT-5.4 nano

Енгізу:$0.16/M
Шығыс:$1/M
GPT-5.4 nano жылдамдық пен құн ең маңызды болатын жіктеу, деректерді шығарып алу, ранжирлеу және субагенттер сияқты тапсырмаларға арналған.
O

GPT-5.4 mini

Енгізу:$0.6/M
Шығыс:$3.6/M
GPT-5.4 mini жоғары көлемді жүктемелерге арналған, GPT-5.4-тің артықшылықтарын жылдамырақ әрі тиімдірек модельге біріктіреді.
A

Claude Mythos Preview

A

Claude Mythos Preview

Жақында
Енгізу:$60/M
Шығыс:$240/M
Claude Mythos Preview — бүгінге дейінгі ең қабілетті озық моделіміз және алдыңғы озық моделіміз Claude Opus 4.6-пен салыстырғанда көптеген бағалау бенчмарктеріндегі көрсеткіштер бойынша айқын серпіліс көрсетеді.
X

mimo-v2-pro

Енгізу:$0.8/M
Шығыс:$2.4/M
MiMo-V2-Pro — Xiaomi-дің флагмандық іргелі моделі, жалпы параметрлер саны 1T-тан асады және контекст ұзындығы 1M, агенттік сценарийлер үшін терең оңтайландырылған. Ол OpenClaw сияқты жалпы агенттік фреймворктерге өте жақсы бейімделеді. Стандартты PinchBench және ClawBench бенчмарктерінде әлемдік ең үздік қатарға кіреді, сезілетін өнімділігі Opus 4.6 деңгейіне жақындайды. MiMo-V2-Pro агенттік жүйелердің миы ретінде қызмет етуге жобаланған, күрделі жұмыс процестерін үйлестіріп, өндірістік инженерлік тапсырмаларды атқарып, нәтижелерді сенімді түрде жеткізеді.

Байланысты блогтар

Doubao Seed 1.8 API-ді қалай пайдалану керек?  Жан-жақты нұсқаулық
Jan 12, 2026

Doubao Seed 1.8 API-ді қалай пайдалану керек? Жан-жақты нұсқаулық

Doubao Seed 1.8 — ByteDance-тің Doubao тобы мен Seed зерттеу желісінің бір бөлігі — өте үлкен контексті өңдеуге және құралдар/агенттерді қолдауды жақсартуға бейімделген «агенттік» мультимодальды модель ретінде назар аударып отыр.