ModellenOndersteuningOndernemingBlog
500+ AI Model API, Alles In Één API. Gewoon In CometAPI
Modellen API
Ontwikkelaar
Snelle StartDocumentatieAPI Dashboard
Bronnen
AI-modellenBlogOndernemingWijzigingslogboekOver ons
2025 CometAPI. Alle rechten voorbehouden.PrivacybeleidServicevoorwaarden
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

Invoer:$0.2/M
Uitvoer:$1.6/M
Context:256k
Max Uitvoer:224k
Doubao-Seed-1.8 is geoptimaliseerd voor multimodale agent-scenario's. Wat betreft agentcapaciteiten zijn het gebruik van tools en het opvolgen van complexe commando's aanzienlijk verbeterd. Op het vlak van multimodaal begrip zijn de basisvisuele mogelijkheden aanzienlijk verbeterd, waardoor begrip bij lage framesnelheid van extreem lange video's mogelijk wordt. Begrip van videobewegingen, complex ruimtelijk begrip en mogelijkheden voor het parseren van documentstructuren zijn eveneens geoptimaliseerd, en intelligent contextbeheer wordt nu native ondersteund, waardoor gebruikers contextstrategieën kunnen configureren.
Nieuw
Commercieel gebruik
Playground
Overzicht
Functies
Prijzen
API

Technische specificaties van Seed 1.8 API

ItemSpecificatie / opmerking
Model name / familyDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Modalities supportedTekst, afbeeldingen, video (multimodale VLM-mogelijkheden), audiotooling in het ecosysteem (afzonderlijke modellen voor audio-/videogeneratie).
Context window (text)256K tokens
Video / visual capacityOntworpen voor redeneren over lange video’s, ondersteunt efficiënte visuele codering en grote budgets voor videotokens (de modelkaart rapporteert videotokenexperimenten en benchmarks voor lange video’s).
Input formatsVrijetekstprompts; afbeeldingsuploads (screenshots, grafieken, foto’s); video als getokeniseerde frames / videotools voor segmentinspectie; bestandsuploads (documenten).
Output formatsNatuurlijke taaltekst, gestructureerde outputs (structured-output beta), functieaanroepen / tool calls, code en multimodale outputs via orkestratie.
Thinking / inference modesno_think, think-low, think-medium, think-high — afweging tussen nauwkeurigheid en latency/kosten.

Wat is Doubao Seed 1.8?

Doubao Seed 1.8 is de 1.8-release van het Seed-team: een uniforme LLM+VLM die expliciet is gericht op gegeneraliseerde real-world agency — d.w.z. perceptie (afbeeldingen/video), redeneren, toolorkestratie (zoeken, functieaanroepen, code-uitvoering, GUI-grounding) en meerstapsbesluitvorming binnen één enkel model. Het ontwerp legt de nadruk op configureerbare “thinking modes” (afwegingen tussen latency en diepgang), efficiënte visuele codering en native ondersteuning voor lange context en multimodale inputs, zodat het model kan functioneren als een autonome assistent/agent in productie-workflows.

Belangrijkste kenmerken van de Seed 1.8 API

  1. Uniform multimodaal agentisch model. Integreert perceptie (afbeelding/video), redeneren (LLM) en actie (tool-/G U I-aanroepen, code-uitvoering) in één enkel model in plaats van een gesplitste pipeline. Dit maakt compacte agentworkflows en een lagere orkestratiecomplexiteit mogelijk.
  2. Ultralange context en verwerking van lange video’s. Lange context (productondersteuning tot 256k tokens) en specifieke benchmarks voor lange video’s (Seed1.8 toont sterke videotoken-efficiëntie voor lange video’s). Het model ondersteunt selectieve videotools (VideoCut) om redeneren op tijdstempels te focussen.
  3. Agentische GUI-automatisering en toolgebruik. Benchmarks en interne tests (OSWorld, AndroidWorld, LiveCodeBench, GUI-grounding-benchmarks) tonen verbeteringen in GUI-agenttaken en meerstapsautomatisering. Het model kan GUI-grounding-commando’s uitvoeren en opereren binnen gesimuleerde OS-/web-/mobiele contexten.
  4. Configureerbare thinking modes voor latency-/kostenbeheersing. Vier inferentiemodi laten ontwikkelaars de rekeninspanning tijdens testtijd afstemmen voor interactieve taken versus batchtaken van hoge kwaliteit. Dit is nuttig voor productiesystemen met strikte latencybudgetten.
  5. Verbeterde tokenefficiëntie (multimodaal). Seed 1.8 toont sterkere tokenefficiëntie op multimodale benchmarks dan zijn voorgangers (Seed-1.5/1.6-serie), en behaalt hoge nauwkeurigheid met kleinere tokenbudgets in verschillende taken met lange video’s.
  6. Configureerbare thinking modes: wissel inferentiediepte af tegen latency/kosten met verschillende modi (no_think → think-high) om af te stemmen op interactief productiegebruik.
  7. Technische mogelijkheden
  • Tokenefficiëntie: Seed1.8 toont duidelijke tokenefficiëntie ten opzichte van voorgangers (Seed-1.5/1.6), met sterkere nauwkeurigheid bij lagere tokenbudgets op lange videotaken (bijv. competitieve nauwkeurigheid zelfs bij 32K videotokens). Dit maakt lagere inferentiekosten voor lange inputs mogelijk.
  • Multimodaal redeneren en perceptie: Het model bereikt SOTA op verschillende multi-image-VQA- en motion-/perception-taken en behaalt de tweede plaats of bijna-SOTA op veel multimodale redeneerbenchmarks; specifiek presteert het beter dan zijn voorganger op vrijwel elke gemeten visuele/video-dimensie.
  • Agentisch toolgebruik en GUI-grounding: Gedocumenteerde ondersteuning voor GUI-grounding en schermgebaseerde operationele benchmarks (ScreenSpot-Pro, GUI-agenting) met sterke groundingscores (bijv. verbeteringen ten opzichte van Seed-1.5-VL op ScreenSpot-Pro).
  • Parallel / stapsgewijs redeneren: Toenemende rekeninspanning tijdens testtijd (parallel thinking) levert meetbare verbeteringen op bij wiskunde-, programmeer- en multimodale redeneerbenchmarks

Geselecteerde openbare benchmark-highlights van Seed1.8

  • VCRBench (visual commonsense reasoning): Seed1.8 scoorde 59.8 (Pass@1 gerapporteerd in de modelkaarttabel), een verbetering ten opzichte van Seed-1.5-VL en competitief met topmodellen
  • VideoHolmes (videoredenatie): Seed1.8 65.5, beter dan Seed-1.5-VL en in de buurt van pro-grade concurrerende modellen.
  • MMLB-NIAH (multimodale lange context, 128k): Seed1.8 behaalde 72.2 Pass@1 bij 128k context in MMLB-NIAH, en overtrof daarmee sommige hedendaagse promodellen.
  • Motion & Perception-suite: SOTA in 5 van de 6 geëvalueerde taken; voorbeelden zijn TVBench, TempCompass en TOMATO, waar Seed1.8 aanzienlijke verbeteringen laat zien in temporele perceptie.
  • Agentische workflows: Op BrowseComp en andere agentische zoek-/codebenchmarks staat Seed1.8 vaak in de buurt van of boven concurrerende promodellen

Seed 1.8 vs Gemini 3 Pro / GPT-5.x

  • Seed1.8 vs Seed-1.5-VL / Seed-1.6: Duidelijke verbeteringen in multimodale perceptie, tokenefficiëntie voor lange video’s en agentische uitvoering.
  • Seed1.8 vs Gemini 3 Pro / GPT-5.x: Op veel multimodale benchmarks evenaart of overtreft Seed1.8 Gemini 3 Pro (SOTA op verschillende VQA-/motion-taken; beter op de MMLB-NIAH 128k-run). De kaart laat echter ook gebieden zien waar modellen uit de Gemini-familie voordelen behouden bij bepaalde vakspecifieke kennistaken — de relatieve rangorde hangt dus af van de benchmark.
  • Seed-Code-variant (Doubao-Seed-Code): gespecialiseerd voor programmeer-/agentische codetaken (grote context voor codebases; gespecialiseerde SWE-benchmarks). Seed1.8 is het generalistische agentische multimodale model, terwijl Seed-Code de variant is die op programmeren is gericht.

Praktische use-cases van de Seedream 4.5 API op CometAPI

  • Multimodale onderzoeksassistenten en documentanalyse: extraheren, samenvatten en redeneren over lange documenten, slide decks en rapporten met meerdere pagina’s.
  • Begrip en monitoring van lange video’s: analyse van beveiligings-/sportuitzendingen, samenvatting van lange vergaderingen en streaminganalyse, waarbij de tokenefficiëntie van het model voor lange video’s belangrijk is.
  • Agentische workflows / automatisering: scenario’s met meerstaps webzoekopdrachten + code-uitvoering + data-extractie (bijv. geautomatiseerde concurrentieanalyse, reisplanning, onderzoekspijplijnen die in interne benchmarks zijn gedemonstreerd).
  • Ontwikkelaarstools (bij gebruik van Seed-Code): analyse van grote codebases, IDE-assistenten en agentische code-uitvoering voor testen en reparatie (Seed-Code is de aanbevolen gespecialiseerde variant).
  • GUI-automatisering en RPA: benchmarks voor schermgrounding en GUI-agents geven aan dat het model gestructureerde GUI-taken beter kan uitvoeren dan eerdere Seed-releases.

Hoe doubao Seed 1.8 API via CometAPI te gebruiken

Doubao seed1.8 wordt nu commercieel aangeboden via CometAPI als een gehoste inferentie-API. De API ondersteunt multimodale payloads (tekst + afbeeldingen + videofragmenten / tijdstempels) en configureerbare inferentiemodi om latency en rekeninspanning af te wegen tegen de kwaliteit van het antwoord.

Aanroeppatronen: De API ondersteunt standaardverzoeken in chat-/completion-stijl, streaming responses en agentische flows waarbij het model tool calls uitgeeft (zoeken, code-uitvoering, GUI-acties) en tooloutputs opneemt als vervolgcontext.

Streaming en verwerking van lange context: De API ondersteunt streaming en heeft ingebouwde contextbeheerprimitieven voor lange sessies (om 100K+ contexten / meerstaps agenttraces mogelijk te maken).

Stap 1: Meld u aan voor een API-sleutel

Log in op cometapi.com. Als u nog geen gebruiker bent, registreer u dan eerst. Meld u aan bij uw CometAPI-console. Haal de toegangsgegevens van de interfacesleutel API key op. Klik op “Add Token” bij de API-token in het persoonlijke centrum, verkrijg de tokensleutel: sk-xxxxx en verstuur deze.

Stap 2: Verzend verzoeken naar de doubao Seed 1.8 API

Selecteer het “doubao-seed-1-8-251228 ”-endpoint om het API-verzoek te verzenden en stel de request body in. De request method en request body zijn te vinden in de API-documentatie op onze website. Onze website biedt voor uw gemak ook Apifox-testen. Vervang <YOUR_API_KEY> door uw daadwerkelijke CometAPI-sleutel uit uw account. Compatibel met de Chat-API’s.

Voeg uw vraag of verzoek in het veld content in — hierop zal het model reageren . Verwerk de API-response om het gegenereerde antwoord te verkrijgen.

Stap 3: Resultaten ophalen en verifiëren

Verwerk de API-response om het gegenereerde antwoord te verkrijgen. Na verwerking antwoordt de API met de taakstatus en outputdata.

Veelgestelde vragen

What variants exist of Seed 1.8 and when to use each?

Welke varianten van Seed 1.8 bestaan er en wanneer gebruik je welke?

How does Seed1.8 differ from prior Seed versions?

Hoe verschilt Seed1.8 van eerdere Seed-versies?

What input/output modalities does Seed1.8 support?

Welke invoer-/uitvoermodaliteiten ondersteunt Seed1.8?

What are the “thinking” or inference modes of Seed1.8?

Wat zijn de "thinking"- of inferentiemodi van Seed1.8?

Functies voor Doubao-Seed-1.8

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of Doubao-Seed-1.8, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持Doubao-Seed-1.8这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van Doubao-Seed-1.8, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van Doubao-Seed-1.8, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Doubao-Seed-1.8, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Doubao-Seed-1.8

Ontdek concurrerende prijzen voor Doubao-Seed-1.8, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Doubao-Seed-1.8 uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.
Comet Prijs (USD / M Tokens)Officiële Prijs (USD / M Tokens)Korting
Invoer:$0.2/M
Uitvoer:$1.6/M
Invoer:$0.25/M
Uitvoer:$2/M
-20%

Voorbeeldcode en API voor Doubao-Seed-1.8

Doubao seed1.8 wordt nu commercieel beschikbaar gesteld via CometAPI als een gehoste inferentie-API. De API ondersteunt multimodale payloads (tekst + afbeeldingen + videofragmenten / tijdstempels) en configureerbare inferentiemodi om latentie en rekenkracht af te wegen tegen de kwaliteit van antwoorden.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

Meer modellen

A

Claude Opus 4.6

Invoer:$4/M
Uitvoer:$20/M
Claude Opus 4.6 is het “Opus”-klasse grote taalmodel van Anthropic, uitgebracht in februari 2026. Het is gepositioneerd als een werkpaard voor kenniswerk en onderzoekswerkstromen — met verbeteringen in redeneren over lange contexten, planning in meerdere stappen, het gebruik van tools (waaronder agentische softwareworkflows), en computertaken zoals het automatisch genereren van dia’s en spreadsheets.
A

Claude Sonnet 4.6

Invoer:$2.4/M
Uitvoer:$12/M
Claude Sonnet 4.6 is ons meest capabele Sonnet-model tot nu toe. Het is een volledige upgrade van de vaardigheden van het model op het gebied van coderen, computergebruik, redeneren met lange context, agentplanning, kenniswerk en ontwerp. Sonnet 4.6 biedt daarnaast een contextvenster van 1M tokens in bèta.
O

GPT-5.4 nano

Invoer:$0.16/M
Uitvoer:$1/M
GPT-5.4 nano is ontworpen voor taken waarbij snelheid en kosten het belangrijkst zijn, zoals classificatie, data-extractie, ranking en subagenten.
O

GPT-5.4 mini

Invoer:$0.6/M
Uitvoer:$3.6/M
GPT-5.4 mini brengt de sterke punten van GPT-5.4 naar een sneller en efficiënter model dat is ontworpen voor grootschalige workloads.
A

Claude Mythos Preview

A

Claude Mythos Preview

Binnenkort beschikbaar
Invoer:$60/M
Uitvoer:$240/M
Claude Mythos Preview is ons meest capabele frontiermodel tot nu toe en laat een opmerkelijke sprong in scores zien op veel evaluatiebenchmarks vergeleken met ons vorige frontiermodel, Claude Opus 4.6.
X

mimo-v2-pro

Invoer:$0.8/M
Uitvoer:$2.4/M
MiMo-V2-Pro is het vlaggenschipfoundationmodel van Xiaomi, met meer dan 1T totale parameters en een contextlengte van 1M, diepgaand geoptimaliseerd voor agent-gebaseerde scenario's. Het is zeer goed aanpasbaar aan algemene agentframeworks zoals OpenClaw. Het behoort tot de wereldtop in de standaardbenchmarks PinchBench en ClawBench, met een waargenomen prestatieniveau dat dat van Opus 4.6 benadert. MiMo-V2-Pro is ontworpen om te fungeren als het brein van agentsystemen, complexe workflows te orkestreren, productie-engineeringtaken aan te sturen en resultaten betrouwbaar te leveren.

Gerelateerde blogs

Hoe gebruikt u de Doubao Seed 1.8 API?  Een uitgebreide gids
Jan 12, 2026

Hoe gebruikt u de Doubao Seed 1.8 API? Een uitgebreide gids

Doubao Seed 1.8 — onderdeel van de Doubao-familie van ByteDance en de Seed-onderzoeksrichting — trekt de aandacht omdat het is ontwikkeld als een “agentic” multimodaal model met het vermogen om zeer grote contexten te verwerken en verbeterde tool/agent-ondersteuning.