Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

Invoer:$0.2/M
Uitvoer:$1.6/M
Context:256k
Max Uitvoer:224k
Doubao-Seed-1.8 is geoptimaliseerd voor multimodale agent-scenario's. Wat betreft agentcapaciteiten zijn het gebruik van tools en het opvolgen van complexe commando's aanzienlijk verbeterd. Op het vlak van multimodaal begrip zijn de basisvisuele mogelijkheden aanzienlijk verbeterd, waardoor begrip bij lage framesnelheid van extreem lange video's mogelijk wordt. Begrip van videobewegingen, complex ruimtelijk begrip en mogelijkheden voor het parseren van documentstructuren zijn eveneens geoptimaliseerd, en intelligent contextbeheer wordt nu native ondersteund, waardoor gebruikers contextstrategieën kunnen configureren.
Nieuw
Commercieel gebruik
Playground
Overzicht
Functies
Prijzen
API

Technische specificaties van de Seed 1.8 API

ItemSpecificatie / opmerking
Modelnaam / familieDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Ondersteunde modaliteitenTekst, afbeeldingen, video (multimodale VLM-capaciteiten), audio-tools in het ecosysteem (aparte modellen voor audio-/videogeneratie).
Contextvenster (tekst)256K tokens
Video-/visuele capaciteitOntworpen voor redeneren over lange video’s, ondersteunt efficiënte visuele encodering en grote video-tokenbudgetten (modelkaart rapporteert video-tokenexperimenten en benchmarks voor lange video’s).
InvoerformatenVrije-tekstprompts; afbeeldinguploads (screenshots, grafieken, foto’s); video als getokeniseerde frames / videotools voor segmentinspectie; bestandsuploads (documenten).
UitvoerformatenNatuurlijke-taaltekst, gestructureerde outputs (structured-output beta), functieaanroepen / toolaanroepen, code en multimodale outputs via orkestratie.
Denk-/inferentiemodino_think, think-low, think-medium, think-high — afweging tussen nauwkeurigheid en latentie/kosten.

Wat is Doubao Seed 1.8?

Doubao Seed 1.8 is de 1.8-release van het Seed-team: een verenigd LLM+VLM dat expliciet inzet op gegeneraliseerd handelingsvermogen in de echte wereld — d.w.z. perceptie (afbeeldingen/video), redenering, tool-orkestratie (zoeken, functieaanroepen, code-uitvoering, GUI grounding) en besluitvorming in meerdere stappen binnen één model. Het ontwerp legt de nadruk op configureerbare “denkmodi” (afwegingen tussen latentie en diepte), efficiënte visuele encodering en native ondersteuning voor lange context en multimodale invoer, zodat het model als autonome assistent/agent kan opereren in productie-workflows.

Belangrijkste functies van de Seed 1.8 API

  1. Geünificeerd multimodaal agentisch model. Integreert perceptie (beeld/video), redenering (LLM) en actie (tool-/G U I-aanroepen, code-uitvoering) in één model in plaats van een gesplitste pipeline. Dit maakt compacte agent-workflows mogelijk en verlaagt de orkestratiecomplexiteit.
  2. Ultralange context & verwerking van lange video’s. Lange context (productondersteuning tot 256k tokens) en specifieke benchmarks voor lange video’s (Seed1.8 toont sterke tokenefficiëntie voor lange video). Het model ondersteunt selectieve videotools (VideoCut) om de redenering te focussen op tijdstempels.
  3. Agentische GUI-automatisering & toolgebruik. Benchmarks en interne tests (OSWorld, AndroidWorld, LiveCodeBench, GUI grounding-benchmarks) tonen verbeteringen in GUI-agenttaken en automatisering in meerdere stappen. Het model kan GUI grounding-commando’s genereren en werken binnen gesimuleerde OS-/web-/mobiele contexten.
  4. Configureerbare denkmodi voor latentie-/kostenbeheersing. Vier inferentiemodi stellen ontwikkelaars in staat rekenwerk bij test-time af te stemmen voor interactieve versus hoogwaardige batchtaken. Dit is nuttig voor productiesystemen met strikte latentiebudgetten.
  5. Verbeterde tokenefficiëntie (multimodaal). Seed 1.8 vertoont hogere tokenefficiëntie op multimodale benchmarks vergeleken met zijn voorgangers (Seed-1.5/1.6-serie), met hoge nauwkeurigheid bij kleinere tokenbudgetten in verschillende taken met lange video’s.
  6. Configureerbare denkmodi: maak een afweging tussen inferentiediepte en latentie/kosten met verschillende modi (no_think → think-high) om af te stemmen op interactieve productiegebruik.
  7. Technische mogelijkheden
  • Tokenefficiëntie: Seed1.8 toont duidelijke tokenefficiëntie t.o.v. voorgangers (Seed-1.5/1.6), met hogere nauwkeurigheid bij lagere tokenbudgetten op taken met lange video (bijv. competitieve nauwkeurigheid zelfs bij 32K videotokens). Dit maakt lagere inferentiekosten mogelijk voor lange invoer.
  • Multimodale redenering & perceptie: Het model bereikt SOTA op verschillende multi-image VQA- en bewegings-/perceptietaken en behaalt tweede plaats of near-SOTA op veel multimodale redeneerbenchmarks; specifiek overtreft het zijn voorganger op vrijwel elke gemeten visuele/videodimensie.
  • Agentisch toolgebruik & GUI grounding: Gedocumenteerde ondersteuning voor GUI grounding en schermgebaseerde operationele benchmarks (ScreenSpot-Pro, GUI agenting) met sterke grounding-scores (bijv. verbeteringen t.o.v. Seed-1.5-VL op ScreenSpot-Pro).
  • Parallelle / stapsgewijze redenering: Het verhogen van rekenwerk op test-time (parallel denken) levert meetbare winst op bij benchmarks voor wiskunde, coderen en multimodale redenering

Geselecteerde openbare benchmark-hoogtepunten van Seed1.8

  • VCRBench (visual commonsense reasoning): Seed1.8 scoorde 59.8 (Pass@1 gerapporteerd in de modelkaarttabel), een verbetering t.o.v. Seed-1.5-VL en concurrerend met topmodellen
  • VideoHolmes (video reasoning): Seed1.8 65.5, beter dan Seed-1.5-VL en benadert modellen van professioneel niveau.
  • MMLB-NIAH (multimodale lange context, 128k): Seed1.8 behaalde 72.2 Pass@1 bij 128k context in MMLB-NIAH, en overtrof enkele hedendaagse professionele modellen.
  • Motion & Perception suite: SOTA in 5 van de 6 geëvalueerde taken; voorbeelden zijn TVBench, TempCompass en TOMATO, waar Seed1.8 aanzienlijke winst laat zien in temporele perceptie.
  • Agentische workflows: Op BrowseComp en andere agentische zoek-/codebenchmarks staat Seed1.8 vaak nabij of boven concurrerende professionele modellen

Seed 1.8 vs Gemini 3 Pro / GPT-5.x

  • Seed1.8 vs Seed-1.5-VL / Seed-1.6: Duidelijke verbeteringen in multimodale perceptie, tokenefficiëntie voor lange video’s en agentische uitvoering.
  • Seed1.8 vs Gemini 3 Pro / GPT-5.x: Op veel multimodale benchmarks evenaart of overtreft Seed1.8 Gemini 3 Pro (SOTA op meerdere VQA-/bewegingstaken; beter op de MMLB-NIAH 128k-run). De kaart toont echter ook gebieden waar modellen uit de Gemini-familie voordelen behouden op bepaalde disciplinaire kennistaken — de relatieve volgorde is dus afhankelijk van de benchmark.
  • Seed-Code variant (Doubao-Seed-Code): gespecialiseerd voor programmeer-/agentische codetaken (grote context voor codebases; gespecialiseerde SWE-benchmarks). Seed1.8 is het generalistische agentische multimodale model, terwijl Seed-Code de programmeergerichte variant is.

Praktische use-cases met de Seedream 4.5 API op CometAPI

  • Multimodale onderzoeksassistenten & documentanalyse: extraheren, samenvatten en redeneren over lange documenten, slide decks en rapporten met meerdere pagina’s.
  • Begrip en monitoring van lange video’s: analyses voor security/sportuitzendingen, samenvatting van lange vergaderingen en streaminganalyse waar de tokenefficiëntie voor lange video van het model van belang is.
  • Agentische workflows / automatisering: scenario’s met webzoeken in meerdere stappen + code-uitvoering + data-extractie (bijv. geautomatiseerde concurrentieanalyse, reisplanning, onderzoekspijplijnen aangetoond in interne benchmarks).
  • Ontwikkelaarstools (bij gebruik van Seed-Code): analyse van grote codebases, IDE-assistenten en agentische code-uitvoering voor testen & reparatie (Seed-Code is de aanbevolen gespecialiseerde variant).
  • GUI-automatisering & RPA: screen grounding en GUI-agentbenchmarks duiden erop dat het model gestructureerde GUI-taken beter uitvoert dan eerdere Seed-releases.

Hoe de doubao Seed 1.8 API te gebruiken via CometAPI

Doubao seed1.8 is nu commercieel beschikbaar via CometAPI als een gehoste inferentie-API. De API ondersteunt multimodale payloads (tekst + afbeeldingen + videofragmenten / tijdstempels) en configureerbare inferentiemodi om latentie en rekenwerk af te wegen tegen antwoordkwaliteit.

Aanroeppatronen: De API ondersteunt standaard verzoeken in chat-/completion-stijl, streamingresponsen en agentische flows waarbij het model toolaanroepen doet (zoeken, code-uitvoering, GUI-acties) en tooloutputs als daaropvolgende context inneemt.

Streaming & verwerking van lange context: De API ondersteunt streaming en beschikt over ingebouwde primitieven voor contextbeheer bij lange sessies (om 100K+ contexten / agenttraces in meerdere stappen mogelijk te maken).

Stap 1: Meld je aan voor een API-sleutel

Log in op cometapi.com. Als je nog geen gebruiker bent, registreer je eerst. Meld je aan bij je CometAPI console. Verkrijg de toegangssleutel (API key) voor de interface. Klik bij API-token in het persoonlijke centrum op “Add Token”, verkrijg de tokensleutel: sk-xxxxx en dien deze in.

Flux.2 Flex API

Stap 2: Verzoeken versturen naar doubao Seed 1.8 API

Selecteer het “doubao-seed-1-8-251228”-endpoint om het API-verzoek te versturen en stel de request body in. De verzoekmethode en request body zijn te vinden in onze API-documentatie op de website. Onze website biedt ook een Apifox-test voor jouw gemak. Vervang <YOUR_API_KEY> door je daadwerkelijke CometAPI-sleutel uit je account. Compatibel met de Chat API’s.

Voer je vraag of verzoek in het content-veld in — dit is waarop het model zal reageren. Verwerk de API-respons om het gegenereerde antwoord te verkrijgen.

Stap 3: Resultaten ophalen en verifiëren

Verwerk de API-respons om het gegenereerde antwoord te verkrijgen. Na verwerking reageert de API met de taakstatus en uitvoerdata.

Veelgestelde vragen

What variants exist of Seed 1.8 and when to use each?

Seed1.8 is the generalist multimodal agent. Related variants include: Seed-Code / Doubao-Seed-Code: specialized for very large code contexts (some SKUs claim 256K contexts) and coding workflows. Seedance / Seedream: media/generation specialized variants (video/image generation). Pick Seed-Code for IDE/codebase tasks; pick Seed1.8 for broad multimodal agent tasks. Confirm SKU context windows and capabilities in product docs.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 emphasizes agentic integration (tool use, GUI agenting, multi-step workflows), improved long-context handling and better long-video/motion perception vs earlier Seed 1.x models. It is positioned as the multimodal/agent upgrade in the Seed line.

What input/output modalities does Seed1.8 support?

Native multimodal support: text + images + video. Outputs include natural language answers, structured outputs (JSON/action plans), code, and references to visual segments/timestamps for agentic workflows. The model is explicitly designed for multimodal perception → reasoning → action.

What are the “thinking” or inference modes of Seed1.8?

There are tunable “thinking” modes — designed to trade off latency/compute vs. depth of reasoning (useful when you must balance interactivity vs. solution quality). Use the modes to tune for interactive UIs or deeper batch reasoning.

Functies voor Doubao-Seed-1.8

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of Doubao-Seed-1.8, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持Doubao-Seed-1.8这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van Doubao-Seed-1.8, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van Doubao-Seed-1.8, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Doubao-Seed-1.8, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Doubao-Seed-1.8

Ontdek concurrerende prijzen voor Doubao-Seed-1.8, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Doubao-Seed-1.8 uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.
Comet Prijs (USD / M Tokens)Officiële Prijs (USD / M Tokens)Korting
Invoer:$0.2/M
Uitvoer:$1.6/M
Invoer:$0.25/M
Uitvoer:$2/M
-20%

Voorbeeldcode en API voor Doubao-Seed-1.8

Doubao seed1.8 wordt nu commercieel aangeboden via CometAPI als een gehoste inferentie-API. De API ondersteunt multimodale payloads (tekst + afbeeldingen + videofragmenten / tijdstempels) en configureerbare inferentiemodi om latentie en rekencapaciteit af te wegen tegen de antwoordkwaliteit.
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Meer modellen