What variants exist of Seed 1.8 and when to use each?

Seed1.8 er den generalistiske multimodale agent. Relaterede varianter omfatter: Seed-Code / Doubao-Seed-Code: specialiseret til meget store kodekontekster (nogle SKU'er angiver 256K-kontekster) og kodningsarbejdsgange. Seedance / Seedream: specialiserede varianter til medier/generering (video-/billedgenerering). Vælg Seed-Code til IDE-/kodebaseopgaver; vælg Seed1.8 til brede multimodale agentopgaver. Bekræft SKU-kontekstvinduer og funktioner i produktdokumentationen.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 lægger vægt på agentisk integration (værktøjsbrug, GUI-agenting, flertrinsarbejdsgange), forbedret håndtering af lang kontekst og bedre opfattelse af lange videoer/bevægelser sammenlignet med tidligere Seed 1.x-modeller. Det er positioneret som den multimodale/agentiske opgradering i Seed-linjen.

What input/output modalities does Seed1.8 support?

Indbygget multimodal understøttelse: tekst + billeder + video. Output omfatter svar i naturligt sprog, strukturerede output (JSON/handlingsplaner), kode og henvisninger til visuelle segmenter/tidsstempler til agentiske arbejdsgange. Modellen er eksplicit designet til multimodal perception → ræsonnering → handling.

What are the “thinking” or inference modes of Seed1.8?

Der findes justerbare “thinking”-tilstande — designet til at afveje latenstid/beregning mod ræsonneringsdybde (nyttigt, når du skal balancere interaktivitet mod løsningskvalitet). Brug tilstandene til at justere til interaktive brugergrænseflader eller dybere batch-ræsonnering.

Affordable Doubao-Seed-1.8 API | text-to-text

Tekniske specifikationer for Seed 1.8 API

Item	Specifikation / note
Model name / family	Doubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Modalities supported	Tekst, billeder, video (multimodale VLM-kapaciteter), lydværktøjer i økosystemet (separate modeller til lyd-/videogenerering).
Context window (text)	256K tokens
Video / visual capacity	Designet til long-video-reasoning, understøtter effektiv visuel kodning og store video-token-budgetter (modelkortet rapporterer video-token-eksperimenter og long-video-benchmarks).
Input formats	Fritekstprompter; billeduploads (skærmbilleder, diagrammer, fotos); video som tokeniserede frames / videoværktøjer til segmentinspektion; filuploads (dokumenter).
Output formats	Naturligt sprog, strukturerede outputs (structured-output beta), funktionskald / værktøjskald, kode og multimodale outputs via orkestrering.
Thinking / inference modes	no_think, think-low, think-medium, think-high — afvejer nøjagtighed mod latenstid/omkostninger.

Hvad er Doubao Seed 1.8?

Doubao Seed 1.8 er Seed-teamets 1.8-udgivelse: en samlet LLM+VLM, der eksplicit sigter mod generalized real-world agency — dvs. perception (billeder/video), ræsonnering, værktøjsorkestrering (søgning, funktionskald, kodeeksekvering, GUI-grounding) og flertrinsbeslutningstagning i én enkelt model. Designet lægger vægt på konfigurerbare “thinking modes” (afvejninger mellem latenstid og dybde), effektiv visuel kodning og indbygget understøttelse af lang kontekst og multimodale input, så modellen kan fungere som en autonom assistent/agent i produktionsworkflows.

Hovedfunktioner i Seed 1.8 API

Samlet multimodal agentisk model. Integrerer perception (billede/video), ræsonnering (LLM) og handling (værktøjs-/G U I-kald, kodeeksekvering) i en enkelt model i stedet for en opdelt pipeline. Dette muliggør kompakte agent-workflows og lavere orkestreringskompleksitet.
Ultralang kontekst og håndtering af lange videoer. Lang kontekst (produktsupport op til 256k tokens) og specifikke long-video-benchmarks (Seed1.8 viser stærk long-video-tokeneffektivitet). Modellen understøtter selektive videoværktøjer (VideoCut) til at fokusere ræsonnering på tidsstempler.
Agentisk GUI-automatisering og værktøjsbrug. Benchmarks og interne tests (OSWorld, AndroidWorld, LiveCodeBench, GUI-grounding-benchmarks) viser forbedringer i GUI-agentopgaver og flertrinsautomatisering. Modellen kan outputte GUI-grounding-kommandoer og operere i simulerede OS-/web-/mobilkontekster.
Konfigurerbare thinking modes til styring af latenstid/omkostninger. Fire inferenstilstande lader udviklere justere compute ved testtid til interaktive opgaver versus batchopgaver af høj kvalitet. Dette er nyttigt for produktionssystemer med stramme latenstidsbudgetter.
Forbedret tokeneffektivitet (multimodal). Seed 1.8 demonstrerer stærkere tokeneffektivitet på multimodale benchmarks sammenlignet med sine forgængere (Seed-1.5/1.6-serien) og opnår høj nøjagtighed med mindre tokenbudgetter i flere long-video-opgaver.
Konfigurerbare thinking modes: afvej inferensdybde mod latenstid/omkostninger med forskellige tilstande (no_think → think-high) for at tilpasse interaktiv brug i produktion.
Tekniske kapaciteter

Tokeneffektivitet: Seed1.8 viser markant tokeneffektivitet i forhold til forgængere (Seed-1.5/1.6) og leverer stærkere nøjagtighed ved lavere tokenbudgetter på lange videoopgaver (f.eks. ved at opnå konkurrencedygtig nøjagtighed selv ved 32K videotokens). Dette muliggør lavere inferensomkostninger for lange input.
Multimodal ræsonnering og perception: Modellen når SOTA på flere multi-image-VQA- og bevægelses-/perceptionsopgaver og opnår andenplads eller nær-SOTA på mange multimodale ræsonneringsbenchmarks; specifikt overgår den sin forgænger på næsten alle målte visuelle/video-dimensioner.
Agentisk værktøjsbrug og GUI-grounding: Dokumenteret understøttelse af GUI-grounding og skærmbaserede operationsbenchmarks (ScreenSpot-Pro, GUI agenting) med stærke grounding-scorer (f.eks. forbedringer i forhold til Seed-1.5-VL på ScreenSpot-Pro).
Parallel / trinvist ræsonnering: Øget compute ved testtid (parallel thinking) giver målbare gevinster på benchmarks for matematik, kodning og multimodal ræsonnering

Udvalgte offentlige benchmark-højdepunkter for Seed1.8

VCRBench (visual commonsense reasoning): Seed1.8 scorede 59.8 (Pass@1 rapporteret i modelkorttabellen), en forbedring i forhold til Seed-1.5-VL og konkurrencedygtig med topmodeller
VideoHolmes (videoræsonnering): Seed1.8 65.5, overgår Seed-1.5-VL og nærmer sig professionelle konkurrerende modeller.
MMLB-NIAH (multimodal lang kontekst, 128k): Seed1.8 opnåede 72.2 Pass@1 ved 128k kontekst i MMLB-NIAH og overgik nogle samtidige pro-modeller.
Motion & Perception suite: SOTA i 5 ud af 6 evaluerede opgaver; eksempler inkluderer TVBench, TempCompass og TOMATO, hvor Seed1.8 viser betydelige fremskridt i temporal perception.
Agentiske workflows: På BrowseComp og andre agentiske søge-/kodebenchmarks rangerer Seed1.8 ofte tæt på eller over konkurrerende pro-modeller

Seed 1.8 vs Gemini 3 Pro / GPT-5.x

Seed1.8 vs Seed-1.5-VL / Seed-1.6: Klare forbedringer i multimodal perception, tokeneffektivitet for lange videoer og agentisk eksekvering.
Seed1.8 vs Gemini 3 Pro / GPT-5.x: På mange multimodale benchmarks matcher eller overgår Seed1.8 Gemini 3 Pro (SOTA på flere VQA-/bevægelsesopgaver; bedre på MMLB-NIAH 128k-kørsel). Kortet viser dog også områder, hvor Gemini-familien bevarer fordele på visse fagspecifikke videnopgaver — så den relative rangordning afhænger af benchmark.
Seed-Code-variant (Doubao-Seed-Code): specialiseret til programmering/agentiske kodeopgaver (stor kontekst til kodebaser; specialiserede SWE-benchmarks). Seed1.8 er den generalistiske agentiske multimodale model, mens Seed-Code er den programmeringsfokuserede variant.

Praktiske use cases for Seedream 4.5 API på CometAPI

Multimodale forskningsassistenter og dokumentanalyse: udtræk, opsummer og ræsonnér på tværs af lange dokumenter, præsentationer og flersidede rapporter.
Forståelse og overvågning af lange videoer: analyse af sikkerhed/sportsudsendelser, opsummering af lange møder og streaminganalyse, hvor modellens long-video-tokeneffektivitet er vigtig.
Agentiske workflows / automatisering: scenarier med flertrins websøgning + kodeeksekvering + dataudtræk (f.eks. automatiseret konkurrentanalyse, rejseplanlægning, forskningspipelines demonstreret i interne benchmarks).
Udviklerværktøjer (hvis du bruger Seed-Code): analyse af store kodebaser, IDE-assistenter og agentisk kodeeksekvering til test og reparation (Seed-Code er den anbefalede specialiserede variant).
GUI-automatisering og RPA: screen grounding og GUI-agentbenchmarks indikerer, at modellen kan udføre strukturerede GUI-opgaver bedre end tidligere Seed-udgivelser.

Sådan bruger du doubao Seed 1.8 API via CometAPI

Doubao seed1.8 udbydes nu kommercielt via CometAPI som en hostet inferens-API. API’et understøtter multimodale payloads (tekst + billeder + videofragmenter / tidsstempler) og konfigurerbare inferenstilstande for at afveje latenstid og compute mod svarkvalitet.

Kaldemønstre: API’et understøtter standard chat-/completion-lignende forespørgsler, streamingsvar og agentiske flows, hvor modellen udsteder værktøjskald (søgning, kodeeksekvering, GUI-handlinger) og indlæser værktøjsoutput som efterfølgende kontekst.

Streaming og håndtering af lang kontekst: API’et understøtter streaming og har indbyggede context management-primitiver til lange sessioner (for at muliggøre 100K+ kontekster / flertrins agentspor).

Trin 1: Tilmeld dig for at få en API-nøgle

Log ind på cometapi.com. Hvis du endnu ikke er bruger hos os, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent adgangsoplysningerne i form af API-nøglen til interfacet. Klik på “Add Token” under API-token i det personlige center, hent token-nøglen: sk-xxxxx, og indsend.

Trin 2: Send forespørgsler til doubao Seed 1.8 API

Vælg endpointet “doubao-seed-1-8-251228 ” for at sende API-forespørgslen og angive request body. Request method og request body findes i API-dokumentationen på vores website. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. Kompatibilitet med Chat-API’erne.

Indsæt dit spørgsmål eller din anmodning i content-feltet — det er dette, modellen vil svare på. Behandl API-responsen for at få det genererede svar.

Trin 3: Hent og verificer resultater

Behandl API-responsen for at få det genererede svar. Efter behandlingen svarer API’et med opgavestatus og outputdata.

Pricing for Doubao-Seed-1.8

Explore competitive pricing for Doubao-Seed-1.8, designed to fit various budgets and usage needs. Our flexible plans ensure you only pay for what you use, making it easy to scale as your requirements grow. Discover how Doubao-Seed-1.8 can enhance your projects while keeping costs manageable.

Comet Price (USD / M Tokens)	Official Price (USD / M Tokens)	Discount
Input:$0.2/M Output:$1.6/M	Input:$0.25/M Output:$2/M	-20%

Sample code and API for Doubao-Seed-1.8

Doubao seed1.8 er nu kommercielt tilgængelig via CometAPI som en hostet inferens-API. API'et understøtter multimodale payloads (tekst + billeder + videofragmenter/tidsstempler) og konfigurerbare inferenstilstande for at afveje latenstid og beregning mod svartkvalitet.

Python
JavaScript
Curl

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

Tekniske specifikationer for Seed 1.8 API

Item	Specifikation / note
Model name / family	Doubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Modalities supported	Tekst, billeder, video (multimodale VLM-kapaciteter), lydværktøjer i økosystemet (separate modeller til lyd-/videogenerering).
Context window (text)	256K tokens
Video / visual capacity	Designet til long-video-reasoning, understøtter effektiv visuel kodning og store video-token-budgetter (modelkortet rapporterer video-token-eksperimenter og long-video-benchmarks).
Input formats	Fritekstprompter; billeduploads (skærmbilleder, diagrammer, fotos); video som tokeniserede frames / videoværktøjer til segmentinspektion; filuploads (dokumenter).
Output formats	Naturligt sprog, strukturerede outputs (structured-output beta), funktionskald / værktøjskald, kode og multimodale outputs via orkestrering.
Thinking / inference modes	no_think, think-low, think-medium, think-high — afvejer nøjagtighed mod latenstid/omkostninger.

Hvad er Doubao Seed 1.8?

Hovedfunktioner i Seed 1.8 API

Samlet multimodal agentisk model. Integrerer perception (billede/video), ræsonnering (LLM) og handling (værktøjs-/G U I-kald, kodeeksekvering) i en enkelt model i stedet for en opdelt pipeline. Dette muliggør kompakte agent-workflows og lavere orkestreringskompleksitet.
Ultralang kontekst og håndtering af lange videoer. Lang kontekst (produktsupport op til 256k tokens) og specifikke long-video-benchmarks (Seed1.8 viser stærk long-video-tokeneffektivitet). Modellen understøtter selektive videoværktøjer (VideoCut) til at fokusere ræsonnering på tidsstempler.
Agentisk GUI-automatisering og værktøjsbrug. Benchmarks og interne tests (OSWorld, AndroidWorld, LiveCodeBench, GUI-grounding-benchmarks) viser forbedringer i GUI-agentopgaver og flertrinsautomatisering. Modellen kan outputte GUI-grounding-kommandoer og operere i simulerede OS-/web-/mobilkontekster.
Konfigurerbare thinking modes til styring af latenstid/omkostninger. Fire inferenstilstande lader udviklere justere compute ved testtid til interaktive opgaver versus batchopgaver af høj kvalitet. Dette er nyttigt for produktionssystemer med stramme latenstidsbudgetter.
Forbedret tokeneffektivitet (multimodal). Seed 1.8 demonstrerer stærkere tokeneffektivitet på multimodale benchmarks sammenlignet med sine forgængere (Seed-1.5/1.6-serien) og opnår høj nøjagtighed med mindre tokenbudgetter i flere long-video-opgaver.
Konfigurerbare thinking modes: afvej inferensdybde mod latenstid/omkostninger med forskellige tilstande (no_think → think-high) for at tilpasse interaktiv brug i produktion.
Tekniske kapaciteter

Tokeneffektivitet: Seed1.8 viser markant tokeneffektivitet i forhold til forgængere (Seed-1.5/1.6) og leverer stærkere nøjagtighed ved lavere tokenbudgetter på lange videoopgaver (f.eks. ved at opnå konkurrencedygtig nøjagtighed selv ved 32K videotokens). Dette muliggør lavere inferensomkostninger for lange input.
Multimodal ræsonnering og perception: Modellen når SOTA på flere multi-image-VQA- og bevægelses-/perceptionsopgaver og opnår andenplads eller nær-SOTA på mange multimodale ræsonneringsbenchmarks; specifikt overgår den sin forgænger på næsten alle målte visuelle/video-dimensioner.
Agentisk værktøjsbrug og GUI-grounding: Dokumenteret understøttelse af GUI-grounding og skærmbaserede operationsbenchmarks (ScreenSpot-Pro, GUI agenting) med stærke grounding-scorer (f.eks. forbedringer i forhold til Seed-1.5-VL på ScreenSpot-Pro).
Parallel / trinvist ræsonnering: Øget compute ved testtid (parallel thinking) giver målbare gevinster på benchmarks for matematik, kodning og multimodal ræsonnering

Udvalgte offentlige benchmark-højdepunkter for Seed1.8

VCRBench (visual commonsense reasoning): Seed1.8 scorede 59.8 (Pass@1 rapporteret i modelkorttabellen), en forbedring i forhold til Seed-1.5-VL og konkurrencedygtig med topmodeller
VideoHolmes (videoræsonnering): Seed1.8 65.5, overgår Seed-1.5-VL og nærmer sig professionelle konkurrerende modeller.
MMLB-NIAH (multimodal lang kontekst, 128k): Seed1.8 opnåede 72.2 Pass@1 ved 128k kontekst i MMLB-NIAH og overgik nogle samtidige pro-modeller.
Motion & Perception suite: SOTA i 5 ud af 6 evaluerede opgaver; eksempler inkluderer TVBench, TempCompass og TOMATO, hvor Seed1.8 viser betydelige fremskridt i temporal perception.
Agentiske workflows: På BrowseComp og andre agentiske søge-/kodebenchmarks rangerer Seed1.8 ofte tæt på eller over konkurrerende pro-modeller

Seed 1.8 vs Gemini 3 Pro / GPT-5.x

Seed1.8 vs Seed-1.5-VL / Seed-1.6: Klare forbedringer i multimodal perception, tokeneffektivitet for lange videoer og agentisk eksekvering.
Seed1.8 vs Gemini 3 Pro / GPT-5.x: På mange multimodale benchmarks matcher eller overgår Seed1.8 Gemini 3 Pro (SOTA på flere VQA-/bevægelsesopgaver; bedre på MMLB-NIAH 128k-kørsel). Kortet viser dog også områder, hvor Gemini-familien bevarer fordele på visse fagspecifikke videnopgaver — så den relative rangordning afhænger af benchmark.
Seed-Code-variant (Doubao-Seed-Code): specialiseret til programmering/agentiske kodeopgaver (stor kontekst til kodebaser; specialiserede SWE-benchmarks). Seed1.8 er den generalistiske agentiske multimodale model, mens Seed-Code er den programmeringsfokuserede variant.

Praktiske use cases for Seedream 4.5 API på CometAPI

Multimodale forskningsassistenter og dokumentanalyse: udtræk, opsummer og ræsonnér på tværs af lange dokumenter, præsentationer og flersidede rapporter.
Forståelse og overvågning af lange videoer: analyse af sikkerhed/sportsudsendelser, opsummering af lange møder og streaminganalyse, hvor modellens long-video-tokeneffektivitet er vigtig.
Agentiske workflows / automatisering: scenarier med flertrins websøgning + kodeeksekvering + dataudtræk (f.eks. automatiseret konkurrentanalyse, rejseplanlægning, forskningspipelines demonstreret i interne benchmarks).
Udviklerværktøjer (hvis du bruger Seed-Code): analyse af store kodebaser, IDE-assistenter og agentisk kodeeksekvering til test og reparation (Seed-Code er den anbefalede specialiserede variant).
GUI-automatisering og RPA: screen grounding og GUI-agentbenchmarks indikerer, at modellen kan udføre strukturerede GUI-opgaver bedre end tidligere Seed-udgivelser.

Sådan bruger du doubao Seed 1.8 API via CometAPI

Trin 1: Tilmeld dig for at få en API-nøgle

Trin 2: Send forespørgsler til doubao Seed 1.8 API

Indsæt dit spørgsmål eller din anmodning i content-feltet — det er dette, modellen vil svare på. Behandl API-responsen for at få det genererede svar.

Trin 3: Hent og verificer resultater

Behandl API-responsen for at få det genererede svar. Efter behandlingen svarer API’et med opgavestatus og outputdata.

Doubao-Seed-1.8

More Models

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

Related Blog

How to Use Doubao Seed 1.8 API? A Comprehensive Guide

Doubao-Seed-1.8

More Models

Claude Opus 4.6

Claude Sonnet 4.6

GPT-5.4 nano

GPT-5.4 mini

Claude Mythos Preview

Claude Mythos Preview

mimo-v2-pro

Related Blog

How to Use Doubao Seed 1.8 API? A Comprehensive Guide