ModellerSupportVirksomhedBlog
500+ AI Model API, Alt I Én API. Kun I CometAPI
Modeller API
Udvikler
Hurtig StartDokumentationAPI Dashboard
Ressourcer
AI-modellerBlogVirksomhedÆndringslogOm os
2025 CometAPI. Alle rettigheder forbeholdes.PrivatlivspolitikServicevilkår
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

Indtast:$0.2/M
Output:$1.6/M
Kontekst:256k
Maks Output:224k
Doubao-Seed-1.8 er optimeret til multimodale agentscenarier. Hvad angår agentens kapabiliteter, er anvendelse af værktøjer og efterlevelse af komplekse kommandoer blevet væsentligt forbedret. Hvad angår multimodal forståelse, er de grundlæggende visuelle evner blevet væsentligt forbedret, så ekstremt lange videoer kan forstås selv ved lav billedfrekvens. Forståelse af bevægelser i video, kompleks rumlig forståelse og mulighederne for parsning af dokumentstrukturer er også blevet optimeret, og intelligent konteksthåndtering understøttes nu nativt, hvilket gør det muligt for brugere at konfigurere kontekststrategier.
Ny
Kommersiel brug
Playground
Oversigt
Funktioner
Priser
API

Tekniske specifikationer for Seed 1.8 API

ItemSpecifikation / note
Model name / familyDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Modalities supportedTekst, billeder, video (multimodale VLM-kapaciteter), lydværktøjer i økosystemet (separate modeller til lyd-/videogenerering).
Context window (text)256K tokens
Video / visual capacityDesignet til long-video-reasoning, understøtter effektiv visuel kodning og store video-token-budgetter (modelkortet rapporterer video-token-eksperimenter og long-video-benchmarks).
Input formatsFritekstprompter; billeduploads (skærmbilleder, diagrammer, fotos); video som tokeniserede frames / videoværktøjer til segmentinspektion; filuploads (dokumenter).
Output formatsNaturligt sprog, strukturerede outputs (structured-output beta), funktionskald / værktøjskald, kode og multimodale outputs via orkestrering.
Thinking / inference modesno_think, think-low, think-medium, think-high — afvejer nøjagtighed mod latenstid/omkostninger.

Hvad er Doubao Seed 1.8?

Doubao Seed 1.8 er Seed-teamets 1.8-udgivelse: en samlet LLM+VLM, der eksplicit sigter mod generalized real-world agency — dvs. perception (billeder/video), ræsonnering, værktøjsorkestrering (søgning, funktionskald, kodeeksekvering, GUI-grounding) og flertrinsbeslutningstagning i én enkelt model. Designet lægger vægt på konfigurerbare “thinking modes” (afvejninger mellem latenstid og dybde), effektiv visuel kodning og indbygget understøttelse af lang kontekst og multimodale input, så modellen kan fungere som en autonom assistent/agent i produktionsworkflows.

Hovedfunktioner i Seed 1.8 API

  1. Samlet multimodal agentisk model. Integrerer perception (billede/video), ræsonnering (LLM) og handling (værktøjs-/G U I-kald, kodeeksekvering) i en enkelt model i stedet for en opdelt pipeline. Dette muliggør kompakte agent-workflows og lavere orkestreringskompleksitet.
  2. Ultralang kontekst og håndtering af lange videoer. Lang kontekst (produktsupport op til 256k tokens) og specifikke long-video-benchmarks (Seed1.8 viser stærk long-video-tokeneffektivitet). Modellen understøtter selektive videoværktøjer (VideoCut) til at fokusere ræsonnering på tidsstempler.
  3. Agentisk GUI-automatisering og værktøjsbrug. Benchmarks og interne tests (OSWorld, AndroidWorld, LiveCodeBench, GUI-grounding-benchmarks) viser forbedringer i GUI-agentopgaver og flertrinsautomatisering. Modellen kan outputte GUI-grounding-kommandoer og operere i simulerede OS-/web-/mobilkontekster.
  4. Konfigurerbare thinking modes til styring af latenstid/omkostninger. Fire inferenstilstande lader udviklere justere compute ved testtid til interaktive opgaver versus batchopgaver af høj kvalitet. Dette er nyttigt for produktionssystemer med stramme latenstidsbudgetter.
  5. Forbedret tokeneffektivitet (multimodal). Seed 1.8 demonstrerer stærkere tokeneffektivitet på multimodale benchmarks sammenlignet med sine forgængere (Seed-1.5/1.6-serien) og opnår høj nøjagtighed med mindre tokenbudgetter i flere long-video-opgaver.
  6. Konfigurerbare thinking modes: afvej inferensdybde mod latenstid/omkostninger med forskellige tilstande (no_think → think-high) for at tilpasse interaktiv brug i produktion.
  7. Tekniske kapaciteter
  • Tokeneffektivitet: Seed1.8 viser markant tokeneffektivitet i forhold til forgængere (Seed-1.5/1.6) og leverer stærkere nøjagtighed ved lavere tokenbudgetter på lange videoopgaver (f.eks. ved at opnå konkurrencedygtig nøjagtighed selv ved 32K videotokens). Dette muliggør lavere inferensomkostninger for lange input.
  • Multimodal ræsonnering og perception: Modellen når SOTA på flere multi-image-VQA- og bevægelses-/perceptionsopgaver og opnår andenplads eller nær-SOTA på mange multimodale ræsonneringsbenchmarks; specifikt overgår den sin forgænger på næsten alle målte visuelle/video-dimensioner.
  • Agentisk værktøjsbrug og GUI-grounding: Dokumenteret understøttelse af GUI-grounding og skærmbaserede operationsbenchmarks (ScreenSpot-Pro, GUI agenting) med stærke grounding-scorer (f.eks. forbedringer i forhold til Seed-1.5-VL på ScreenSpot-Pro).
  • Parallel / trinvist ræsonnering: Øget compute ved testtid (parallel thinking) giver målbare gevinster på benchmarks for matematik, kodning og multimodal ræsonnering

Udvalgte offentlige benchmark-højdepunkter for Seed1.8

  • VCRBench (visual commonsense reasoning): Seed1.8 scorede 59.8 (Pass@1 rapporteret i modelkorttabellen), en forbedring i forhold til Seed-1.5-VL og konkurrencedygtig med topmodeller
  • VideoHolmes (videoræsonnering): Seed1.8 65.5, overgår Seed-1.5-VL og nærmer sig professionelle konkurrerende modeller.
  • MMLB-NIAH (multimodal lang kontekst, 128k): Seed1.8 opnåede 72.2 Pass@1 ved 128k kontekst i MMLB-NIAH og overgik nogle samtidige pro-modeller.
  • Motion & Perception suite: SOTA i 5 ud af 6 evaluerede opgaver; eksempler inkluderer TVBench, TempCompass og TOMATO, hvor Seed1.8 viser betydelige fremskridt i temporal perception.
  • Agentiske workflows: På BrowseComp og andre agentiske søge-/kodebenchmarks rangerer Seed1.8 ofte tæt på eller over konkurrerende pro-modeller

Seed 1.8 vs Gemini 3 Pro / GPT-5.x

  • Seed1.8 vs Seed-1.5-VL / Seed-1.6: Klare forbedringer i multimodal perception, tokeneffektivitet for lange videoer og agentisk eksekvering.
  • Seed1.8 vs Gemini 3 Pro / GPT-5.x: På mange multimodale benchmarks matcher eller overgår Seed1.8 Gemini 3 Pro (SOTA på flere VQA-/bevægelsesopgaver; bedre på MMLB-NIAH 128k-kørsel). Kortet viser dog også områder, hvor Gemini-familien bevarer fordele på visse fagspecifikke videnopgaver — så den relative rangordning afhænger af benchmark.
  • Seed-Code-variant (Doubao-Seed-Code): specialiseret til programmering/agentiske kodeopgaver (stor kontekst til kodebaser; specialiserede SWE-benchmarks). Seed1.8 er den generalistiske agentiske multimodale model, mens Seed-Code er den programmeringsfokuserede variant.

Praktiske use cases for Seedream 4.5 API på CometAPI

  • Multimodale forskningsassistenter og dokumentanalyse: udtræk, opsummer og ræsonnér på tværs af lange dokumenter, præsentationer og flersidede rapporter.
  • Forståelse og overvågning af lange videoer: analyse af sikkerhed/sportsudsendelser, opsummering af lange møder og streaminganalyse, hvor modellens long-video-tokeneffektivitet er vigtig.
  • Agentiske workflows / automatisering: scenarier med flertrins websøgning + kodeeksekvering + dataudtræk (f.eks. automatiseret konkurrentanalyse, rejseplanlægning, forskningspipelines demonstreret i interne benchmarks).
  • Udviklerværktøjer (hvis du bruger Seed-Code): analyse af store kodebaser, IDE-assistenter og agentisk kodeeksekvering til test og reparation (Seed-Code er den anbefalede specialiserede variant).
  • GUI-automatisering og RPA: screen grounding og GUI-agentbenchmarks indikerer, at modellen kan udføre strukturerede GUI-opgaver bedre end tidligere Seed-udgivelser.

Sådan bruger du doubao Seed 1.8 API via CometAPI

Doubao seed1.8 udbydes nu kommercielt via CometAPI som en hostet inferens-API. API’et understøtter multimodale payloads (tekst + billeder + videofragmenter / tidsstempler) og konfigurerbare inferenstilstande for at afveje latenstid og compute mod svarkvalitet.

Kaldemønstre: API’et understøtter standard chat-/completion-lignende forespørgsler, streamingsvar og agentiske flows, hvor modellen udsteder værktøjskald (søgning, kodeeksekvering, GUI-handlinger) og indlæser værktøjsoutput som efterfølgende kontekst.

Streaming og håndtering af lang kontekst: API’et understøtter streaming og har indbyggede context management-primitiver til lange sessioner (for at muliggøre 100K+ kontekster / flertrins agentspor).

Trin 1: Tilmeld dig for at få en API-nøgle

Log ind på cometapi.com. Hvis du endnu ikke er bruger hos os, skal du først registrere dig. Log ind på din CometAPI-konsol. Hent adgangsoplysningerne i form af API-nøglen til interfacet. Klik på “Add Token” under API-token i det personlige center, hent token-nøglen: sk-xxxxx, og indsend.

Trin 2: Send forespørgsler til doubao Seed 1.8 API

Vælg endpointet “doubao-seed-1-8-251228 ” for at sende API-forespørgslen og angive request body. Request method og request body findes i API-dokumentationen på vores website. Vores website tilbyder også Apifox-test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto. Kompatibilitet med Chat-API’erne.

Indsæt dit spørgsmål eller din anmodning i content-feltet — det er dette, modellen vil svare på. Behandl API-responsen for at få det genererede svar.

Trin 3: Hent og verificer resultater

Behandl API-responsen for at få det genererede svar. Efter behandlingen svarer API’et med opgavestatus og outputdata.

FAQ

What variants exist of Seed 1.8 and when to use each?

Seed1.8 er den generalistiske multimodale agent. Relaterede varianter omfatter: Seed-Code / Doubao-Seed-Code: specialiseret til meget store kodekontekster (nogle SKU'er angiver 256K-kontekster) og kodningsarbejdsgange. Seedance / Seedream: specialiserede varianter til medier/generering (video-/billedgenerering). Vælg Seed-Code til IDE-/kodebaseopgaver; vælg Seed1.8 til brede multimodale agentopgaver. Bekræft SKU-kontekstvinduer og funktioner i produktdokumentationen.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 lægger vægt på agentisk integration (værktøjsbrug, GUI-agenting, flertrinsarbejdsgange), forbedret håndtering af lang kontekst og bedre opfattelse af lange videoer/bevægelser sammenlignet med tidligere Seed 1.x-modeller. Det er positioneret som den multimodale/agentiske opgradering i Seed-linjen.

What input/output modalities does Seed1.8 support?

Indbygget multimodal understøttelse: tekst + billeder + video. Output omfatter svar i naturligt sprog, strukturerede output (JSON/handlingsplaner), kode og henvisninger til visuelle segmenter/tidsstempler til agentiske arbejdsgange. Modellen er eksplicit designet til multimodal perception → ræsonnering → handling.

What are the “thinking” or inference modes of Seed1.8?

Der findes justerbare “thinking”-tilstande — designet til at afveje latenstid/beregning mod ræsonneringsdybde (nyttigt, når du skal balancere interaktivitet mod løsningskvalitet). Brug tilstandene til at justere til interaktive brugergrænseflader eller dybere batch-ræsonnering.

Funktioner til Doubao-Seed-1.8

Udforsk de vigtigste funktioner i Doubao-Seed-1.8, designet til at forbedre ydeevne og brugervenlighed. Opdag hvordan disse muligheder kan gavne dine projekter og forbedre brugeroplevelsen.

Priser for Doubao-Seed-1.8

Udforsk konkurrencedygtige priser for Doubao-Seed-1.8, designet til at passe til forskellige budgetter og brugsbehov. Vores fleksible planer sikrer, at du kun betaler for det, du bruger, hvilket gør det nemt at skalere, efterhånden som dine krav vokser. Opdag hvordan Doubao-Seed-1.8 kan forbedre dine projekter, mens omkostningerne holdes håndterbare.
Comet-pris (USD / M Tokens)Officiel Pris (USD / M Tokens)Rabat
Indtast:$0.2/M
Output:$1.6/M
Indtast:$0.25/M
Output:$2/M
-20%

Eksempelkode og API til Doubao-Seed-1.8

Doubao seed1.8 er nu kommercielt tilgængelig via CometAPI som en hostet inferens-API. API'et understøtter multimodale payloads (tekst + billeder + videofragmenter/tidsstempler) og konfigurerbare inferenstilstande for at afveje latenstid og beregning mod svartkvalitet.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

Flere modeller

A

Claude Opus 4.6

Indtast:$4/M
Output:$20/M
Claude Opus 4.6 er Anthropic’s "Opus"-klasse store sprogmodel, lanceret i februar 2026. Den er positioneret som en arbejdshest til vidensarbejde og forskningsarbejdsgange — med forbedret langkontekstuel ræsonnering, flertrinsplanlægning, brug af værktøjer (herunder agent-baserede softwarearbejdsgange) og computeropgaver såsom automatiseret generering af slides og regneark.
A

Claude Sonnet 4.6

Indtast:$2.4/M
Output:$12/M
Claude Sonnet 4.6 er vores hidtil mest kapable Sonnet-model. Det er en fuld opgradering af modellens færdigheder på tværs af kodning, computerbrug, langkontekstlig ræsonnering, agentplanlægning, vidensarbejde og design. Sonnet 4.6 har også et kontekstvindue på 1M tokens i beta.
O

GPT-5.4 nano

Indtast:$0.16/M
Output:$1/M
GPT-5.4 nano er designet til opgaver, hvor hastighed og omkostninger er vigtigst, såsom klassificering, dataudtræk, rangering og subagenter.
O

GPT-5.4 mini

Indtast:$0.6/M
Output:$3.6/M
GPT-5.4 mini samler styrkerne fra GPT-5.4 i en hurtigere og mere effektiv model, der er designet til arbejdsbelastninger i stor skala.
A

Claude Mythos Preview

A

Claude Mythos Preview

Kommer snart
Indtast:$60/M
Output:$240/M
Claude Mythos Preview er vores hidtil mest kapable frontier-model og viser et markant spring i resultaterne på tværs af mange benchmark-tests sammenlignet med vores tidligere frontier-model, Claude Opus 4.6.
X

mimo-v2-pro

Indtast:$0.8/M
Output:$2.4/M
MiMo-V2-Pro er Xiaomis flagskibs-grundmodel med over 1T samlede parametre og en kontekstlængde på 1M, dybt optimeret til agentbaserede scenarier. Den er meget tilpasningsdygtig til generelle agent-rammeværk som OpenClaw. Den placerer sig blandt den globale top i de standardiserede PinchBench- og ClawBench-benchmarks, med en oplevet ydeevne, der nærmer sig Opus 4.6. MiMo-V2-Pro er designet til at fungere som hjernen i agent-systemer, orkestrere komplekse arbejdsgange, håndtere produktionsingeniøropgaver og levere pålidelige resultater.

Relaterede blogs

Sådan bruger du Doubao Seed 1.8 API? En omfattende guide
Jan 12, 2026

Sådan bruger du Doubao Seed 1.8 API? En omfattende guide

Doubao Seed 1.8 — en del af ByteDance’s Doubao-familie og Seed-forskningslinjen — tiltrækker opmærksomhed for at være udviklet som en “agentic” multimodal model med et meget stort kontekstvindue og forbedret værktøjs-/agentunderstøttelse.