ModelSokonganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Sumber
Model AIBlogPerusahaanLog PerubahanTentang
2025 CometAPI. Hak cipta terpelihara.Dasar PrivasiTerma Perkhidmatan
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

Masukan:$0.2/M
Keluaran:$1.6/M
Konteks:256k
Keluaran Maksimum:224k
Doubao-Seed-1.8 dioptimumkan untuk senario agen multimodal. Dari segi keupayaan agen, penggunaan alat dan pematuhan arahan kompleks telah dipertingkat dengan ketara. Berkenaan pemahaman multimodal, keupayaan visual asas telah dipertingkat dengan ketara, membolehkan pemahaman pada kadar bingkai rendah bagi video yang sangat panjang. Keupayaan pemahaman gerakan video, pemahaman ruang yang kompleks, dan penghuraian struktur dokumen juga telah dioptimumkan, dan pengurusan konteks pintar kini disokong secara natif, membolehkan pengguna menetapkan strategi konteks.
Baru
Penggunaan komersial
Playground
Gambaran Keseluruhan
Ciri-ciri
Harga
API

Spesifikasi teknikal bagi Seed 1.8 API

PerkaraSpesifikasi / nota
Nama model / keluargaDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
Modaliti yang disokongTeks, imej, video (keupayaan VLM multimodal), alatan audio dalam ekosistem (model berasingan untuk penjanaan audio/video).
Tetingkap konteks (teks)256K tokens
Kebolehan video / visualDireka untuk penaakulan video panjang, menyokong pengekodan visual yang cekap dan bajet token video yang besar (kad model melaporkan eksperimen token video dan penanda aras video panjang).
Format inputPrompt teks bebas; muat naik imej (tangkapan skrin, carta, foto); video sebagai bingkai ditokenkan / alatan video untuk pemeriksaan segmen; muat naik fail (dokumen).
Format outputTeks bahasa semula jadi, output berstruktur (structured-output beta), panggilan fungsi / panggilan alat, kod, dan output multimodal melalui pengorkestran.
Mod pemikiran / inferensno_think, think-low, think-medium, think-high — mengimbangi ketepatan berbanding latensi/kos.

Apakah Doubao Seed 1.8?

Doubao Seed 1.8 ialah keluaran 1.8 pasukan Seed: LLM+VLM bersatu yang menyasarkan secara eksplisit agensi dunia sebenar yang digeneralisasi — iaitu persepsi (imej/video), penaakulan, pengorkestran alat (carian, panggilan fungsi, pelaksanaan kod, GUI grounding) dan pembuatan keputusan berbilang langkah dalam satu model. Reka bentuk menekankan mod “pemikiran” boleh dikonfigurasi (pertukaran antara latensi dan kedalaman), pengekodan visual yang cekap dan sokongan asli untuk konteks panjang serta input multimodal supaya model boleh beroperasi sebagai pembantu/agen autonomi dalam aliran kerja produksi.

Ciri utama Seed 1.8 API

  1. Model agen multimodal bersepadu. Mengintegrasikan persepsi (imej/video), penaakulan (LLM), dan tindakan (panggilan alat/G U I, pelaksanaan kod) dalam satu model dan bukannya paip berpecah. Ini membolehkan aliran kerja agen yang padat dan kerumitan pengorkestran yang lebih rendah.
  2. Konteks ultra-panjang & pengendalian video panjang. Konteks panjang (sokongan produk sehingga 256k token) dan penanda aras video panjang khusus (Seed1.8 menunjukkan kecekapan token video panjang yang kukuh). Model menyokong alatan video terpilih (VideoCut) untuk memfokuskan penaakulan pada cap masa.
  3. Automasi GUI berasaskan agen & penggunaan alat. Penanda aras dan ujian dalaman (OSWorld, AndroidWorld, LiveCodeBench, penanda aras GUI grounding) menunjukkan penambahbaikan dalam tugasan agen GUI dan automasi berbilang langkah. Model boleh mengeluarkan perintah GUI grounding dan beroperasi dalam konteks OS/web/telefon pintar yang disimulasikan.
  4. Mod pemikiran boleh dikonfigurasi untuk kawalan latensi/kos. Empat mod inferens membolehkan pembangun melaras pengiraan pada masa ujian untuk tugasan interaktif vs. kelompok berkualiti tinggi. Ini berguna untuk sistem produksi dengan bajet latensi yang ketat.
  5. Kecekapan token bertambah baik (multimodal). Seed 1.8 menunjukkan kecekapan token yang lebih kuat pada penanda aras multimodal berbanding pendahulunya (siri Seed-1.5/1.6), mencapai ketepatan tinggi dengan bajet token lebih kecil dalam beberapa tugasan video panjang.
  6. Mod pemikiran boleh dikonfigurasi: pertukaran kedalaman inferens vs latensi/kos dengan mod berbeza (no_think → think-high) untuk ditala bagi kegunaan produksi interaktif.
  7. Keupayaan teknikal
  • Kecekapan token: Seed1.8 menunjukkan kecekapan token yang ketara berbanding pendahulu (Seed-1.5/1.6), memberikan ketepatan lebih kuat pada bajet token lebih rendah dalam tugasan video panjang (cth., mencapai ketepatan kompetitif walaupun pada 32K token video). Ini membolehkan kos inferens lebih rendah untuk input panjang.
  • Penaakulan & persepsi multimodal: Model mencapai SOTA pada beberapa tugasan VQA multi-imej dan tugasan gerakan/persepsi serta memperoleh tempat kedua atau hampir SOTA pada banyak penanda aras penaakulan multimodal; khususnya ia mengatasi pendahulunya pada hampir setiap dimensi visual/video yang diukur.
  • Penggunaan alat berasaskan agen & GUI grounding: Sokongan didokumenkan untuk GUI grounding dan penanda aras operasi berasaskan skrin (ScreenSpot-Pro, GUI agenting) dengan skor grounding yang kukuh (cth., penambahbaikan berbanding Seed-1.5-VL pada ScreenSpot-Pro).
  • Penaakulan selari / berperingkat: Meningkatkan pengiraan masa ujian (pemikiran selari) menghasilkan peningkatan yang boleh diukur pada penanda aras matematik, pengaturcaraan, dan penaakulan multimodal

Sorotan penanda aras awam terpilih Seed1.8

  • VCRBench (penaakulan pengetahuan am visual): Seed1.8 memperoleh 59.8 (Pass@1 dilaporkan dalam jadual kad model), peningkatan berbanding Seed-1.5-VL dan kompetitif dengan model teratas
  • VideoHolmes (penaakulan video): Seed1.8 65.5, mengatasi Seed-1.5-VL dan menghampiri model pesaing gred pro.
  • MMLB-NIAH (konteks panjang multimodal, 128k): Seed1.8 mencapai 72.2 Pass@1 pada konteks 128k dalam MMLB-NIAH, mengatasi sesetengah model pro kontemporari.
  • Sut Gerakan & Persepsi: SOTA dalam 5 daripada 6 tugasan yang dinilai; contoh termasuk TVBench, TempCompass dan TOMATO di mana Seed1.8 menunjukkan peningkatan besar dalam persepsi temporal.
  • Aliran kerja berasaskan agen: Pada BrowseComp dan penanda aras carian/kod berasaskan agen yang lain, Seed1.8 sering berada hampir atau melebihi model pro yang bersaing

Seed 1.8 vs Gemini 3 Pro / GPT-5.x

  • Seed1.8 vs Seed-1.5-VL / Seed-1.6: Peningkatan yang jelas dalam persepsi multimodal, kecekapan token untuk video panjang, dan pelaksanaan berasaskan agen.
  • Seed1.8 vs Gemini 3 Pro / GPT-5.x: Pada banyak penanda aras multimodal Seed1.8 menyamai atau mengatasi Gemini 3 Pro (SOTA pada beberapa tugasan VQA / gerakan; lebih baik pada larian MMLB-NIAH 128k). Walau bagaimanapun, kad juga menunjukkan bidang di mana model keluarga Gemini mengekalkan kelebihan pada sesetengah tugasan ilmu disiplin — jadi susunan relatif adalah bergantung pada penanda aras.
  • Varian Seed-Code (Doubao-Seed-Code): khusus untuk tugasan pengaturcaraan/agen kod (konteks besar untuk pangkalan kod; penanda aras SWE khusus). Seed1.8 ialah model multimodal berasaskan agen generalis, manakala Seed-Code ialah varian yang memfokuskan pengaturcaraan.

Kes penggunaan praktikal oleh Seedream 4.5 API di CometAPI

  • Pembantu penyelidikan multimodal & analisis dokumen: mengekstrak, merumus, dan berfikir merentas dokumen panjang, dek slaid, dan laporan berbilang halaman.
  • Pemahaman & pemantauan video panjang: analitik penyiaran keselamatan/sukan, peringkasan mesyuarat panjang, dan analisis penstriman di mana kecekapan token video panjang model penting.
  • Aliran kerja berasaskan agen / automasi: senario berbilang langkah carian web + pelaksanaan kod + pengekstrakan data (cth., analisis pesaing automatik, perancangan perjalanan, saluran penyelidikan yang ditunjukkan dalam penanda aras dalaman).
  • Alatan pembangun (jika menggunakan Seed-Code): analisis pangkalan kod besar, pembantu IDE, dan pelaksanaan kod berasaskan agen untuk pengujian & pembaikan (Seed-Code ialah varian khusus yang disyorkan).
  • Automasi GUI & RPA: penanda aras pembumian skrin dan agen GUI menunjukkan model boleh melakukan tugas GUI berstruktur lebih baik daripada keluaran Seed sebelumnya.

Cara Menggunakan doubao Seed 1.8 API melalui CometAPI

Doubao seed1.8 kini didedahkan secara komersial melalui CometAPI sebagai API inferens hos. API menyokong payload multimodal (teks + imej + serpihan video / cap masa) dan mod inferens boleh dikonfigurasi untuk mengimbangi latensi dan pengiraan terhadap kualiti jawapan.

Corak panggilan: API menyokong permintaan gaya chat/penyempurnaan standard, respons penstriman, dan aliran berasaskan agen di mana model mengeluarkan panggilan alat (carian, pelaksanaan kod, tindakan GUI) dan mengambil output alat sebagai konteks susulan.

Penstriman & pengendalian konteks panjang: API menyokong penstriman dan mempunyai primitif pengurusan konteks terbina dalam untuk sesi panjang (untuk membolehkan konteks 100K+ / jejak agen berbilang langkah).

Langkah 1: Daftar untuk Kunci API

Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu. Log masuk ke CometAPI console. Dapatkan kunci API kelayakan akses bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan hantar.

Langkah 2: Hantar Permintaan ke doubao Seed 1.8 API

Pilih endpoint “doubao-seed-1-8-251228” untuk menghantar permintaan API dan tetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API laman web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. Gantikan <YOUR_API_KEY> dengan kunci CometAPI sebenar anda daripada akaun anda. Keserasian dengan Chat API.

Masukkan soalan atau permintaan anda ke dalam medan kandungan — inilah yang akan dijawab oleh model. Proses respons API untuk mendapatkan jawapan yang dihasilkan.

Langkah 3: Dapatkan dan Sahkan Hasil

Proses respons API untuk mendapatkan jawapan yang dihasilkan. Selepas pemprosesan, API membalas dengan status tugasan dan data output.

Soalan Lazim

What variants exist of Seed 1.8 and when to use each?

Seed1.8 ialah agen multimodal umum. Varian berkaitan termasuk: Seed-Code / Doubao-Seed-Code: khusus untuk konteks kod yang sangat besar (sesetengah SKU mendakwa konteks 256K) dan aliran kerja pengekodan. Seedance / Seedream: varian khusus media/penjanaan (penjanaan video/imej). Pilih Seed-Code untuk tugasan IDE/pangkalan kod; pilih Seed1.8 untuk tugasan agen multimodal yang luas. Sahkan tetingkap konteks SKU dan keupayaan dalam dokumentasi produk.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 menekankan integrasi berasaskan agen (penggunaan alat, agen GUI, aliran kerja berbilang langkah), pengendalian konteks panjang yang dipertingkat dan persepsi video panjang/pergerakan yang lebih baik berbanding model Seed 1.x terdahulu. Ia diposisikan sebagai penaiktarafan multimodal/agen dalam siri Seed.

What input/output modalities does Seed1.8 support?

Sokongan multimodal asli: teks + imej + video. Output merangkumi jawapan bahasa semula jadi, output berstruktur (JSON/pelan tindakan), kod dan rujukan kepada segmen visual/cap masa untuk aliran kerja beragensi. Model ini direka secara eksplisit untuk persepsi multimodal → penaakulan → tindakan.

What are the “thinking” or inference modes of Seed1.8?

Terdapat mod “pemikiran” yang boleh dilaras — direka untuk mengimbangi latensi/komputasi dengan kedalaman penaakulan (berguna apabila anda perlu mengimbangi interaktiviti dengan kualiti penyelesaian). Gunakan mod tersebut untuk melaras bagi UI interaktif atau penaakulan kelompok yang lebih mendalam.

Ciri-ciri untuk Doubao-Seed-1.8

Terokai ciri-ciri utama Doubao-Seed-1.8, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Doubao-Seed-1.8

Terokai harga yang kompetitif untuk Doubao-Seed-1.8, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Doubao-Seed-1.8 boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)Diskaun
Masukan:$0.2/M
Keluaran:$1.6/M
Masukan:$0.25/M
Keluaran:$2/M
-20%

Kod contoh dan API untuk Doubao-Seed-1.8

Doubao seed1.8 kini tersedia secara komersial melalui CometAPI sebagai API inferens terhos. API ini menyokong muatan multimodal (teks + imej + fragmen video / cap masa) serta mod inferens yang boleh dikonfigurasi untuk mengimbangi latensi dan sumber komputasi dengan kualiti jawapan.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

Lebih Banyak Model

A

Claude Opus 4.6

Masukan:$4/M
Keluaran:$20/M
Claude Opus 4.6 ialah model bahasa besar kelas “Opus” oleh Anthropic, dikeluarkan pada Februari 2026. Ia diposisikan sebagai tulang belakang untuk kerja berpengetahuan dan aliran kerja penyelidikan — menambah baik penaakulan berkonteks panjang, perancangan berbilang langkah, penggunaan alat (termasuk aliran kerja perisian berasaskan ejen), dan tugas penggunaan komputer seperti penjanaan slaid dan hamparan automatik.
A

Claude Sonnet 4.6

Masukan:$2.4/M
Keluaran:$12/M
Claude Sonnet 4.6 ialah model Sonnet kami yang paling berkeupayaan setakat ini. Ia merupakan peningkatan menyeluruh terhadap kemahiran model yang meliputi pengaturcaraan, penggunaan komputer, penaakulan konteks panjang, perancangan agen, kerja berasaskan pengetahuan, dan reka bentuk. Sonnet 4.6 turut menampilkan tetingkap konteks 1M token dalam beta.
O

GPT-5.4 nano

Masukan:$0.16/M
Keluaran:$1/M
GPT-5.4 nano direka untuk tugasan yang amat mengutamakan kelajuan dan kos, seperti pengelasan, pengekstrakan data, pemeringkatan dan sub-agen.
O

GPT-5.4 mini

Masukan:$0.6/M
Keluaran:$3.6/M
GPT-5.4 mini membawa kekuatan GPT-5.4 ke dalam model yang lebih pantas dan lebih cekap, direka untuk beban kerja berskala besar.
A

Claude Mythos Preview

A

Claude Mythos Preview

Akan datang
Masukan:$60/M
Keluaran:$240/M
Claude Mythos Preview ialah model terdepan kami yang paling berkemampuan setakat ini, dan menunjukkan lonjakan yang ketara dalam skor pada banyak penanda aras penilaian berbanding model terdepan kami sebelum ini, Claude Opus 4.6.
X

mimo-v2-pro

Masukan:$0.8/M
Keluaran:$2.4/M
MiMo-V2-Pro ialah model asas perdana daripada Xiaomi, menampilkan lebih daripada 1T jumlah parameter dan panjang konteks 1M, yang dioptimumkan secara mendalam untuk senario berasaskan agen. Ia sangat mudah disesuaikan dengan rangka kerja agen umum seperti OpenClaw. Ia berada pada peringkat teratas global dalam penanda aras standard PinchBench dan ClawBench, dengan prestasi yang diperhatikan menghampiri Opus 4.6. MiMo-V2-Pro direka untuk berperanan sebagai otak sistem agen, menyelaras aliran kerja yang kompleks, memacu tugasan kejuruteraan pengeluaran, dan menyampaikan hasil secara boleh dipercayai.

Blog Berkaitan

Cara Menggunakan Doubao Seed 1.8 API?  Panduan Menyeluruh
Jan 12, 2026

Cara Menggunakan Doubao Seed 1.8 API? Panduan Menyeluruh

Doubao Seed 1.8 — sebahagian daripada keluarga Doubao milik ByteDance dan garis penyelidikan Seed — sedang menarik perhatian kerana direka bentuk sebagai model multimodal “agentic” dengan keupayaan pengendalian konteks yang sangat besar serta sokongan alat/ejen yang dipertingkat.