Seed 1.8 API'nin teknik özellikleri
| Öğe | Teknik özellik / not |
|---|---|
| Model adı / ailesi | Doubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine |
| Desteklenen modaliteler | Metin, görseller, video (çok modlu VLM yetenekleri), ekosistemde ses araçları (ses/video üretimi için ayrı modeller). |
| Bağlam penceresi (metin) | 256K token |
| Video / görsel kapasitesi | Uzun video muhakemesi için tasarlanmıştır; verimli görsel kodlamayı ve büyük video-token bütçelerini destekler (model kartı video token deneylerini ve uzun video benchmark'larını raporlar). |
| Girdi biçimleri | Serbest metin istemleri; görsel yüklemeleri (ekran görüntüleri, grafikler, fotoğraflar); video için tokenlaştırılmış kareler / segment incelemesi için video araçları; dosya yüklemeleri (belgeler). |
| Çıktı biçimleri | Doğal dil metni, yapılandırılmış çıktılar (structured-output beta), fonksiyon çağrıları / araç çağrıları, kod ve orkestrasyon aracılığıyla çok modlu çıktılar. |
| Düşünme / çıkarım modları | no_think, think-low, think-medium, think-high — doğruluk ile gecikme/maliyet arasında denge kurar. |
Doubao Seed 1.8 nedir?
Doubao Seed 1.8, Seed ekibinin 1.8 sürümüdür: algılamayı (görseller/video), muhakemeyi, araç orkestrasyonunu (arama, fonksiyon çağrıları, kod yürütme, GUI grounding) ve çok adımlı karar vermeyi tek bir model içinde açıkça hedefleyen birleşik bir LLM+VLM modelidir ve genelleştirilmiş gerçek dünya ajansını hedefler. Tasarım; yapılandırılabilir “düşünme modları”nı (gecikme ile derinlik arasındaki ödünleşimler), verimli görsel kodlamayı ve uzun bağlam ile çok modlu girdiler için yerel desteği vurgular; böylece model üretim iş akışlarında otonom bir asistan/ajan olarak çalışabilir.
Seed 1.8 API'nin başlıca özellikleri
- Birleşik çok modlu ajan modeli. Ayrık bir ardışık düzen yerine algılama (görsel/video), muhakeme (LLM) ve eylemi (araç/G U I çağrıları, kod yürütme) tek bir modelde birleştirir. Bu, daha kompakt ajan iş akışları ve daha düşük orkestrasyon karmaşıklığı sağlar.
- Ultra uzun bağlam ve uzun video işleme. Uzun bağlam (ürün desteği 256k token'a kadar) ve özel uzun video benchmark'ları (Seed1.8 güçlü uzun video token verimliliği gösterir). Model, muhakemeyi zaman damgalarına odaklamak için seçici video araçlarını (VideoCut) destekler.
- Ajanik GUI otomasyonu ve araç kullanımı. Benchmark'lar ve dahili testler (OSWorld, AndroidWorld, LiveCodeBench, GUI grounding benchmark'ları) GUI ajan görevlerinde ve çok adımlı otomasyonda iyileşmeler gösterir. Model GUI grounding komutları üretebilir ve simüle edilmiş OS/web/mobil bağlamlarında çalışabilir.
- Gecikme/maliyet kontrolü için yapılandırılabilir düşünme modları. Dört çıkarım modu, geliştiricilerin hesaplamayı test zamanında etkileşimli görevlere karşı yüksek kaliteli batch görevleri için ayarlamasına olanak tanır. Bu, sıkı gecikme bütçelerine sahip üretim sistemleri için kullanışlıdır.
- İyileştirilmiş token verimliliği (çok modlu). Seed 1.8, önceki sürümlerine (Seed-1.5/1.6 serisi) kıyasla çok modlu benchmark'larda daha güçlü token verimliliği gösterir ve birkaç uzun video görevinde daha küçük token bütçeleriyle yüksek doğruluk elde eder.
- Yapılandırılabilir düşünme modları: Etkileşimli üretim kullanımı için farklı modlarla (
no_think→think-high) çıkarım derinliği ile gecikme/maliyet arasında denge kurar. - Teknik yetenekler
- Token verimliliği: Seed1.8, önceki sürümlere (Seed-1.5/1.6) kıyasla belirgin token verimliliği gösterir ve uzun video görevlerinde daha düşük token bütçeleriyle daha güçlü doğruluk sunar (örneğin, 32K video token'da bile rekabetçi doğruluk elde eder). Bu, uzun girdiler için daha düşük çıkarım maliyeti sağlar.
- Çok modlu muhakeme ve algılama: Model, çeşitli çoklu görsel VQA ve hareket/algılama görevlerinde SOTA seviyesine ulaşır ve birçok çok modlu muhakeme benchmark'ında ikincilik veya SOTA'ya yakın sonuçlar elde eder; özellikle ölçülen neredeyse her görsel/video boyutunda selefini geride bırakır.
- Ajanik araç kullanımı ve GUI grounding: GUI grounding ve ekran tabanlı işlem benchmark'ları (ScreenSpot-Pro, GUI agenting) için güçlü grounding skorlarıyla belgelenmiş destek (ör. ScreenSpot-Pro'da Seed-1.5-VL'ye kıyasla iyileşmeler).
- Paralel / adımlı muhakeme: Test zamanı hesaplamasını artırmak (paralel düşünme), matematik, kodlama ve çok modlu muhakeme benchmark'larında ölçülebilir kazanımlar sağlar.
Seed1.8'in seçilmiş genel erişime açık benchmark öne çıkanları
- VCRBench (görsel sağduyu muhakemesi): Seed1.8, model kartı tablosunda raporlandığı üzere 59.8 (Pass@1) puanı aldı; bu, Seed-1.5-VL'ye göre bir iyileşme olup üst düzey modellerle rekabetçidir.
- VideoHolmes (video muhakemesi): Seed1.8 65.5 ile Seed-1.5-VL'yi geride bırakır ve profesyonel düzey rakip modellere yaklaşır.
- MMLB-NIAH (çok modlu uzun bağlam, 128k): Seed1.8, MMLB-NIAH'ta 128k bağlamda 72.2 Pass@1 elde ederek bazı çağdaş profesyonel modelleri geride bırakmıştır.
- Motion & Perception suite: Değerlendirilen 6 görevin 5'inde SOTA; örnekler arasında Seed1.8'in zamansal algılamada önemli kazanımlar gösterdiği TVBench, TempCompass ve TOMATO yer alır.
- Ajanik iş akışları: BrowseComp ve diğer ajanik arama/kod benchmark'larında Seed1.8 çoğu zaman rakip profesyonel modellerle aynı seviyede veya onların üstünde sıralanır.
Seed 1.8 ile Gemini 3 Pro / GPT-5.x karşılaştırması
- Seed1.8 ile Seed-1.5-VL / Seed-1.6 karşılaştırması: Çok modlu algılama, uzun videolar için token verimliliği ve ajanik yürütmede açık iyileşmeler.
- Seed1.8 ile Gemini 3 Pro / GPT-5.x karşılaştırması: Birçok çok modlu benchmark'ta Seed1.8, Gemini 3 Pro ile eşleşir veya onu aşar (çeşitli VQA / hareket görevlerinde SOTA; MMLB-NIAH 128k çalıştırmasında daha iyi). Ancak kart, Gemini ailesi modellerinin belirli disipliner bilgi görevlerinde avantajlarını koruduğu alanları da göstermektedir; bu nedenle göreli sıralama benchmark'a bağlıdır.
- Seed-Code varyantı (Doubao-Seed-Code): Programlama/ajanik kod görevleri için özelleştirilmiştir (kod tabanları için büyük bağlam; özelleşmiş SWE benchmark'ları). Seed1.8 genel amaçlı ajanik çok modlu modeldir; Seed-Code ise programlamaya odaklı varyanttır.
CometAPI üzerindeki Seedream 4.5 API için pratik kullanım senaryoları
- Çok modlu araştırma asistanları ve belge analizi: Uzun belgeler, slayt desteleri ve çok sayfalı raporlar üzerinden bilgi çıkarma, özetleme ve muhakeme.
- Uzun video anlama ve izleme: Güvenlik/spor yayını analitiği, uzun toplantı özetleme ve modelin uzun video token verimliliğinin önemli olduğu akış analizi.
- Ajanik iş akışları / otomasyon: Çok adımlı web araması + kod yürütme + veri çıkarma senaryoları (ör. otomatik rekabet analizi, seyahat planlama, dahili benchmark'larda gösterilen araştırma ardışık düzenleri).
- Geliştirici araçları (Seed-Code kullanılıyorsa): Büyük kod tabanı analizi, IDE asistanları ve test ile onarım için ajanik kod yürütme (önerilen özelleşmiş varyant Seed-Code'dur).
- GUI otomasyonu ve RPA: Ekran grounding ve GUI ajan benchmark'ları, modelin yapılandırılmış GUI görevlerini önceki Seed sürümlerinden daha iyi yerine getirebildiğini göstermektedir.
CometAPI üzerinden doubao Seed 1.8 API nasıl kullanılır
Doubao seed1.8 artık ticari olarak CometAPI üzerinden barındırılan bir çıkarım API'si olarak sunulmaktadır. API, çok modlu payload'ları (metin + görseller + video parçaları / zaman damgaları) ve yanıt kalitesine karşı gecikme ile hesaplamayı dengelemek için yapılandırılabilir çıkarım modlarını destekler.
Çağrı kalıpları: API, standart sohbet/tamamlama tarzı istekleri, akışlı yanıtları ve modelin araç çağrıları (arama, kod yürütme, GUI eylemleri) yaptığı ve araç çıktılarını sonraki bağlam olarak aldığı ajanik akışları destekler.
Akış ve uzun bağlam yönetimi: API, akışı destekler ve uzun oturumlar için yerleşik bağlam yönetimi ilkel öğelerine sahiptir (100K+ bağlamlar / çok adımlı ajan izleri sağlamak için).
1. Adım: API Key için kayıt olun
cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun. CometAPI konsolunuza giriş yapın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümündeki “Add Token” seçeneğine tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.
2. Adım: doubao Seed 1.8 API'ye istek gönderin
API isteğini göndermek ve istek gövdesini ayarlamak için “doubao-seed-1-8-251228 ”uç noktasını seçin. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. <YOUR_API_KEY> ifadesini hesabınızdaki gerçek CometAPI anahtarınızla değiştirin. Chat API'leriyle uyumludur.
Sorunuzu veya isteğinizi content alanına ekleyin — modelin yanıt vereceği kısım budur. Oluşturulan yanıtı almak için API yanıtını işleyin.
3. Adım: Sonuçları alın ve doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemeden sonra API, görev durumunu ve çıktı verilerini döndürür.
