النماذجالدعمالمؤسسةمدونة
أكثر من 500 واجهة برمجة تطبيقات لنماذج الذكاء الاصطناعي، الكل في واجهة واحدة. فقط في CometAPI
واجهة برمجة التطبيقات للنماذج
مطور
البدء السريعالتوثيقلوحة تحكم API
الموارد
نماذج الذكاء الاصطناعيمدونةالمؤسسةالسجل التاريخي للتغييراتحول
2025 CometAPI. جميع الحقوق محفوظة.سياسة الخصوصيةشروط الخدمة
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

مدخل:$0.2/M
الإخراج:$1.6/M
سياق:256k
الحد الأقصى للإخراج:224k
تم تحسين Doubao-Seed-1.8 لسيناريوهات الوكلاء متعددة الوسائط. وعلى صعيد قدرات الوكلاء، تم تعزيز استخدام الأدوات والامتثال للتعليمات المعقدة بشكل ملحوظ. وفيما يتعلق بالفهم متعدد الوسائط، تم تحسين القدرات البصرية الأساسية بشكل ملحوظ، بما يتيح فهم مقاطع فيديو طويلة للغاية بمعدل إطارات منخفض. كما تم تحسين فهم حركة الفيديو، والفهم المكاني المعقد، وقدرات تحليل بنية المستندات، وأصبحت إدارة السياق الذكية مدعومة أصلاً، مما يتيح للمستخدمين تكوين استراتيجيات السياق.
جديد
الاستخدام التجاري
Playground
نظرة عامة
الميزات
التسعير
API

المواصفات التقنية لواجهة برمجة تطبيقات Seed 1.8

البندالمواصفة / الملاحظة
اسم النموذج / الفئةDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
الأنماط المدعومةالنصوص، الصور، الفيديو (قدرات VLM متعددة الوسائط)، وأدوات الصوت ضمن المنظومة (نماذج منفصلة لتوليد الصوت/الفيديو).
نافذة السياق (النص)256K tokens
سعة الفيديو / الرؤيةمصمم للاستدلال على الفيديو الطويل، ويدعم ترميزًا بصريًا فعالًا وميزانيات كبيرة لرموز الفيديو (تعرض بطاقة النموذج تجارب على رموز الفيديو ومعايير أداء للفيديو الطويل).
تنسيقات الإدخالمطالبات نصية حرة؛ تحميل الصور (لقطات شاشة، مخططات، صور)؛ الفيديو على هيئة إطارات مُرمَّزة / أدوات فيديو لفحص المقاطع؛ تحميل الملفات (المستندات).
تنسيقات الإخراجنص بلغة طبيعية، ومخرجات منظَّمة (structured-output beta)، واستدعاءات دوال / أدوات، وكود، ومخرجات متعددة الوسائط عبر التنسيق.
أوضاع التفكير / الاستدلالno_think، think-low، think-medium، think-high — موازنة بين الدقة وزمن الاستجابة/التكلفة.

ما هو Doubao Seed 1.8؟

Doubao Seed 1.8 هو إصدار 1.8 من فريق Seed: نموذج موحّد LLM+VLM يستهدف بشكل صريح القدرة العامة على العمل في العالم الحقيقي — أي الإدراك (الصور/الفيديو)، والاستدلال، وتنسيق الأدوات (البحث، واستدعاءات الدوال، وتنفيذ الكود، والتموضع داخل واجهات المستخدم الرسومية) واتخاذ القرار متعدد الخطوات داخل نموذج واحد. يركّز التصميم على “أوضاع تفكير” قابلة للضبط (مفاضلة بين زمن الاستجابة وعمق المعالجة)، وترميز بصري فعّال، ودعم أصيل للسياق الطويل والمدخلات متعددة الوسائط بحيث يمكن للنموذج العمل كمساعد/وكيل ذاتي في مسارات العمل الإنتاجية.

الميزات الرئيسية لواجهة برمجة تطبيقات Seed 1.8

  1. نموذج وكيل متعدد الوسائط موحّد. يدمج الإدراك (الصور/الفيديو)، والاستدلال (LLM)، والتنفيذ (استدعاءات الأدوات/وواجهات المستخدم الرسومية، وتنفيذ الكود) في نموذج واحد بدلًا من خط معالجة منفصل. يتيح ذلك مسارات عمل وكيلية أكثر إحكامًا وتعقيدًا أقل في التنسيق.
  2. سياق فائق الطول ومعالجة الفيديو الطويل. سياق طويل (دعم المنتج حتى 256k token) ومعايير خاصة بالفيديو الطويل (يُظهر Seed1.8 كفاءة قوية في استخدام رموز الفيديو الطويلة). يدعم النموذج أدوات فيديو انتقائية (VideoCut) لتركيز الاستدلال على الطوابع الزمنية.
  3. أتمتة واجهات المستخدم الرسومية واستخدام الأدوات بطابع وكيلي. تُظهر المعايير والاختبارات الداخلية (OSWorld وAndroidWorld وLiveCodeBench ومعايير التموضع في واجهات المستخدم الرسومية) تحسنًا في مهام الوكلاء الرسومية والأتمتة متعددة الخطوات. يمكن للنموذج إخراج أوامر التموضع في الواجهة والعمل داخل بيئات نظام/ويب/هواتف محمولة محاكاة.
  4. أوضاع تفكير قابلة للضبط للتحكم في زمن الاستجابة/التكلفة. تتيح أربعة أوضاع استدلال للمطورين ضبط الحوسبة وقت الاختبار للمهام التفاعلية مقابل المهام الدفعية عالية الجودة. يفيد ذلك أنظمة الإنتاج ذات ميزانيات زمن استجابة صارمة.
  5. تحسين كفاءة الرموز (متعدد الوسائط). يبرهن Seed 1.8 على كفاءة أعلى في استخدام الرموز في معايير متعددة الوسائط مقارنةً بأسلافه (سلسلة Seed-1.5/1.6)، محققًا دقة عالية بميزانيات رموز أصغر في عدة مهام فيديو طويلة.
  6. أوضاع تفكير قابلة للضبط: الموازنة بين عمق الاستدلال وزمن الاستجابة/التكلفة عبر أوضاع مميزة (no_think → think-high) لضبطه للاستخدام الإنتاجي التفاعلي.
  7. القدرات التقنية
  • كفاءة الرموز: يُظهر Seed1.8 كفاءة واضحة في استخدام الرموز مقارنةً بالأسلاف (Seed-1.5/1.6)، مع تقديم دقة أقوى عند ميزانيات رموز أقل في مهام الفيديو الطويل (مثل تحقيق دقة تنافسية حتى عند 32K من رموز الفيديو). يتيح ذلك تكلفة استدلال أقل للمدخلات الطويلة.
  • الاستدلال والإدراك متعدد الوسائط: يحقق النموذج مستوى SOTA في عدة مهام VQA متعددة الصور ومهام الحركة/الإدراك، ويحصل على المركز الثاني أو قريبًا من SOTA في كثير من معايير الاستدلال متعدد الوسائط؛ وعلى وجه التحديد يتفوق على سابقه في كل بُعد بصري/فيديو تقريبًا تم قياسه.
  • استخدام الأدوات والتموضع في الواجهات بطابع وكيلي: دعم موثّق للتموضع في واجهات المستخدم والعمليات المعتمدة على الشاشة في المعايير (ScreenSpot-Pro، وعملاء GUI) مع درجات تموضع قوية (مثل التحسن مقارنةً بـ Seed-1.5-VL على ScreenSpot-Pro).
  • الاستدلال المتوازي / المرحلي: تؤدي زيادة الحوسبة وقت الاختبار (التفكير المتوازي) إلى مكاسب قابلة للقياس في معايير الرياضيات والبرمجة والاستدلال متعدد الوسائط

أبرز النتائج العامة المختارة لـ Seed1.8

  • VCRBench (الاستدلال البصري المنطقي العام): سجّل Seed1.8 59.8 (Pass@1 كما ورد في جدول بطاقة النموذج)، وهو تحسن مقارنةً بـ Seed-1.5-VL وتنافس مع أفضل النماذج
  • VideoHolmes (استدلال الفيديو): حقق Seed1.8 65.5، متفوقًا على Seed-1.5-VL ومقتربًا من نماذج منافسة بمستوى احترافي.
  • MMLB-NIAH (سياق طويل متعدد الوسائط، 128k): حقق Seed1.8 72.2 Pass@1 عند سياق 128k في MMLB-NIAH، متجاوزًا بعض النماذج الاحترافية المعاصرة.
  • مجموعة الحركة والإدراك: حقق مستوى SOTA في 5 من أصل 6 مهام مُقيَّمة؛ ومن الأمثلة TVBench وTempCompass وTOMATO حيث يُظهر Seed1.8 مكاسب كبيرة في الإدراك الزمني.
  • مسارات العمل الوكيلية: في BrowseComp وغيرها من معايير البحث/البرمجة الوكيلية، غالبًا ما يحتل Seed1.8 مرتبة قريبة من النماذج الاحترافية المنافسة أو أعلى منها

Seed 1.8 مقارنةً بـ Gemini 3 Pro / GPT-5.x

  • Seed1.8 مقارنةً بـ Seed-1.5-VL / Seed-1.6: تحسينات واضحة في الإدراك متعدد الوسائط، وكفاءة الرموز للفيديوهات الطويلة، والتنفيذ الوكيلي.
  • Seed1.8 مقارنةً بـ Gemini 3 Pro / GPT-5.x: في العديد من المعايير متعددة الوسائط، فإن Seed1.8 يعادل أو يتجاوز Gemini 3 Pro (مستوى SOTA في عدة مهام VQA / الحركة؛ وأفضل في تشغيل MMLB-NIAH 128k). ومع ذلك، تُظهر البطاقة أيضًا مجالات تحتفظ فيها نماذج عائلة Gemini بمزايا في بعض مهام المعرفة التخصصية — لذا فإن الترتيب النسبي يعتمد على المعيار.
  • نسخة Seed-Code (Doubao-Seed-Code): متخصصة في مهام البرمجة/الكود ذات الطابع الوكيلي (سياق كبير لقواعد الشيفرة؛ ومعايير SWE متخصصة). يُعد Seed1.8 النموذج العام متعدد الوسائط ذي الطابع الوكيلي، بينما Seed-Code هو النسخة الموجهة للبرمجة.

حالات الاستخدام العملية لواجهة برمجة تطبيقات Seedream 4.5 على CometAPI

  • مساعدو الأبحاث متعددة الوسائط وتحليل المستندات: استخراج المعلومات وتلخيصها والاستدلال عبر المستندات الطويلة والعروض التقديمية والتقارير متعددة الصفحات.
  • فهم الفيديو الطويل والمراقبة: تحليلات البث الأمني/الرياضي، وتلخيص الاجتماعات الطويلة، وتحليل البث المباشر حيث تكون كفاءة رموز الفيديو الطويلة للنموذج مهمة.
  • مسارات العمل الوكيلية / الأتمتة: سيناريوهات البحث على الويب متعدد الخطوات + تنفيذ الكود + استخراج البيانات (مثل التحليل التنافسي المؤتمت، وتخطيط السفر، ومسارات البحث المعروضة في المعايير الداخلية).
  • أدوات المطورين (عند استخدام Seed-Code): تحليل قواعد الشيفرة الكبيرة، ومساعدو بيئات التطوير IDE، وتنفيذ الكود الوكيلي للاختبار والإصلاح (Seed-Code هو النسخة المتخصصة الموصى بها).
  • أتمتة واجهات المستخدم الرسومية وRPA: تشير معايير التموضع على الشاشة ووكلاء GUI إلى أن النموذج يمكنه تنفيذ مهام GUI منظّمة بشكل أفضل من إصدارات Seed السابقة.

كيفية استخدام واجهة برمجة تطبيقات doubao Seed 1.8 عبر CometAPI

يتم إتاحة Doubao seed1.8 تجاريًا عبر CometAPI الآن كواجهة استدلال مستضافة. تدعم الواجهة حمولات متعددة الوسائط (نص + صور + مقاطع فيديو / طوابع زمنية) وأوضاع استدلال قابلة للضبط للموازنة بين زمن الاستجابة والموارد الحاسوبية وجودة الإجابة.

أنماط الاستدعاء: تدعم الواجهة طلبات بنمط الدردشة/الإكمال القياسي، والاستجابات المتدفقة، والتدفقات الوكيلية حيث يصدر النموذج استدعاءات أدوات (بحث، تنفيذ كود، إجراءات GUI) ويستوعب مخرجات الأدوات كسياق لاحق.

البث والتعامل مع السياق الطويل: تدعم الواجهة البث وتحتوي على بدائيات مدمجة لإدارة السياق للجلسات الطويلة (لتمكين سياقات 100K+ / آثار وكلاء متعددة الخطوات).

الخطوة 1: التسجيل للحصول على مفتاح API

سجّل الدخول إلى cometapi.com. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولًا. سجّل الدخول إلى CometAPI console الخاصة بك. احصل على بيانات اعتماد الوصول، أي مفتاح API الخاص بالواجهة. انقر على “Add Token” في قسم API token داخل المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx ثم أرسله.

الخطوة 2: إرسال الطلبات إلى واجهة برمجة تطبيقات doubao Seed 1.8

اختر نقطة النهاية “doubao-seed-1-8-251228 ” لإرسال طلب API وتعيين نص الطلب. يتم الحصول على طريقة الطلب ونص الطلب من وثائق API على موقعنا. كما يوفّر موقعنا اختبار Apifox لراحتك. استبدل <YOUR_API_KEY> بمفتاح CometAPI الفعلي من حسابك. التوافق مع واجهات Chat API.

أدرج سؤالك أو طلبك في حقل content—وهذا ما سيستجيب له النموذج. عالج استجابة API للحصول على الإجابة المُولَّدة.

الخطوة 3: استرجاع النتائج والتحقق منها

عالج استجابة API للحصول على الإجابة المُولَّدة. بعد المعالجة، تستجيب API بحالة المهمة وبيانات الإخراج.

الأسئلة الشائعة

What variants exist of Seed 1.8 and when to use each?

Seed1.8 هو الوكيل العام متعدد الوسائط. تشمل المتغيرات ذات الصلة: Seed-Code / Doubao-Seed-Code: متخصصة لسياقات الشيفرة الكبيرة جدًا (بعض SKUs تدّعي سياقات 256K) ولسير عمل البرمجة. Seedance / Seedream: متغيرات متخصصة في الوسائط/التوليد (توليد الفيديو/الصور). اختر Seed-Code لمهام IDE/قاعدة الشيفرة؛ اختر Seed1.8 لمهام الوكيل متعدد الوسائط الشاملة. تحقق من نوافذ السياق وقدرات SKU في وثائق المنتج.

How does Seed1.8 differ from prior Seed versions?

تركّز Seed1.8 على تكامل الوكيل (استخدام الأدوات، الوكالة عبر واجهة المستخدم الرسومية GUI، سير عمل متعددة الخطوات)، وتحسين التعامل مع السياقات الطويلة وإدراك أفضل للفيديو الطويل/الحركة مقارنةً بنماذج Seed 1.x الأقدم. يُنظر إليها بوصفها الترقية متعددة الوسائط/الوكيل ضمن خط Seed.

What input/output modalities does Seed1.8 support?

دعم متعدد الوسائط أصيل: نص + صور + فيديو. تتضمن المخرجات إجابات باللغة الطبيعية، ومخرجات مُهيكلة (JSON/خطط إجراءات)، وكود، وإشارات إلى مقاطع مرئية/طوابع زمنية لسير عمل وكيلية. صُمّم النموذج صراحةً للإدراك متعدد الوسائط → الاستدلال → الإجراء.

What are the “thinking” or inference modes of Seed1.8?

توجد أوضاع “تفكير” قابلة للضبط — مُصممة للمفاضلة بين زمن الاستجابة/الحوسبة مقابل عمق الاستدلال (مفيدة عندما يلزمك الموازنة بين التفاعلية وجودة الحل). استخدم الأوضاع للضبط لواجهات مستخدم تفاعلية أو لاستدلال دفعي أعمق.

الميزات لـ Doubao-Seed-1.8

استكشف الميزات الرئيسية لـ Doubao-Seed-1.8، المصممة لتعزيز الأداء وسهولة الاستخدام. اكتشف كيف يمكن لهذه القدرات أن تفيد مشاريعك وتحسن تجربة المستخدم.

التسعير لـ Doubao-Seed-1.8

استكشف الأسعار التنافسية لـ Doubao-Seed-1.8، المصمم ليناسب الميزانيات المختلفة واحتياجات الاستخدام المتنوعة. تضمن خططنا المرنة أن تدفع فقط مقابل ما تستخدمه، مما يجعل من السهل التوسع مع نمو متطلباتك. اكتشف كيف يمكن لـ Doubao-Seed-1.8 تحسين مشاريعك مع الحفاظ على التكاليف قابلة للإدارة.
سعر كوميت (USD / M Tokens)السعر الرسمي (USD / M Tokens)خصم
مدخل:$0.2/M
الإخراج:$1.6/M
مدخل:$0.25/M
الإخراج:$2/M
-20%

نموذج الكود وواجهة برمجة التطبيقات لـ Doubao-Seed-1.8

أصبح Doubao seed1.8 متاحًا تجاريًا عبر CometAPI بصفته واجهة برمجة تطبيقات للاستدلال مُستضافة الآن. تدعم الواجهة حمولات متعددة الأنماط (نص + صور + مقاطع فيديو / طوابع زمنية) وأنماط استدلال قابلة للتهيئة للمفاضلة بين زمن الاستجابة والموارد الحاسوبية مقابل جودة الإجابة.
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

المزيد من النماذج

A

Claude Opus 4.6

مدخل:$4/M
الإخراج:$20/M
Claude Opus 4.6 هو نموذج لغة كبير من فئة “Opus” تابع لـ Anthropic، صدر في فبراير 2026. ويُطرح كأداة عمل أساسية لأعمال المعرفة وسير عمل البحث — مع تحسين الاستدلال ضمن سياقات طويلة، والتخطيط متعدد الخطوات، واستخدام الأدوات (بما في ذلك أطر عمل برمجية قائمة على الوكلاء)، ومهام استخدام الحاسوب مثل إنشاء الشرائح وجداول البيانات تلقائيًا.
A

Claude Sonnet 4.6

مدخل:$2.4/M
الإخراج:$12/M
Claude Sonnet 4.6 هو أكثر نماذج Sonnet لدينا كفاءةً حتى الآن. إنه ترقية شاملة لقدرات النموذج في مجالات البرمجة، واستخدام الحاسوب، والاستدلال بسياقات طويلة، وتخطيط الوكلاء، والعمل المعرفي، والتصميم. كما يتميز Sonnet 4.6 بنافذة سياق بسعة 1M رمز في الإصدار التجريبي.
O

GPT-5.4 nano

مدخل:$0.16/M
الإخراج:$1/M
GPT-5.4 nano مصمم للمهام التي تكتسب فيها السرعة والتكلفة أهمية قصوى، مثل التصنيف، واستخراج البيانات، والترتيب، والوكلاء الفرعيين.
O

GPT-5.4 mini

مدخل:$0.6/M
الإخراج:$3.6/M
يقدّم GPT-5.4 mini قدرات GPT-5.4 ضمن نموذج أسرع وأكثر كفاءة مصمم لأحمال عمل كبيرة الحجم.
A

Claude Mythos Preview

A

Claude Mythos Preview

قريبًا
مدخل:$60/M
الإخراج:$240/M
Claude Mythos Preview هو أكثر نماذجنا الحدودية قدرة حتى الآن، ويُظهر قفزة لافتة في النتائج على العديد من معايير التقييم مقارنةً بنموذجنا الحدودي السابق، Claude Opus 4.6.
X

mimo-v2-pro

مدخل:$0.8/M
الإخراج:$2.4/M
MiMo-V2-Pro هو نموذج تأسيسي رائد من Xiaomi، يضم أكثر من 1T من إجمالي المعاملات وطول سياق يبلغ 1M، ومحسّن بعمق لسيناريوهات الوكلاء. وهو قابل للتكيّف بدرجة عالية مع أطر الوكلاء العامة مثل OpenClaw. ويصنَّف ضمن الفئة العليا عالميًا في معايير PinchBench وClawBench القياسية، مع أداء مُدرَك يقترب من أداء Opus 4.6. وقد صُمِّم MiMo-V2-Pro ليكون بمثابة عقل أنظمة الوكلاء، لتنسيق سير عمل معقّدة، وقيادة مهام الهندسة الإنتاجية، وتقديم نتائج موثوقة.

مدونات ذات صلة

كيفية استخدام واجهة برمجة تطبيقات Doubao Seed 1.8؟  دليل شامل
Jan 12, 2026

كيفية استخدام واجهة برمجة تطبيقات Doubao Seed 1.8؟ دليل شامل

Doubao Seed 1.8 — وهو جزء من عائلة Doubao التابعة لـByteDance وخط البحث Seed — يجذب الانتباه لكونه مُهندَسًا كنموذج متعدد الوسائط “agentic” مع قدرة على التعامل مع سياق بالغ الضخامة ودعم مُحسَّن للأدوات/الوكلاء.