โมเดลสนับสนุนองค์กรบล็อก
500+ AI Model API ทั้งหมดในหนึ่ง API เพียงแค่ใน CometAPI
API โมเดล
นักพัฒนา
เริ่มต้นอย่างรวดเร็วเอกสารประกอบแดชบอร์ด API
ทรัพยากร
โมเดล AIบล็อกองค์กรบันทึกการเปลี่ยนแปลงเกี่ยวกับ
2025 CometAPI สงวนลิขสิทธิ์ทั้งหมดนโยบายความเป็นส่วนตัวข้อกำหนดการให้บริการ
Home/Models/Doubao/Doubao-Seed-1.8
X

Doubao-Seed-1.8

อินพุต:$0.2/M
เอาต์พุต:$1.6/M
บริบท:256k
เอาต์พุตสูงสุด:224k
Doubao-Seed-1.8 ได้รับการปรับให้เหมาะสมสำหรับสถานการณ์ของเอเจนต์แบบมัลติโมดัล ในด้านความสามารถของเอเจนต์ การใช้เครื่องมือและความสามารถในการปฏิบัติตามคำสั่งที่ซับซ้อนได้รับการปรับปรุงอย่างมาก ในด้านความเข้าใจแบบมัลติโมดัล ความสามารถเชิงภาพพื้นฐานได้รับการปรับปรุงอย่างมาก ทำให้สามารถทำความเข้าใจวิดีโอที่ยาวมากได้แม้ที่อัตราเฟรมต่ำ ความเข้าใจการเคลื่อนไหวในวิดีโอ ความเข้าใจเชิงพื้นที่ที่ซับซ้อน และความสามารถในการแยกวิเคราะห์โครงสร้างเอกสารก็ได้รับการปรับให้เหมาะสมเพิ่มเติม และขณะนี้รองรับการจัดการบริบทแบบอัจฉริยะในตัว ทำให้ผู้ใช้สามารถกำหนดกลยุทธ์บริบทได้
ใหม่
ใช้งานเชิงพาณิชย์
Playground
ภาพรวม
คุณสมบัติ
ราคา
API

ข้อกำหนดทางเทคนิคของ Seed 1.8 API

รายการข้อกำหนด / หมายเหตุ
ชื่อรุ่น / ตระกูลDoubao-Seed-1.8 (Seed1.8) — ByteDance Seed / Volcano Engine
โมดาลิตีที่รองรับข้อความ, รูปภาพ, วิดีโอ (ความสามารถ VLM แบบมัลติโหมด), เครื่องมือด้านเสียงในอีโคซิสเต็ม (มีโมเดลแยกสำหรับการสร้างเสียง/วิดีโอ)
หน้าต่างบริบท (ข้อความ)256K tokens
ความสามารถด้านวิดีโอ / ภาพออกแบบมาสำหรับการให้เหตุผลกับวิดีโอความยาวมาก รองรับการเข้ารหัสภาพอย่างมีประสิทธิภาพและงบประมาณ video token ขนาดใหญ่ (model card รายงานการทดลอง video token และ benchmark สำหรับวิดีโอยาว)
รูปแบบอินพุตพรอมต์ข้อความอิสระ; การอัปโหลดรูปภาพ (ภาพหน้าจอ, กราฟ, ภาพถ่าย); วิดีโอในรูปแบบเฟรมที่ถูกแปลงเป็นโทเคน / เครื่องมือวิดีโอสำหรับตรวจสอบตามช่วงเวลา; การอัปโหลดไฟล์ (เอกสาร)
รูปแบบเอาต์พุตข้อความภาษาธรรมชาติ, เอาต์พุตแบบมีโครงสร้าง (structured-output beta), function calls / tool calls, โค้ด และเอาต์พุตมัลติโหมดผ่าน orchestration
โหมดการคิด / การอนุมานno_think, think-low, think-medium, think-high — ปรับสมดุลความแม่นยำกับเวลาแฝง/ต้นทุน

Doubao Seed 1.8 คืออะไร?

Doubao Seed 1.8 คือรุ่น 1.8 ของทีม Seed: LLM+VLM แบบรวมศูนย์ที่มุ่งเป้าไปที่ ความเป็นเอเจนต์ในโลกจริงแบบทั่วไป โดยชัดเจน — กล่าวคือ การรับรู้ (ภาพ/วิดีโอ), การให้เหตุผล, การประสานงานเครื่องมือ (การค้นหา, function calls, การรันโค้ด, GUI grounding) และการตัดสินใจหลายขั้นตอนภายในโมเดลเดียว การออกแบบเน้น “โหมดการคิด” ที่ปรับได้ (แลกเปลี่ยนระหว่างเวลาแฝงกับความลึก), การเข้ารหัสภาพที่มีประสิทธิภาพ และการรองรับบริบทยาวและอินพุตมัลติโหมดโดยกำเนิด เพื่อให้โมเดลสามารถทำงานเป็นผู้ช่วย/เอเจนต์อัตโนมัติในเวิร์กโฟลว์การใช้งานจริงได้

คุณสมบัติหลักของ Seed 1.8 API

  1. โมเดลเอเจนต์มัลติโหมดแบบรวมศูนย์ รวมการรับรู้ (ภาพ/วิดีโอ), การให้เหตุผล (LLM) และการลงมือทำ (tool/G U I calls, การรันโค้ด) ไว้ในโมเดลเดียว แทนที่จะเป็นไปป์ไลน์แยกส่วน สิ่งนี้ช่วยให้เวิร์กโฟลว์เอเจนต์กระชับขึ้นและลดความซับซ้อนของ orchestration
  2. บริบทยาวมากและการจัดการวิดีโอยาว บริบทยาว (รองรับผลิตภัณฑ์ถึง 256k tokens) และมี benchmark เฉพาะสำหรับวิดีโอยาว (Seed1.8 แสดงประสิทธิภาพด้าน video token สำหรับวิดีโอยาวได้ดี) โมเดลรองรับเครื่องมือวิดีโอแบบเลือกช่วง (VideoCut) เพื่อโฟกัสการให้เหตุผลตาม timestamp
  3. ระบบอัตโนมัติ GUI แบบเอเจนต์และการใช้เครื่องมือ Benchmark และการทดสอบภายใน (OSWorld, AndroidWorld, LiveCodeBench, benchmark ด้าน GUI grounding) แสดงการปรับปรุงในงาน GUI agent และระบบอัตโนมัติหลายขั้นตอน โมเดลสามารถส่งออกคำสั่ง GUI grounding และทำงานในบริบท OS/web/mobile จำลองได้
  4. โหมดการคิดที่ปรับได้เพื่อควบคุมเวลาแฝง/ต้นทุน โหมดการอนุมาน 4 แบบช่วยให้นักพัฒนาปรับการคำนวณขณะทดสอบได้สำหรับงานอินเทอร์แอคทีฟเทียบกับงานแบตช์คุณภาพสูง สิ่งนี้มีประโยชน์สำหรับระบบ production ที่มีข้อจำกัดด้านเวลาแฝงอย่างเข้มงวด
  5. ประสิทธิภาพด้านโทเคนที่ดีขึ้น (มัลติโหมด) Seed 1.8 แสดงให้เห็นถึงประสิทธิภาพด้านโทเคนที่ดีกว่ารุ่นก่อนหน้า (ซีรีส์ Seed-1.5/1.6) ใน benchmark มัลติโหมด โดยทำความแม่นยำสูงได้ด้วยงบประมาณโทเคนที่น้อยกว่าในหลายงานวิดีโอยาว
  6. โหมดการคิดที่ปรับได้: ปรับระดับความลึกของการอนุมานเทียบกับเวลาแฝง/ต้นทุนด้วยโหมดที่แยกชัดเจน (no_think → think-high) เพื่อจูนให้เหมาะกับการใช้งาน production แบบอินเทอร์แอคทีฟ
  7. ความสามารถทางเทคนิค
  • ประสิทธิภาพด้านโทเคน: Seed1.8 แสดงประสิทธิภาพด้านโทเคนที่โดดเด่นเมื่อเทียบกับรุ่นก่อนหน้า (Seed-1.5/1.6) โดยให้ความแม่นยำที่ดีกว่าด้วยงบประมาณโทเคนที่ต่ำลงในงานวิดีโอยาว (เช่น ทำความแม่นยำที่แข่งขันได้แม้ใช้เพียง 32K video tokens) สิ่งนี้ช่วยลดต้นทุนการอนุมานสำหรับอินพุตที่ยาว
  • การให้เหตุผลและการรับรู้แบบมัลติโหมด: โมเดลทำสถิติ SOTA ในหลายงาน multi-image VQA และงาน motion/perception และได้อันดับสองหรือใกล้เคียง SOTA ใน benchmark การให้เหตุผลมัลติโหมดหลายรายการ; โดยเฉพาะอย่างยิ่ง โมเดลทำได้ดีกว่ารุ่นก่อนหน้าในแทบทุกมิติด้านภาพ/วิดีโอที่มีการวัดผล
  • การใช้เครื่องมือแบบเอเจนต์และ GUI grounding: มีการระบุการรองรับ GUI grounding และ benchmark การปฏิบัติงานจากหน้าจอ (ScreenSpot-Pro, GUI agenting) พร้อมคะแนน grounding ที่แข็งแกร่ง (เช่น ดีขึ้นจาก Seed-1.5-VL บน ScreenSpot-Pro)
  • การให้เหตุผลแบบขนาน / เป็นขั้นตอน: การเพิ่มการคำนวณขณะทดสอบ (parallel thinking) ให้ผลการปรับปรุงที่วัดได้ใน benchmark ด้านคณิตศาสตร์ การเขียนโค้ด และการให้เหตุผลแบบมัลติโหมด

ไฮไลต์ benchmark สาธารณะที่คัดเลือกมาของ Seed1.8

  • VCRBench (การให้เหตุผลเชิงสามัญสำนึกจากภาพ): Seed1.8 ได้คะแนน 59.8 (รายงาน Pass@1 ในตาราง model card) ซึ่งดีกว่า Seed-1.5-VL และแข่งขันได้กับโมเดลชั้นนำ
  • VideoHolmes (การให้เหตุผลกับวิดีโอ): Seed1.8 ได้ 65.5, เหนือกว่า Seed-1.5-VL และเข้าใกล้โมเดลคู่แข่งระดับโปร
  • MMLB-NIAH (บริบทยาวแบบมัลติโหมด, 128k): Seed1.8 ทำได้ 72.2 Pass@1 ที่บริบท 128k ใน MMLB-NIAH เหนือกว่าโมเดลโปรร่วมสมัยบางรุ่น
  • ชุด Motion & Perception: SOTA ใน 5 จาก 6 งานที่ประเมิน; ตัวอย่างได้แก่ TVBench, TempCompass และ TOMATO ซึ่ง Seed1.8 แสดงการปรับปรุงอย่างมากในด้านการรับรู้เชิงเวลา
  • เวิร์กโฟลว์แบบเอเจนต์: ใน BrowseComp และ benchmark ด้านการค้นหา/โค้ดแบบเอเจนต์อื่น ๆ Seed1.8 มักอยู่อันดับใกล้เคียงหรือสูงกว่าโมเดลโปรคู่แข่ง

Seed 1.8 เทียบกับ Gemini 3 Pro / GPT-5.x

  • Seed1.8 เทียบกับ Seed-1.5-VL / Seed-1.6: มีการปรับปรุงอย่างชัดเจนในด้านการรับรู้แบบมัลติโหมด, ประสิทธิภาพด้านโทเคนสำหรับวิดีโอยาว และการดำเนินการแบบเอเจนต์
  • Seed1.8 เทียบกับ Gemini 3 Pro / GPT-5.x: ใน benchmark มัลติโหมดหลายรายการ Seed1.8 เทียบเท่าหรือเหนือกว่า Gemini 3 Pro (SOTA ในหลายงาน VQA / motion; ดีกว่าในการรัน MMLB-NIAH 128k) อย่างไรก็ตาม การ์ดยังแสดงให้เห็นว่ามีบางด้านที่โมเดลตระกูล Gemini ยังได้เปรียบในงานความรู้เฉพาะสาขาบางประเภท — ดังนั้นลำดับเปรียบเทียบขึ้นอยู่กับ benchmark
  • รุ่น Seed-Code (Doubao-Seed-Code): ออกแบบเฉพาะสำหรับงานเขียนโปรแกรม/โค้ดแบบเอเจนต์ (บริบทยาวสำหรับ codebase; benchmark SWE เฉพาะทาง) Seed1.8 เป็นโมเดลมัลติโหมดแบบเอเจนต์อเนกประสงค์ ส่วน Seed-Code เป็นรุ่นที่เน้นงานเขียนโปรแกรม

กรณีการใช้งานจริงของ Seedream 4.5 API บน CometAPI

  • ผู้ช่วยวิจัยมัลติโหมดและการวิเคราะห์เอกสาร: ดึงข้อมูล, สรุป และให้เหตุผลข้ามเอกสารยาว, ชุดสไลด์ และรายงานหลายหน้า
  • ความเข้าใจและการมอนิเตอร์วิดีโอยาว: การวิเคราะห์ด้านความปลอดภัย/การถ่ายทอดกีฬา, การสรุปการประชุมยาว, และการวิเคราะห์สตรีมมิงที่ประสิทธิภาพด้าน video token ของโมเดลมีความสำคัญ
  • เวิร์กโฟลว์แบบเอเจนต์ / ระบบอัตโนมัติ: สถานการณ์การค้นหาเว็บหลายขั้นตอน + การรันโค้ด + การดึงข้อมูล (เช่น การวิเคราะห์คู่แข่งแบบอัตโนมัติ, การวางแผนการเดินทาง, ไปป์ไลน์งานวิจัยที่แสดงใน benchmark ภายใน)
  • เครื่องมือสำหรับนักพัฒนา (หากใช้ Seed-Code): การวิเคราะห์ codebase ขนาดใหญ่, ผู้ช่วยใน IDE และการรันโค้ดแบบเอเจนต์เพื่อการทดสอบและซ่อมแซม (Seed-Code เป็นรุ่นเฉพาะทางที่แนะนำ)
  • ระบบอัตโนมัติ GUI และ RPA: benchmark ด้าน screen grounding และ GUI agent บ่งชี้ว่าโมเดลสามารถทำงาน GUI แบบมีโครงสร้างได้ดีกว่ารุ่น Seed ก่อนหน้า

วิธีใช้ doubao Seed 1.8 API ผ่าน CometAPI

ขณะนี้ Doubao seed1.8 เปิดให้ใช้งานเชิงพาณิชย์ผ่าน CometAPI ในรูปแบบ hosted inference API แล้ว API รองรับ payload แบบมัลติโหมด (ข้อความ + รูปภาพ + ชิ้นส่วนวิดีโอ / timestamp) และโหมดการอนุมานที่ปรับได้เพื่อแลกเปลี่ยนระหว่างเวลาแฝงและการคำนวณกับคุณภาพของคำตอบ

รูปแบบการเรียกใช้งาน: API รองรับคำขอแบบมาตรฐานสไตล์ chat/completion, การตอบกลับแบบสตรีมมิง และโฟลว์แบบเอเจนต์ที่โมเดลออก tool calls (ค้นหา, รันโค้ด, การกระทำบน GUI) และรับผลลัพธ์จากเครื่องมือเป็นบริบทถัดไป

การสตรีมมิงและการจัดการบริบทยาว: API รองรับการสตรีมมิงและมี primitive สำหรับจัดการบริบทในตัวสำหรับเซสชันที่ยาว (เพื่อรองรับบริบท 100K+ / agent traces หลายขั้นตอน)

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาสมัครก่อน จากนั้นลงชื่อเข้าใช้ CometAPI console รับ API key สำหรับเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ส่วน API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่งคำขอ

ขั้นตอนที่ 2: ส่งคำขอไปยัง doubao Seed 1.8 API

เลือก endpoint “doubao-seed-1-8-251228 ” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการส่งคำขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมี Apifox test เพื่อความสะดวกของคุณอีกด้วย แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ เข้ากันได้กับ API แบบ Chat

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะใช้ตอบกลับ ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับจาก API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะของงานและข้อมูลเอาต์พุต

คำถามที่พบบ่อย

What variants exist of Seed 1.8 and when to use each?

Seed1.8 เป็นเอเจนต์มัลติโหมดแบบอเนกประสงค์ทั่วไป รุ่นที่เกี่ยวข้องได้แก่: Seed-Code / Doubao-Seed-Code: เชี่ยวชาญสำหรับบริบทโค้ดขนาดใหญ่มาก (บาง SKU ระบุว่ารองรับบริบท 256K) และเวิร์กโฟลว์การเขียนโค้ด. Seedance / Seedream: รุ่นที่เชี่ยวชาญด้านสื่อ/การสร้าง (การสร้างวิดีโอ/ภาพ). เลือกใช้ Seed-Code สำหรับงานใน IDE/โค้ดเบส; เลือกใช้ Seed1.8 สำหรับงานเอเจนต์มัลติโหมดที่กว้างขึ้น. โปรดยืนยันหน้าต่างบริบทและความสามารถของ SKU ในเอกสารผลิตภัณฑ์.

How does Seed1.8 differ from prior Seed versions?

Seed1.8 มุ่งเน้นการบูรณาการเชิงเอเจนต์ (การใช้เครื่องมือ การทำงานผ่าน GUI โดยเอเจนต์ เวิร์กโฟลว์หลายขั้นตอน), การจัดการบริบทยาวที่ดีขึ้น และการรับรู้วิดีโอยาว/การเคลื่อนไหวที่ดีขึ้นเมื่อเทียบกับรุ่น Seed 1.x ก่อนหน้า โดยวางตำแหน่งเป็นการอัปเกรดด้านมัลติโหมด/เอเจนต์ในสายผลิตภัณฑ์ Seed.

What input/output modalities does Seed1.8 support?

รองรับมัลติโหมดโดยกำเนิด: ข้อความ + รูปภาพ + วิดีโอ. ผลลัพธ์ประกอบด้วยคำตอบภาษาธรรมชาติ เอาต์พุตแบบมีโครงสร้าง (JSON/แผนปฏิบัติการ) โค้ด และการอ้างอิงถึงส่วนภาพ/ไทม์สแตมป์สำหรับเวิร์กโฟลว์แบบเอเจนต์. โมเดลถูกออกแบบมาโดยเฉพาะสำหรับการรับรู้แบบมัลติโหมด → การให้เหตุผล → การลงมือปฏิบัติ.

What are the “thinking” or inference modes of Seed1.8?

มีโหมด “thinking” ที่ปรับได้ — ออกแบบมาเพื่อแลกเปลี่ยนระหว่างความหน่วง/การคำนวณ กับความลึกของการให้เหตุผล (มีประโยชน์เมื่อคุณต้องสร้างสมดุลระหว่างความเป็นปฏิสัมพันธ์กับคุณภาพของคำตอบ). ใช้โหมดเหล่านี้เพื่อปรับให้เหมาะกับ UI แบบโต้ตอบ หรือการให้เหตุผลแบบแบตช์ที่ลึกยิ่งขึ้น.

คุณสมบัติสำหรับ Doubao-Seed-1.8

สำรวจคุณสมบัติหลักของ Doubao-Seed-1.8 ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพและความสะดวกในการใช้งาน ค้นพบว่าความสามารถเหล่านี้สามารถเป็นประโยชน์ต่อโครงการของคุณและปรับปรุงประสบการณ์ของผู้ใช้ได้อย่างไร

ราคาสำหรับ Doubao-Seed-1.8

สำรวจราคาที่แข่งขันได้สำหรับ Doubao-Seed-1.8 ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Doubao-Seed-1.8 สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้
ราคา Comet (USD / M Tokens)ราคาทางการ (USD / M Tokens)ส่วนลด
อินพุต:$0.2/M
เอาต์พุต:$1.6/M
อินพุต:$0.25/M
เอาต์พุต:$2/M
-20%

โค้ดตัวอย่างและ API สำหรับ Doubao-Seed-1.8

Doubao seed1.8 ขณะนี้เปิดให้ใช้งานเชิงพาณิชย์ผ่าน CometAPI ในรูปแบบ API การอนุมานแบบโฮสต์แล้ว API นี้รองรับเพย์โหลดแบบมัลติโมดัล (ข้อความ + รูปภาพ + ส่วนย่อยของวิดีโอ / ตราประทับเวลา) และมีโหมดการอนุมานที่กำหนดค่าได้เพื่อปรับสมดุลระหว่างความหน่วงและทรัพยากรการคำนวณกับคุณภาพของคำตอบ
POST
/v1/chat/completions
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="doubao-seed-1-8-251228",
    max_completion_tokens=65535,
    extra_body={"reasoning_effort": "medium"},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
                    },
                },
                {"type": "text", "text": "What is the main idea of the picture?"},
            ],
        }
    ],
)

print(completion.choices[0].message.content)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

async function main() {
  const completion = await openai.chat.completions.create({
    model: "doubao-seed-1-8-251228",
    max_completion_tokens: 65535,
    reasoning_effort: "medium",
    messages: [
      {
        role: "user",
        content: [
          {
            type: "image_url",
            image_url: {
              url: "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            type: "text",
            text: "What is the main idea of the picture?"
          }
        ]
      }
    ],
  });

  console.log(completion.choices[0].message.content);
}

main();

Curl Code Example

curl https://api.cometapi.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "doubao-seed-1-8-251228",
    "max_completion_tokens": 65535,
    "reasoning_effort": "medium",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image_url",
            "image_url": {
              "url": "https://ark-project.tos-cn-beijing.ivolces.com/images/view.jpeg"
            }
          },
          {
            "type": "text",
            "text": "What is the main idea of the picture?"
          }
        ]
      }
    ]
  }'

โมเดลเพิ่มเติม

A

Claude Opus 4.6

อินพุต:$4/M
เอาต์พุต:$20/M
Claude Opus 4.6 เป็นโมเดลภาษาขนาดใหญ่ระดับ “Opus” ของ Anthropic เปิดตัวในเดือนกุมภาพันธ์ 2026. ถูกวางตำแหน่งให้เป็นกำลังหลักสำหรับงานเชิงความรู้และเวิร์กโฟลว์การวิจัย — ปรับปรุงการให้เหตุผลในบริบทยาว การวางแผนหลายขั้นตอน การใช้เครื่องมือ (รวมถึงเวิร์กโฟลว์ซอฟต์แวร์เชิงตัวแทน) และงานการใช้คอมพิวเตอร์ เช่น การสร้างสไลด์และสเปรดชีตอัตโนมัติ.
A

Claude Sonnet 4.6

อินพุต:$2.4/M
เอาต์พุต:$12/M
Claude Sonnet 4.6 เป็นโมเดล Sonnet ที่มีความสามารถมากที่สุดเท่าที่เคยมีมา เป็นการอัปเกรดเต็มรูปแบบของทักษะของโมเดล ครอบคลุมการเขียนโค้ด การใช้งานคอมพิวเตอร์ การให้เหตุผลในบริบทยาว การวางแผนของเอเจนต์ งานด้านความรู้ และการออกแบบ Sonnet 4.6 ยังมาพร้อมกับหน้าต่างบริบทขนาด 1M โทเค็นในเวอร์ชันเบต้า
O

GPT-5.4 nano

อินพุต:$0.16/M
เอาต์พุต:$1/M
GPT-5.4 nano ถูกออกแบบมาสำหรับงานที่ความเร็วและต้นทุนมีความสำคัญสูงสุด เช่น การจำแนกประเภท การสกัดข้อมูล การจัดอันดับ และเอเจนต์ย่อย.
O

GPT-5.4 mini

อินพุต:$0.6/M
เอาต์พุต:$3.6/M
GPT-5.4 mini นำจุดแข็งของ GPT-5.4 มาสู่โมเดลที่เร็วกว่าและมีประสิทธิภาพมากขึ้น ซึ่งออกแบบมาสำหรับภาระงานปริมาณมาก
A

Claude Mythos Preview

A

Claude Mythos Preview

เร็วๆ นี้
อินพุต:$60/M
เอาต์พุต:$240/M
Claude Mythos Preview เป็นโมเดลระดับแนวหน้าที่มีความสามารถสูงสุดของเราจนถึงปัจจุบัน และทำคะแนนก้าวกระโดดอย่างชัดเจน บนเบนช์มาร์กการประเมินหลายรายการ เมื่อเทียบกับโมเดลระดับแนวหน้ารุ่นก่อนของเรา Claude Opus 4.6.
X

mimo-v2-pro

อินพุต:$0.8/M
เอาต์พุต:$2.4/M
MiMo-V2-Pro คือโมเดลพื้นฐานเรือธงของ Xiaomi ที่มีพารามิเตอร์รวมมากกว่า 1T และความยาวคอนเท็กซ์ 1M โดยได้รับการปรับแต่งอย่างลึกซึ้งสำหรับสถานการณ์แบบเอเจนต์ มีความสามารถในการปรับใช้ได้สูงกับเฟรมเวิร์กเอเจนต์ทั่วไป เช่น OpenClaw โดยติดอันดับระดับแนวหน้าของโลกในการทดสอบมาตรฐาน PinchBench และ ClawBench และมีประสิทธิภาพที่รับรู้ได้ใกล้เคียงกับ Opus 4.6 MiMo-V2-Pro ได้รับการออกแบบมาเพื่อทำหน้าที่เป็นสมองของระบบเอเจนต์ ประสานการทำงานของเวิร์กโฟลว์ที่ซับซ้อน ขับเคลื่อนงานวิศวกรรมสำหรับการใช้งานจริง และส่งมอบผลลัพธ์ได้อย่างน่าเชื่อถือ

บล็อกที่เกี่ยวข้อง

วิธีใช้ Doubao Seed 1.8 API อย่างไร?  คู่มือฉบับสมบูรณ์
Jan 12, 2026

วิธีใช้ Doubao Seed 1.8 API อย่างไร? คู่มือฉบับสมบูรณ์

Doubao Seed 1.8 — ซึ่งเป็นส่วนหนึ่งของตระกูล Doubao ของ ByteDance และสายงานวิจัย Seed — กำลังได้รับความสนใจ เนื่องจากได้รับการออกแบบให้เป็นโมเดลมัลติโมดัลแบบ “agentic” ที่สามารถจัดการบริบทที่ยาวมาก และมีการรองรับเครื่องมือ/เอเจนต์ที่ได้รับการปรับปรุง