ByteDance โอเพนซอร์ส Seed-OSS-36B ซึ่งเป็น LLM พารามิเตอร์ 36B

CometAPI
AnnaAug 23, 2025
ByteDance โอเพนซอร์ส Seed-OSS-36B ซึ่งเป็น LLM พารามิเตอร์ 36B

ทีม Seed ของ ByteDance ได้เปิดตัว เมล็ดพันธุ์-OSS, กลุ่มโมเดลภาษาโอเพนซอร์สขนาดใหญ่ที่นำโดย เมล็ดพันธุ์-OSS-36Bซึ่งเป็นโมเดลที่มีพารามิเตอร์ 36 พันล้านตัวที่รองรับหน้าต่างอินพุตที่ยาวเป็นพิเศษ และเผยแพร่ภายใต้ใบอนุญาต Apache-2.0 โค้ดและการ์ดโมเดลได้รับการเผยแพร่บน GitHub และ Hugging Face เมื่อวันที่ 20 สิงหาคม 2025 และตัวแปรหลายตัว รวมถึง Base และ Instruct (รวมถึงเวอร์ชันที่ฝึกฝนด้วยข้อมูลสังเคราะห์) พร้อมให้นักพัฒนาใช้งานได้ทันที

Seed-OSS ได้เปิดตัวแล้ว

ByteDance Seed เปิดตัว Seed-OSS สามรุ่น: Seed-OSS-36B-Base (เผยแพร่ในเวอร์ชันที่มีและไม่มีข้อมูลสังเคราะห์) และ Seed-OSS-36B-Instruct

จุดเด่นทางเทคนิคที่สำคัญของ Seed-OSS

  • จำนวนพารามิเตอร์: แบบจำลองหัวข้อข่าวได้รับการอธิบายว่าเป็น พารามิเตอร์ 36 พันล้าน แบบอย่าง. \
  • หน้าต่างบริบทที่ยาวมาก: ByteDance โฆษณาความยาวบริบทที่ยาวมาก — มากถึง 512,000 โทเค็น — มุ่งเน้นไปที่การใช้เหตุผลเอกสารยาว ฐานโค้ด และเวิร์กโฟลว์ของตัวแทนหลายเอกสาร
  • มาตราส่วนการฝึกอบรม: มีรายงานว่า Seed-OSS บรรลุประสิทธิภาพเกณฑ์มาตรฐานที่แข็งแกร่งแม้จะได้รับการฝึกอบรมมาประมาณ 12 ล้านล้านโทเค็นตามเอกสารประกอบรุ่น

ชุดแบบจำลอง Seed-OSS พัฒนาจากสถาปัตยกรรมแบบจำลองภาษาเชิงสาเหตุยอดนิยม และใช้ RoPE, กลไกการให้ความสนใจ GQA, RMS Norm และฟังก์ชันการเปิดใช้งาน SwiGLU แบบจำลอง Seed-OSS-36B ที่เพิ่งเปิดตัวใหม่นี้มีพารามิเตอร์ 36 พันล้านตัว และสามารถจัดการบริบทยาวขนาด 512KB ได้ แม้จะใช้ข้อมูลฝึกอบรมเพียง 12 ล้านล้านชุด แต่ก็ให้ประสิทธิภาพที่น่าประทับใจในการทดสอบประสิทธิภาพหลายรายการยอดนิยม

ชุดโมเดล Seed-OSS ประกอบด้วยสองเวอร์ชัน ได้แก่ Seed-OSS-36B-Base ที่มีข้อมูลคำสั่งสังเคราะห์ และ Seed-OSS-36B-Base-woSyn ที่ไม่มีข้อมูลคำสั่งสังเคราะห์ การออกแบบนี้ไม่เพียงแต่มอบโมเดลพื้นฐานประสิทธิภาพสูงให้กับนักพัฒนาเท่านั้น แต่ยังมอบตัวเลือกที่หลากหลายยิ่งขึ้นให้กับนักวิจัย เพื่อให้มั่นใจว่าความถูกต้องของงานวิจัยจะไม่ถูกกระทบจากข้อมูลสังเคราะห์

คุณสมบัติสำคัญของโมเดลนี้คือ “งบประมาณการคิด” ที่ยืดหยุ่น ช่วยให้ผู้ใช้สามารถปรับระยะเวลาการอนุมานได้ตามต้องการ ความสามารถนี้ช่วยปรับปรุงประสิทธิภาพการอนุมานอย่างมีนัยสำคัญในการใช้งานจริง นอกจากนี้ Seed-OSS ยังได้รับการปรับแต่งเป็นพิเศษสำหรับงานอนุมาน ช่วยให้มั่นใจได้ถึงความสามารถในการใช้เหตุผลที่ดีขึ้น ในขณะที่ยังคงประสิทธิภาพโดยรวมที่ดี

ในงานเปิดตัว ทีม Seed ได้เน้นย้ำว่าโมเดล Seed-OSS ไม่เพียงแต่เหมาะสำหรับงานวิจัยเชิงวิชาการเท่านั้น แต่ยังนำไปประยุกต์ใช้กับงานพัฒนาต่างๆ ได้อย่างหลากหลาย เช่น งานด้านปัญญาประดิษฐ์แบบเอเจนต์ เช่น การใช้เครื่องมือและการแก้ปัญหา ผลการฝึกอบรมและการประเมินผลโมเดลแสดงให้เห็นว่า Seed-OSS มีประสิทธิภาพการทำงานที่โดดเด่นในโอเพนซอร์สในงานต่างๆ เช่น การตอบคำถามความรู้ การให้เหตุผลเชิงคณิตศาสตร์ และการเขียนโปรแกรม

เริ่มต้นใช้งาน

CometAPI เป็นแพลตฟอร์ม API แบบรวมที่รวบรวมโมเดล AI มากกว่า 500 โมเดลจากผู้ให้บริการชั้นนำ เช่น ซีรีส์ GPT ของ OpenAI, Gemini ของ Google, Claude ของ Anthropic, Midjourney, Suno และอื่นๆ ไว้ในอินเทอร์เฟซเดียวที่เป็นมิตรกับนักพัฒนา ด้วยการนำเสนอการตรวจสอบสิทธิ์ การจัดรูปแบบคำขอ และการจัดการการตอบสนองที่สอดคล้องกัน CometAPI จึงทำให้การรวมความสามารถของ AI เข้ากับแอปพลิเคชันของคุณง่ายขึ้นอย่างมาก ไม่ว่าคุณจะกำลังสร้างแชทบ็อต เครื่องกำเนิดภาพ นักแต่งเพลง หรือไพพ์ไลน์การวิเคราะห์ที่ขับเคลื่อนด้วยข้อมูล CometAPI ช่วยให้คุณทำซ้ำได้เร็วขึ้น ควบคุมต้นทุน และไม่ขึ้นอยู่กับผู้จำหน่าย ทั้งหมดนี้ในขณะที่ใช้ประโยชน์จากความก้าวหน้าล่าสุดในระบบนิเวศ AI

การผสานรวม Seed-OSS ล่าสุดจะปรากฏบน CometAPI เร็วๆ นี้ โปรดติดตาม! ในขณะที่เรากำลังสรุปการอัปโหลดโมเดล Seed-OSS ให้สำรวจโมเดลภาพอื่นๆ ของเรา เช่น Deep Seek V3.1 ในเวิร์กโฟลว์ของคุณหรือลองใช้ใน AI Playground คุณสามารถสำรวจความสามารถของโมเดลได้ใน สนามเด็กเล่น และดูคำแนะนำโดยละเอียดในคู่มือ API ก่อนเข้าใช้งาน โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับรหัส API แล้ว CometAPI เสนอราคาที่ต่ำกว่าราคาอย่างเป็นทางการมากเพื่อช่วยคุณในการผสานรวม

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%