อาลีบาบาเปิดตัวโมเดล Qwen 3 AI เร่งการแข่งขันด้านอาวุธ AI ของจีน

CometAPI
AnnaApr 28, 2025
อาลีบาบาเปิดตัวโมเดล Qwen 3 AI เร่งการแข่งขันด้านอาวุธ AI ของจีน

April 29, 2025 Alibaba Group เปิดตัว Qwen 3 ซึ่งเป็นรุ่นล่าสุดของโมเดลปัญญาประดิษฐ์เรือธงของบริษัท โดยแนะนำความสามารถในการใช้เหตุผลแบบไฮบริดขั้นสูงที่ออกแบบมาเพื่อเพิ่มความสามารถในการปรับตัวและประสิทธิภาพสำหรับนักพัฒนาที่สร้างแอปพลิเคชันและซอฟต์แวร์

โมเดล Qwen3 เปิดให้ดาวน์โหลดได้ (หรือจะพร้อมให้ดาวน์โหลดในเร็วๆ นี้) ภายใต้ใบอนุญาตแบบเปิดบนแพลตฟอร์มต่างๆ เช่น Hugging Face และ GitHub โมเดลเหล่านี้มีขนาดตั้งแต่ 0.6 พันล้านถึง 235 พันล้านพารามิเตอร์ โดยโมเดลขนาดใหญ่กว่ามักจะแสดงความสามารถในการแก้ปัญหาที่เหนือกว่าเนื่องจากมีชุดพารามิเตอร์ที่ครอบคลุม

คุณสมบัติหลักและข้อดีของ Qwen 3

Qwen3 รองรับ 119 ภาษา และได้รับการฝึกบนชุดข้อมูลขนาดใหญ่ที่มีโทเค็นประมาณ 36 ล้านล้านโทเค็น โทเค็นแสดงถึงหน่วยข้อมูลพื้นฐานที่ประมวลผลโดยโมเดล โดยทั่วไป โทเค็น 1 ล้านโทเค็นเทียบเท่ากับคำศัพท์ประมาณ 750,000 คำ สื่อการฝึกประกอบด้วยหนังสือเรียน คู่คำถาม-คำตอบ สนิปเป็ตโค้ด และข้อมูลที่สร้างโดย AI

เมื่อเปรียบเทียบกับรุ่นก่อนหน้าอย่าง Qwen2 แล้ว Qwen3 แสดงให้เห็นถึงประสิทธิภาพที่เพิ่มขึ้นอย่างมาก แม้ว่าโมเดล Qwen3 อาจไม่สามารถแซงหน้าโมเดลระดับสูงอย่าง o3 และ o4-mini ของ OpenAI ได้โดยรวม แต่โมเดลเหล่านี้ก็ยังคงมีความสามารถในการแข่งขัน

โดยเฉพาะอย่างยิ่ง Qwen3 รุ่นที่ใหญ่ที่สุดคือ Qwen-3-235B-A22B ซึ่งแสดงให้เห็นถึงความเหนือกว่า o3-mini ของ OpenAI และ Gemini 2.5 Pro ของ Google บนแพลตฟอร์มอย่าง Codeforces ซึ่งเป็นที่รู้จักจากการแข่งขันการเขียนโปรแกรม นอกจากนี้ โมเดลนี้ยังมีประสิทธิภาพเหนือกว่าในการประเมินทางคณิตศาสตร์ที่ซับซ้อน เช่น AIME และ BFCL อย่างไรก็ตาม Qwen-3-235B-A22B ยังไม่ได้เผยแพร่ให้สาธารณชนใช้งานในขณะนี้

คิวเว่น3

Qwen3-3B ซึ่งเป็นโมเดล Qwen32 ที่เปิดให้ใช้งานสาธารณะที่มีขนาดใหญ่ที่สุดนั้นยังคงสามารถแข่งขันกับโมเดล AI ที่เป็นกรรมสิทธิ์และแบบเปิดได้หลากหลาย โดยแซงหน้า o1 ของ OpenAI ในการทดสอบหลายรายการ รวมถึงเกณฑ์มาตรฐานการเข้ารหัส LiveCodeBench Alibaba ยืนยันว่า Qwen3 "เหนือกว่า" ในด้านความสามารถในการเรียกใช้เครื่องมือ และปฏิบัติตามคำสั่งได้อย่างมีประสิทธิภาพ และจำลองรูปแบบข้อมูลเฉพาะ Qwen3 ยังสามารถเข้าถึงได้ผ่านผู้ให้บริการระบบคลาวด์ เช่น Fireworks AI และ Hyperbolic

อาลีบาบาอธิบายโมเดล Qwen3 ว่าเป็น "ไฮบริด" ซึ่งบ่งบอกถึงความสามารถในการใช้เหตุผลเชิงลึกสำหรับปัญหาที่ซับซ้อนหรือจัดการกับคำขอที่ง่ายกว่าได้อย่างรวดเร็ว ความสามารถในการใช้เหตุผลที่หลากหลายนี้ ซึ่งคล้ายกับโมเดล o3 ของ OpenAI ช่วยให้สามารถตรวจสอบข้อเท็จจริงด้วยตัวเองได้ แม้ว่าจะมีความหน่วงเวลาเพิ่มขึ้นก็ตาม

บริบทเชิงกลยุทธ์

การเปิดตัว Qwen 3 เกิดขึ้นท่ามกลางการแข่งขันที่เข้มข้นในภาคส่วน AI ของจีน ซึ่งได้รับแรงผลักดันจากความสำเร็จอย่างก้าวกระโดดของบริษัทสตาร์ทอัพท้องถิ่น DeepSeek ในช่วงต้นปีนี้ โมเดล AI ที่มีประสิทธิภาพสูงและคุ้มต้นทุนของ DeepSeek ได้กระตุ้นให้ผู้เล่นรายใหญ่ เช่น Baidu เร่งพัฒนา AI ของตน โดยเปิดตัวโมเดลขั้นสูง เช่น Ernie 4.5 Turbo และ Ernie X1 Turbo ที่ได้รับการปรับให้เหมาะสมสำหรับการใช้เหตุผล

Qwen 3 ของ Alibaba ยังคงแข่งขันกับ DeepSeek โดยก่อนหน้านี้ได้เปิดตัว Qwen 2.5-Max ไม่นานหลังจาก DeepSeek ประสบความสำเร็จ นวัตกรรมที่รวดเร็วนี้ตอกย้ำการแข่งขันด้าน AI ที่เข้มข้นขึ้นระหว่างบริษัทเทคโนโลยียักษ์ใหญ่ของจีน

ผลกระทบระดับโลกของ Qwen 3

ซีรีส์ Qwen ของ Alibaba มีบทบาทสำคัญในการเปลี่ยนกลยุทธ์ของบริษัทไปสู่ ​​AI ซึ่งช่วยฟื้นฟูบริษัทหลังจากเผชิญกับความท้าทายด้านกฎระเบียบและแรงกดดันจากตลาดในช่วงไม่กี่ปีที่ผ่านมา ภายใต้การนำของ Eddie Wu ซีอีโอ Alibaba ได้เสริมสร้างวิสัยทัศน์ด้าน AI โดยจัดสรรทรัพยากรใหม่และขายสินทรัพย์ที่ไม่ใช่เชิงกลยุทธ์เพื่อมุ่งเน้นไปที่การพัฒนา AI

การเปิดตัว Qwen 3 ไม่เพียงแต่แสดงถึงความมุ่งมั่นของ Alibaba ที่มีต่อนวัตกรรม AI เท่านั้น แต่ยังเน้นย้ำถึงแนวโน้มที่กว้างขึ้นของบริษัทเทคโนโลยียักษ์ใหญ่ของจีนที่แข่งขันกันเพื่อครองความได้เปรียบในภาคส่วน AI ด้วย AI เริ่มเข้ามามีบทบาทในอุตสาหกรรมต่างๆ มากขึ้น การพัฒนาในภูมิทัศน์ของ AI ของจีนจึงมีแนวโน้มที่จะส่งผลกระทบในระดับโลก

เริ่มต้นใช้งาน

นักพัฒนาสามารถเข้าถึงได้ คเวน 3 API ผ่าน โคเมทเอพีไอในการเริ่มต้น ให้สำรวจความสามารถของโมเดลใน Playground และดู คู่มือ API สำหรับคำแนะนำโดยละเอียด โปรดทราบว่านักพัฒนาบางคนอาจจำเป็นต้องตรวจสอบองค์กรของตนก่อนใช้โมเดลนี้

อ่านเพิ่มเติม

500+ โมเดลใน API เดียว

ลดราคาสูงสุด 20%