Hunyuan3D 2.0 คืออะไร?
คำจำกัดความแบบสั้น: Hunyuan3D 2.0 (*Hunyuan3D-2*) คือระบบกำเนิดแบบสองขั้นตอนขนาดใหญ่จาก Tencent สำหรับสร้างทรัพย์สิน 3D ที่มีเท็กซ์เจอร์ความละเอียดสูงจากอินพุตหลายรูปแบบ (ข้อความ, รูปภาพ 1–4 ภาพ, สเก็ตช์) ระบบแยกการสร้างรูปร่าง (Hunyuan3D-DiT / ShapeVAE) และการสังเคราะห์เท็กซ์เจอร์ (Hunyuan3D-Paint) พร้อม UI/แพลตฟอร์มการผลิต (Hunyuan3D-Studio)
คุณสมบัติหลัก
- อินพุตหลายรูปแบบ: ข้อความ→3D, รูปภาพ→3D (1–4 มุมมอง), สเก็ตช์→3D เว็บไซต์สากลและเอกสารได้ระบุโหมดเหล่านี้ไว้อย่างชัดเจน
- กระบวนทัศน์สองขั้นตอน:
- การสร้างรูปร่าง — Hunyuan3D-DiT (latent diffusion / flow-matching บนตัวแปรแฝงของ ShapeVAE) สร้างเมชเปล่า
- การสังเคราะห์เท็กซ์เจอร์ — Hunyuan3D-Paint สร้างภาพหลายมุมมองโดยมีเงื่อนไขตามเรขาคณิต; ผลลัพธ์จะถูกเบกเป็นแผนที่เท็กซ์เจอร์ความละเอียดสูง
- รูปแบบเอาต์พุตและการผสานรวม: ส่งออกเป็นฟอร์แมต 3D ทั่วไป (OBJ, GLB) และออกแบบมาให้ผสานการทำงานกับ Unity, Unreal, Blender และสายงานการผลิตมาตรฐานได้ API สำหรับองค์กรรองรับการสร้างวัสดุแบบ PBR และตัวเลือกโทโพโลยี (สามเหลี่ยม/สี่เหลี่ยม)
- คุณสมบัติการผลิต: โทโพโลยีอัจฉริยะ (เพิ่มประสิทธิภาพเมช), การทำสไตล์ low-poly, การเบกเท็กซ์เจอร์ และการรองรับแอนิเมชันในสตูดิโอ (skeletal skinning ผ่าน GNN สำหรับการรีทาร์เก็ตอย่างง่ายใน Hunyuan3D-Studio)
ประสิทธิภาพในการทดสอบเชิงเปรียบเทียบ (เมตริกที่เผยแพร่)
จากรายงานทางเทคนิค/การประเมินของ Hunyuan3D 2.0 (เมตริกตัวแทนจากตารางที่ 4 ในเอกสาร; ค่า CLIP-score ที่สูงกว่าจะดีกว่า; ค่า CMMD / FID ที่ต่ำกว่าจะดีกว่า):
| โมเดล | CMMD (↓) | FID_CLIP (↓) | FID_Inception (↓) | CLIP-score (↑) |
|---|---|---|---|---|
| Trellis (เบสไลน์แบบโอเพนซอร์ส) | 3.591 | 54.639 | 289.287 | 0.787 |
| โมเดลปิดซอร์ส 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| โมเดลปิดซอร์ส 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| โมเดลปิดซอร์ส 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| Hunyuan3D 2.0 (ของเรา) | 3.193 | 49.165 | 282.429 | 0.809 |
ผู้เขียนรายงานว่ามีรายละเอียดเรขาคณิต ความสอดคล้องกับเงื่อนไข และคุณภาพแผนที่เท็กซ์เจอร์ที่เหนือกว่า ทั้งจากเมตริกอัตโนมัติและการศึกษาผู้ใช้ 300 กรณี (ผู้เข้าร่วม 50 คน) ซึ่ง Hunyuan3D 2.0 มีผลงานดีกว่าวิธีเปรียบเทียบในด้านคุณภาพภาพและความยึดโยงกับภาพเงื่อนไข
กรณีการใช้งานในการผลิตที่พบบ่อย
- การสร้างทรัพย์สินเกม: สร้างต้นแบบอย่างรวดเร็วของพร็อพ ชิ้นส่วนฉาก เมชตัวละครหรือพร็อพทั้ง low- และ high-poly พร้อมเท็กซ์เจอร์ที่เบกแล้ว; โมดูลการทำสไตล์แบบ low-poly และการเบกเท็กซ์เจอร์ของ Hunyuan3D ผสานเข้ากับสายงานผลิตเกมได้
- อีคอมเมิร์ซ 3D / การทำภาพผลิตภัณฑ์: แปลงรูปถ่ายหรือสเก็ตช์ของสินค้าให้เป็นพรีวิวสินค้าแบบ 3D ที่หมุนได้สำหรับแคตตาล็อก
- เครื่องมือสร้างสรรค์ / สตูดิโอ: เวิร์กโฟลว์ สเก็ตช์→3D สำหรับศิลปิน, การเบก UV/เท็กซ์เจอร์อัตโนมัติ, และการวนรอบอย่างรวดเร็วสำหรับการพัฒนาลุค
- เนื้อหา AR/VR และการทำต้นแบบอย่างรวดเร็ว: สร้างทรัพย์สินสิ่งแวดล้อมหรือพร็อพสำหรับประสบการณ์เสมือนจริง จากนั้นเพิ่มประสิทธิภาพผ่านตัวทำสไตล์แบบ low-poly และโมดูลรีทาร์เก็ต/แอนิเมชัน
วิธีใช้ Hunyuan3D 2.0
ขั้นตอนที่ 1: ลงทะเบียนเพื่อรับ API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console รับ API key สิทธิ์การเข้าถึงของอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่ง
ขั้นตอนที่ 2: ส่งคำขอไปยัง Hunyuan3D 2.0 API
เลือกเอ็นด์พอยต์ “"Hunyuan3D-2"” เพื่อส่งคำขอ API และกำหนด request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมีการทดสอบผ่าน Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base URL คือ Hunyuan3D
ใส่คำขอและรูปภาพของคุณลงในช่อง content—นี่คือสิ่งที่โมเดลจะตอบสนอง ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: เรียกดูและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต