Hunyuan3D 2.0 คือระบบ AI 3D ขนาดใหญ่ขั้นสูงของ Tencent ที่ใช้สถาปัตยกรรมแบบกระจาย ระบบนี้แปลงคำอธิบายข้อความหรือรูปภาพให้เป็นทรัพยากร 3 มิติที่มีรายละเอียดสูง ซึ่งเป็นตาข่ายที่เสริมด้วยพื้นผิวคุณภาพสูง ผ่านกระบวนการสองขั้นตอน การสร้างรูปร่าง และ การสังเคราะห์พื้นผิว.
คุณสมบัติหลัก (สิ่งที่ทำ)
- การสร้างสองขั้นตอน: แยก เรขาคณิต (ตาข่ายเปล่า) จาก การสังเคราะห์พื้นผิว (แผนที่ UV / พื้นผิว PBR) ปรับปรุงการควบคุมและคุณภาพ
- โหมดปรับสภาพภาพและโหมดปรับสภาพข้อความ: ยอมรับ ภาพมุมมองเดียวหรือหลายมุมมอง และ / หรือ ข้อความแจ้ง เพื่อนำทางรูปทรงและพื้นผิว
- พื้นผิวที่มีความละเอียดสูง: รองรับเอาท์พุตพื้นผิวขนาดใหญ่ (การกำหนดค่าสำหรับเวิร์กโฟลว์ 2K–6K+) และขั้นตอน SR/การปรับปรุง คำสำคัญ: ความละเอียดพื้นผิว, ความละเอียดสูงสุด, การอบ.
รายละเอียดทางเทคนิค
- เครื่องกำเนิดรูปร่าง (Hunyuan3D-DiT):โมดูลสไตล์หม้อแปลงแพร่กระจายที่ได้รับการฝึกฝนให้สร้างรูปทรงเรขาคณิต (การแสดงภาพแบบอ็อกทรี / แบบอ็อกทรี หรือแบบโครงตาข่าย ขึ้นอยู่กับเวอร์ชัน) ได้รับการปรับให้เหมาะสมเพื่อจัดตำแหน่งรูปทรงเรขาคณิตให้ตรงกับรูปภาพปรับสภาพหรือข้อความแจ้งเตือน
- เครื่องสังเคราะห์พื้นผิว (Hunyuan3D-Paint / PBR synthesizer):โมเดลที่สองที่สร้างแผนที่พื้นผิว UV ด้วย การเรนเดอร์ตามหลักฟิสิกส์ เอาท์พุต (ค่าการสะท้อนแสง ความหยาบ แผนที่โลหะ) เพื่อให้ทรัพยากรที่สร้างขึ้นสามารถใช้งานได้ทันทีในโปรแกรมเรนเดอร์และเอนจิ้นเกม
- การถอดรหัสและความละเอียด:เวอร์ชันหลังๆ จะเพิ่มความละเอียดทางเรขาคณิต (เช่น ความละเอียดอ็อกทรี/แลตทิซที่สูงขึ้น) และขนาดพื้นผิว (การตั้งค่าชุมชนทั่วไปจะสร้างพื้นผิวแบบมัลติเคสำหรับการส่งออกได้)
- การปรับขนาดและขนาดโมเดล:การรายงาน v2.5 ระบุถึงการขยายขนาดอย่างมาก (จำนวนพารามิเตอร์และขนาดชุดข้อมูล) จาก 2.0 เป็น 2.5 เพื่อปรับปรุงความแม่นยำของรูปทรงเรขาคณิตและความเที่ยงตรงของพื้นผิว
- การอัพเกรด Hunyuan3D-2.5: ตาข่าย (พารามิเตอร์สูงสุด 10B) เพื่อรูปทรงที่คมชัดและสะอาดยิ่งขึ้น ท่อส่งพื้นผิว PBR ด้วยการปรับปรุง หลายมุมมอง ความสม่ำเสมอ พื้นผิวระดับ 4K มีรายงานอยู่ในบันทึกชุมชน
การคำนวณและ VRAM: บันทึกอ้างอิง ~แรม 6GB เพื่อการสร้างรูปร่างและ ~ 16 กิกะไบต์ สำหรับการอนุมานรูปร่างและพื้นผิวแบบเต็มรูปแบบ (GPU เดสก์ท็อปทั่วไป)
ประสิทธิภาพมาตรฐาน (v2.0 เทียบกับรุ่นอื่น)
| รุ่น | CMMD ⬇ | FID_คลิป ⬇ | เอฟไอดี ⬇ | คะแนน CLIP ⬆ |
|---|---|---|---|---|
| โอเพ่นซอร์สชั้นนำ | 3.591 | 54.639 | 289.287 | 0.787 |
| ท็อป โคลด์ซอร์ส 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| แหล่งปิด 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| แหล่งปิด 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| ฮันหยวน3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
ผลลัพธ์ยืนยันถึงความเหนือกว่าอย่างเห็นได้ชัดในรายละเอียดทางเรขาคณิตและความสมจริงของพื้นผิว
ใช้กรณี
- โหมดอินพุต:การแปลงข้อความเป็น 3 มิติ, การแปลงรูปภาพเป็น 3 มิติ, อินพุตมุมมองหลายมุม (ในเวอร์ชันขั้นสูง)
- Outputs:ตาข่ายความละเอียดสูง + พื้นผิวคุณภาพสูง (PBR ในเวอร์ชันหลังๆ)
การสร้างต้นแบบเกมและกระบวนการทรัพยากร: แนวคิดที่รวดเร็ว → การเปลี่ยนแปลงตาข่ายที่มีพื้นผิว ลดเวลาการทำซ้ำของศิลปินสำหรับอุปกรณ์ประกอบฉาก/ตัวละคร คำสำคัญ: การสร้างต้นแบบ สินทรัพย์เกม
AR/VR / การผลิตเสมือนจริง: พื้นผิว PBR + การส่งออกที่เข้ากันได้กับเอ็นจิ้นช่วยให้บูรณาการเข้ากับฉากโต้ตอบและการสร้างภาพล่วงหน้าได้อย่างรวดเร็ว คำสำคัญ: AR/VR, PBR, พร้อมเครื่องยนต์
สถาปัตยกรรมและการแสดงภาพผลิตภัณฑ์: ต้นแบบสามมิติแบบมีสไตล์หรือสมจริงจากภาพร่างหรือภาพอารมณ์ คำสำคัญ: การสร้างภาพ การวนซ้ำอย่างรวดเร็ว
การศึกษา / เครื่องมือสร้างสรรค์: วิธีการที่เข้าถึงได้ในการสอนแนวคิด 3 มิติและให้ผู้สร้างสร้างตาข่ายพื้นฐานสำหรับการปรับปรุง คำสำคัญ: การศึกษา เครื่องมือสร้างสรรค์ (ตัวอย่างและบทช่วยสอนจากชุมชน)
ข้อจำกัดและความท้าทาย
- ความหนาแน่นของตาข่าย:จำนวนสามเหลี่ยมสูง (สูงสุด ~600) ต้องใช้โครงสร้างใหม่สำหรับท่อการผลิต
- รายละเอียดพื้นผิว:รายละเอียดเล็กๆ น้อยๆ (เช่น ผ้า) อาจเบลอเมื่อความละเอียดอินพุตต่ำ
- ข้อจำกัดของภูมิภาค:EU/GDPR กังวลเกี่ยวกับการจำกัดการใช้งาน; เวอร์ชันที่สอดคล้องอยู่ระหว่างดำเนินการ
- ตะเข็บและแสงไม่สม่ำเสมอ: การอบเนื้อสัมผัสสามารถผลิตได้ รอยตะเข็บหรือสิ่งประดิษฐ์แสงสว่างโดยเฉพาะอย่างยิ่งกับอินพุตภาพเดียว อินพุตมุมมองหลายมุมและ SR/การลงสีใหม่จะบรรเทาปัญหาเหล่านี้ แต่ไม่ได้ขจัดออกไป
- ความไวในการกระตุ้น/ปรับสภาพ:** เช่นเดียวกับโมเดลการกำเนิดอื่น ๆ การกำหนดวลีพร้อมท์และการจัดกรอบอินพุต ส่งผลต่อผลลัพธ์อย่างมีนัยสำคัญ กรณีขอบและข้อจำกัดทางเรขาคณิตที่ละเอียดอ่อนอาจต้องมีการปรับปรุงซ้ำๆ
วิธีการโทร Hunyuan3D API จาก CometAPI
Hunyuan3D-2 ราคา API ใน CometAPI ลด 20% จากราคาอย่างเป็นทางการ:
| ราคา | $0.08000 |
ขั้นตอนที่ต้องดำเนินการ
- เข้าสู่ระบบเพื่อ โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึงของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับรหัสโทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
ใช้วิธีการ
- เลือก“
Hunyuan3D-2” จุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอได้รับจากเอกสาร API ของเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย - แทนที่ ด้วยคีย์ CometAPI จริงจากบัญชีของคุณ
- แทรกคำถามหรือคำขอของคุณลงในช่องเนื้อหา—นี่คือสิ่งที่โมเดลจะตอบสนอง
- ประมวลผลการตอบสนองของ API เพื่อรับคำตอบที่สร้างขึ้น
CometAPI มอบ REST API ที่เข้ากันได้อย่างสมบูรณ์ เพื่อการย้ายข้อมูลที่ราบรื่น รายละเอียดสำคัญ เอกสาร API:
- ปลายทาง: https://api.cometapi.com/v1/images/generations
- พารามิเตอร์รุ่น:
Hunyuan3D-2 - รับรองความถูกต้อง:
Bearer YOUR_CometAPI_API_KEY - ชนิดของเนื้อหา:
application/json.
curl --location
--request POST 'https://api.cometapi.com/v1/images/generations' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
