Hunyuan3D 2.0 هو نظام الذكاء الاصطناعي التوليدي ثلاثي الأبعاد المتطور واسع النطاق من Tencent. مستفيدًا من هياكل قائمة على الانتشار، يُحوّل النظام أوصاف النصوص أو الصور إلى أصول ثلاثية الأبعاد غنية بالتفاصيل - شبكات غنية بنسيج عالي الجودة - عبر خط أنابيب من مرحلتين. توليد الشكل و تركيب الملمس.
الميزات الرئيسية (ما تفعله)
- الجيل ذو المرحلتين: يفصل علم الهندسة (شبكة عارية) من تركيب الملمس (خرائط الأشعة فوق البنفسجية / نسيج PBR)، وتحسين التحكم والجودة.
- الأوضاع المشروطة بالصورة والنص: يقبل صور ذات عرض واحد أو متعدد و / أو المطالبات النصية لتوجيه الشكل والملمس.
- القوام عالية الدقة: يدعم مخرجات الملمس الكبيرة (تكوينات لتدفقات العمل 2K–6K+) وخطوات SR/التحسين. : الكلمات المفتاحية دقة الملمس، الدقة الفائقة، الخبز.
التفاصيل الفنية
- مولد الشكل (Hunyuan3D-DiT): وحدة نمطية من نوع محول الانتشار تم تدريبها لإنتاج الهندسة (تمثيلات شجرة الثماني / مثل شجرة الثماني أو الشبكة اعتمادًا على الإصدار)، تم تحسينها لمواءمة الهندسة مع صورة التكييف أو موجه النص.
- مُركِّب الملمس (مُركِّب Hunyuan3D-Paint / PBR): نموذج ثانٍ يُنشئ أطالس نسيجية مرسومة بالأشعة فوق البنفسجية مع العرض القائم على المادية المخرجات (البياض، الخشونة، الخرائط المعدنية) بحيث تكون الأصول المولدة قابلة للاستخدام على الفور في برامج العرض ومحركات الألعاب.
- فك التشفير والحل: الإصدارات الأحدث ترفع الدقة الهندسية (على سبيل المثال، دقة شجرة الثماني/الشبكة الأعلى) وأحجام الملمس (إعدادات المجتمع العامة تنتج ما يصل إلى عدة k من الملمس للتصدير).
- القياس وأحجام النماذج:يشير تقرير الإصدار v2.5 إلى زيادة كبيرة في الحجم (عدد المعلمات ومقياس مجموعة البيانات) من 2.0 إلى 2.5 لتحسين دقة الهندسة ودقة الملمس.
- ترقيات Hunyuan3D-2.5: بنية (10B معلمات كحد أقصى) للحصول على هندسة أكثر وضوحًا ونظافة؛ خط أنابيب نسيج PBR مع تحسن متعدد العرض الاتساق؛ تم الإبلاغ عن القوام من فئة 4K في ملاحظات المجتمع.
الحوسبة و VRAM: ملاحظات مستودع مرجعية ~6 جيجا بايت من ذاكرة الفيديو لتوليد الشكل و ~ شنومك غيغابايت لاستنتاج الشكل والملمس الكامل (وحدات معالجة الرسومات المكتبية النموذجية).
أداء معياري (الإصدار 2.0 مقابل الإصدارات الأخرى)
| الموديل | CMMD ⬇ | FID_CLIP ⬇ | FID ⬇ | نتيجة كليب ⬆ |
|---|---|---|---|---|
| أفضل البرامج مفتوحة المصدر | 3.591 | 54.639 | 289.287 | 0.787 |
| أعلى مصدر مغلق 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| مغلق المصدر 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| مغلق المصدر 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| هونيوان3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
وتؤكد النتائج التفوق الملحوظ في التفاصيل الهندسية وواقعية الملمس.
استخدم حالات
- أوضاع الإدخال:النص إلى ثلاثي الأبعاد، والصورة إلى ثلاثي الأبعاد، والإدخال متعدد العرض (في الإصدارات المتقدمة).
- النواتج:شبكة عالية الدقة + نسيج عالي الجودة (PBR في الإصدارات الأحدث).
النمذجة الأولية للعبة وخطوط الأنابيب للأصول: مفهوم سريع → تحول الشبكة المحببة؛ يقلل من وقت تكرار الفنان للدعامات/الشخصيات. : الكلمات المفتاحية النمذجة الأولية وأصول اللعبة.
AR/VR/الإنتاج الافتراضي: تتيح لك قوام PBR + الصادرات المتوافقة مع المحرك التكامل السريع في المشاهد التفاعلية والتصور المسبق. : الكلمات المفتاحية AR/VR، PBR، جاهز للمحرك.
الهندسة المعمارية وتصور المنتج: نماذج ثلاثية الأبعاد منمقة أو واقعية من الرسومات أو الصور المزاجية. : الكلمات المفتاحية التصور والتكرار السريع.
التعليم / الأدوات الإبداعية: طريقة سهلة لتعليم المفاهيم ثلاثية الأبعاد وتمكين المبدعين من إنشاء شبكات أساسية لتحسينها. : الكلمات المفتاحية التعليم، الأدوات الإبداعية. (أمثلة مجتمعية ودروس تعليمية.)
القيود والتحديات
- كثافة الشبكة:تتطلب أعداد المثلثات العالية (حتى ~600 ألف) إعادة الطوبولوجيا لأنابيب الإنتاج.
- تفاصيل الملمس:قد تصبح التفاصيل الدقيقة (مثل الأقمشة) غير واضحة عندما يكون دقة الإدخال منخفضة.
- قيود المنطقة:مخاوف الاتحاد الأوروبي/اللائحة العامة لحماية البيانات تحد من الاستخدام؛ الإصدارات المتوافقة قيد التنفيذ.
- عدم تناسق اللحامات والإضاءة: يمكن أن ينتج الخبز الملمس اللحامات أو آثار الإضاءة، خاصةً مع مدخلات الصورة الفردية؛ تعمل مدخلات العرض المتعدد والرسم المباشر/الرسم الداخلي على التخفيف من هذه المشكلات ولكنها لا تقضي عليها.
- حساسية التوجيه/التكييف:** كما هو الحال مع النماذج التوليدية الأخرى، صياغة سريعة وتأطير الإدخال تؤثر بشكل كبير على النتائج؛ قد تحتاج الحالات الحدية والقيود الهندسية الدقيقة إلى تحسين متكرر.
كيف تتصل Hunyuan3D واجهة برمجة التطبيقات من CometAPI
Hunyuan3D-2 أسعار API في CometAPI، خصم 20% من السعر الرسمي:
| السعر الأساسي | $0.08000 |
الخطوات المطلوبة
- تسجيل الدخول إلى كوميتابي.كوم. إذا لم تكن مستخدمًا لدينا بعد، فيرجى التسجيل أولاً
- احصل على مفتاح API لبيانات اعتماد الوصول للواجهة. انقر على "إضافة رمز" في رمز API في المركز الشخصي، واحصل على مفتاح الرمز: sk-xxxxx، ثم أرسله.
- احصل على عنوان URL لهذا الموقع: https://api.cometapi.com/
استخدام الطريقة
- حدد "
Hunyuan3D-2نقطة نهاية لإرسال طلب واجهة برمجة التطبيقات (API) وتعيين نص الطلب. يمكن الحصول على طريقة الطلب ونصه من وثيقة واجهة برمجة التطبيقات على موقعنا الإلكتروني. كما يوفر موقعنا اختبار Apifox لتسهيل الأمر عليك. - يستبدل باستخدام مفتاح CometAPI الفعلي الخاص بك من حسابك.
- أدخل سؤالك أو طلبك في حقل المحتوى - وهذا ما سيستجيب له النموذج.
- . قم بمعالجة استجابة API للحصول على الإجابة الناتجة.
يوفر CometAPI واجهة برمجة تطبيقات REST متوافقة تمامًا - لترحيل سلس. تفاصيل رئيسية لـ وثيقة API:
- نقطة النهاية: https://api.cometapi.com/v1/images/generations
- نموذج معلمة:
Hunyuan3D-2 - المصادقة:
Bearer YOUR_CometAPI_API_KEY - نوع المحتوى:
application/json.
curl --location
--request POST 'https://api.cometapi.com/v1/images/generations' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
