Hunyuan3D 2.0 ialah sistem AI generatif 3D berskala besar Tencent yang termaju. Memanfaatkan seni bina berasaskan resapan, ia mengubah perihalan teks atau imej kepada aset 3D yang sangat terperinci—jaringan yang diperkaya dengan tekstur berkualiti tinggi—melalui saluran paip dua peringkat penjanaan bentuk and sintesis tekstur.
Ciri utama (apa yang dilakukannya)
- Generasi dua peringkat: decouple geometri (jaring kosong) daripada sintesis tekstur (Peta UV / tekstur PBR), meningkatkan kawalan dan kualiti.
- Mod berhawa imej dan berhawa teks: menerima imej tunggal atau berbilang paparan dan / atau gesaan teks untuk membimbing bentuk dan tekstur.
- Tekstur resolusi tinggi: menyokong output tekstur yang besar (konfigurasi untuk aliran kerja 2K–6K+) dan langkah SR/peningkatan. Kata kunci: resolusi tekstur, resolusi super, penaik.
Butiran Teknikal
- Penjana bentuk (Hunyuan3D-DiT): modul gaya pengubah resapan yang dilatih untuk menghasilkan geometri (perwakilan octre / octree-like atau lattice bergantung pada versi), dioptimumkan untuk menjajarkan geometri dengan imej pelaziman atau gesaan teks.
- Pensintesis tekstur (Pensintesis Hunyuan3D-Paint / PBR): model kedua yang menjana atlas tekstur dipetakan UV dengan rendering berasaskan fizikal output (albedo, kekasaran, peta logam) jadi aset yang dijana boleh digunakan serta-merta dalam pemapar dan enjin permainan.
- Penyahkodan & resolusi: versi kemudian meningkatkan resolusi geometri (cth, resolusi oktre/kekisi yang lebih tinggi) dan saiz tekstur (tetapan komuniti biasa menghasilkan tekstur berbilang k untuk eksport).
- Penskalaan & saiz model: Pelaporan v2.5 menunjukkan skala yang besar (kiraan parameter dan skala set data) daripada 2.0 hingga 2.5 untuk meningkatkan ketepatan geometri dan kesetiaan tekstur.
- Peningkatan Hunyuan3D-2.5: KEKISI (Parameter maksimum 10B) untuk geometri yang lebih tajam dan bersih; Saluran paip tekstur PBR dengan bertambah baik pelbagai pandangan ketekalan; Tekstur kelas 4K dilaporkan dalam nota komuniti.
Pengiraan & VRAM: nota repo rujukan ~6 GB VRAM untuk penjanaan bentuk dan ~16GB untuk inferens bentuk+tekstur penuh (GPU desktop biasa).
Prestasi Penanda Aras (v2.0 lwn Lain-lain)
| model | CMMD ⬇ | FID_CLIP ⬇ | FID ⬇ | CLIP-skor ⬆ |
|---|---|---|---|---|
| Sumber Terbuka Teratas | 3.591 | 54.639 | 289.287 | 0.787 |
| Sumber Tertutup Teratas 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| Sumber tertutup 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| Sumber tertutup 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| Hunyuan3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
Keputusan mengesahkan keunggulan ketara dalam perincian geometri dan realisme tekstur.
Gunakan Kes
- Mod Input: Teks-ke-3D, Imej-ke-3D, Input berbilang paparan (dalam versi lanjutan).
- Output: Mesh resolusi tinggi + tekstur berkualiti tinggi (PBR dalam versi kemudian).
Prototaip permainan & saluran paip aset: konsep pantas → pemulihan jaringan bertekstur; mengurangkan masa lelaran artis untuk prop/watak. Kata kunci: prototaip, aset permainan.
AR/VR / pengeluaran maya: Tekstur PBR + eksport serasi enjin membolehkan penyepaduan pantas ke dalam adegan interaktif dan pravisualisasi. Kata kunci: AR/VR, PBR, sedia enjin.
Seni bina & visualisasi produk: prototaip 3D yang digayakan atau realistik daripada lakaran atau imej mood. Kata kunci: visualisasi, lelaran pantas.
Pendidikan / alatan kreatif: cara yang boleh diakses untuk mengajar konsep 3D dan membenarkan pencipta menghasilkan jejaring asas untuk diperhalusi. Kata kunci: pendidikan, alat kreatif. (Contoh dan tutorial komuniti.)
Had & Cabaran
- Ketumpatan Mesh: Kiraan segi tiga tinggi (sehingga ~600k) memerlukan retopologi untuk saluran paip pengeluaran.
- Butiran Tekstur: Butiran halus (cth fabrik) mungkin kabur apabila resolusi input rendah.
- Sekatan Wilayah: EU/GDPR membimbangkan penggunaan had; versi patuh sedang dijalankan.
- Jahitan & pencahayaan tidak konsisten: tekstur baking boleh menghasilkan jahitan atau artifak pencahayaan, terutamanya dengan input imej tunggal; input berbilang paparan dan SR/inpainting mengurangkan tetapi tidak menghapuskan isu ini.
- Kepekaan segera/kondisi:** seperti model generatif lain, frasa pantas dan pembingkaian input menjejaskan keputusan dengan ketara; kes tepi dan kekangan geometri yang halus mungkin memerlukan penghalusan berulang.
Bagaimana hendak memanggil Hunyuan3D API daripada CometAPI
Hunyuan3D-2 Harga API dalam CometAPI,diskaun 20% daripada harga rasmi:
| Harga | $0.08000 |
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan url tapak ini: https://api.cometapi.com/
Gunakan Kaedah
- Pilih "
Hunyuan3D-2” titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda. - Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada Dokumen API:
- Titik Akhir: https://api.cometapi.com/v1/images/generations
- Parameter Model:
Hunyuan3D-2 - Pengesahan:
Bearer YOUR_CometAPI_API_KEY - Jenis kandungan:
application/json.
curl --location
--request POST 'https://api.cometapi.com/v1/images/generations' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
