API Hunyuan3D 2.0

CometAPI
AnnaAug 17, 2025
API Hunyuan3D 2.0

Hunyuan3D 2.0 est le système avancé d'IA générative 3D à grande échelle de Tencent. S'appuyant sur des architectures basées sur la diffusion, il transforme des descriptions textuelles ou des images en ressources 3D extrêmement détaillées (maillages enrichis de textures de haute qualité) via un pipeline en deux étapes. génération de formes et synthèse de texture.

Principales caractéristiques (ce qu'il fait)

  • Génération en deux étapes : découple géométrie (maille nue) de synthèse de texture (UV maps / PBR textures), améliorant le contrôle et la qualité.
  • Modes conditionnés par l'image et par le texte : accepte images à vue unique ou multiple et/ou invites textuelles pour guider la forme et la texture.
  • Textures haute résolution : prend en charge les sorties de texture volumineuses (configurations pour les workflows 2K–6K+) et les étapes SR/d'amélioration. Mots clés: résolution de texture, super-résolution, cuisson.

Détails techniques

  • Générateur de formes (Hunyuan3D-DiT): un module de style transformateur de diffusion formé pour produire de la géométrie (représentations octree / de type octree ou en treillis selon la version), optimisé pour aligner la géométrie avec une image de conditionnement ou une invite de texte.
  • Synthétiseur de texture (Hunyuan3D-Paint / synthétiseur PBR): un deuxième modèle qui génère des atlas de textures mappés UV avec rendu basé sur la physique sorties (albédo, rugosité, cartes métalliques) afin que les ressources générées soient immédiatement utilisables dans les moteurs de rendu et les moteurs de jeu.
  • Décodage et résolution: les versions ultérieures augmentent la résolution géométrique (par exemple, une résolution octree/lattice plus élevée) et les tailles de texture (les paramètres communautaires courants produisent jusqu'à plusieurs k textures pour l'exportation).
  • Mise à l'échelle et tailles des modèles: Les rapports v2.5 indiquent une mise à l'échelle considérable (nombre de paramètres et échelle de l'ensemble de données) de 2.0 à 2.5 pour améliorer la précision de la géométrie et la fidélité de la texture.
  • Mises à niveau Hunyuan3D-2.5 : TREILLIS (paramètres 10B max) pour une géométrie plus nette et plus propre ; Pipeline de textures PBR avec une amélioration vues multiples cohérence ; textures de classe 4K signalées dans les notes de la communauté.

Calcul et VRAM : notes de pension de référence ~6 Go de VRAM pour la génération de formes et ~ 16 Go pour une inférence complète de forme et de texture (GPU de bureau typiques).

Performances de référence (v2.0 vs autres)

ModèleCMMD ⬇FID_CLIP ⬇FID ⬇CLIP-score ⬆
Top Open Source3.59154.639289.2870.787
Top Source fermée 13.60055.866305.9220.779
Source fermée 23.36849.744294.6280.806
Source fermée 33.21851.574295.6910.799
Hunyuan3D 2.03.19349.165282.4290.809

Les résultats confirment une supériorité notable en termes de détails géométriques et de réalisme des textures.

Cas d'usage

  • Modes d'entrée: Texte vers 3D, Image vers 3D, Entrée multi-vues (dans les versions avancées).
  • Sortie:Maillage haute résolution + textures de haute qualité (PBR dans les versions ultérieures).

Prototypage de jeux et pipelines d'actifs : concept rapide → délai d'exécution du maillage texturé ; réduit le temps d'itération de l'artiste pour les accessoires/personnages. Mots clés: prototypage, ressources de jeu.

AR/VR / production virtuelle : Les textures PBR + les exportations compatibles avec le moteur permettent une intégration rapide dans des scènes interactives et une prévisualisation. Mots clés: AR/VR, PBR, prêt pour le moteur.

Architecture et visualisation de produits : prototypes 3D stylisés ou réalistes à partir de croquis ou d'images d'ambiance. Mots clés: visualisation, itération rapide.

Éducation / outils créatifs : un moyen accessible d'enseigner les concepts 3D et de permettre aux créateurs de générer des maillages de base pour le raffinement. Mots clés: Éducation, outils créatifs. (Exemples et tutoriels communautaires.)


Limites et défis

  • Densité du maillage:Un nombre élevé de triangles (jusqu'à environ 600 XNUMX) nécessite une retopologie pour les pipelines de production.
  • Les détails de texture:Les détails fins (par exemple les tissus) peuvent être flous lorsque la résolution d'entrée est faible.
  • Restrictions régionales:Les préoccupations liées à l'UE/au RGPD limitent l'utilisation ; des versions conformes sont en cours de réalisation.
  • Incohérence des coutures et de l'éclairage : la cuisson de texture peut produire coutures ou artefacts d'éclairage, en particulier avec des entrées d'image unique ; les entrées multi-vues et SR/inpainting atténuent mais n'éliminent pas ces problèmes.
  • Sensibilité à l'invite/au conditionnement :** comme avec d'autres modèles génératifs, formulation rapide et cadrage des entrées affecter considérablement les résultats ; les cas limites et les contraintes géométriques fines peuvent nécessiter un raffinement itératif.

Comment appeler Hunyuan3D API de CometAPI

Hunyuan3D-2 Tarification de l'API dans CometAPI, 20 % de réduction sur le prix officiel :

Prix$0.08000

Étapes requises

  • Se connecter à cometapi.comSi vous n'êtes pas encore notre utilisateur, veuillez d'abord vous inscrire
  • Obtenez la clé API d'accès à l'interface. Cliquez sur « Ajouter un jeton » au niveau du jeton API dans l'espace personnel, récupérez la clé : sk-xxxxx et validez.
  • Obtenez l'URL de ce site : https://api.cometapi.com/

Utiliser la méthode

  1. Sélectionnez l'option "Hunyuan3D-2Point de terminaison pour envoyer la requête API et définir le corps de la requête. La méthode et le corps de la requête sont disponibles dans la documentation API de notre site web. Notre site web propose également le test Apifox pour plus de commodité.
  2. Remplacer avec votre clé CometAPI réelle de votre compte.
  3. Insérez votre question ou demande dans le champ de contenu : c'est à cela que le modèle répondra.
  4. Traitez la réponse de l'API pour obtenir la réponse générée.

CometAPI fournit une API REST entièrement compatible, pour une migration fluide. Informations clés  API doc:

curl --location 
--request POST 'https://api.cometapi.com/v1/images/generations' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
En savoir plus

500+ Modèles en Une API

Jusqu'à 20% de réduction