O que é o Hunyuan3D 2.0 ?
Definição breve: Hunyuan3D 2.0(*Hunyuan3D-2*) é um sistema generativo de grande escala em duas etapas da Tencent para produzir assets 3D texturizados em alta resolução a partir de entradas multimodais (texto, 1–4 imagens, esboços). O sistema separa a geração de forma (Hunyuan3D-DiT / ShapeVAE) e a síntese de textura (Hunyuan3D-Paint), além de uma UI/plataforma de produção (Hunyuan3D-Studio).
Principais recursos
- Entradas multimodais: texto‑para‑3D, imagem‑para‑3D (1–4 vistas), esboço‑para‑3D. O site global e a documentação listam explicitamente esses modos.
- Pipeline em duas etapas:
- Geração de forma — Hunyuan3D-DiT (difusão latente/flow‑matching nos latentes do ShapeVAE) produz uma malha básica.
- Síntese de textura — Hunyuan3D-Paint gera imagens multivisualizações condicionadas à geometria; as saídas são bakeadas em mapas de textura de alta resolução.
- Formatos de saída e integração: exporta formatos 3D comuns (OBJ, GLB) e foi projetado para integrar‑se ao Unity, Unreal, Blender e pipelines de produção padrão. A API corporativa oferece suporte à geração de materiais PBR e opções de topologia (triângulos/quads).
- Recursos de produção: topologia inteligente (otimização de malha), estilização low‑poly, bake de textura e suporte a animação no estúdio (skinning esquelético via GNN para retargeting simples no Hunyuan3D-Studio).
Desempenho de benchmark (métricas publicadas)
Do relatório técnico/avaliação do Hunyuan3D 2.0 (métricas representativas da Tabela 4 do artigo; CLIP‑score mais alto é melhor; métricas CMMD / FID mais baixas são melhores):
| Modelo | CMMD (↓) | FID_CLIP (↓) | FID_Inception (↓) | CLIP-score (↑) |
|---|---|---|---|---|
| Trellis (baseline de código aberto) | 3.591 | 54.639 | 289.287 | 0.787 |
| Modelo de código fechado 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| Modelo de código fechado 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| Modelo de código fechado 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| Hunyuan3D 2.0 (Nosso) | 3.193 | 49.165 | 282.429 | 0.809 |
Os autores relatam detalhes geométricos superiores, fidelidade de alinhamento à condição e qualidade dos mapas de textura em métricas automáticas e em um estudo com 300 casos (50 participantes), no qual o Hunyuan3D 2.0 superou os métodos comparativos em qualidade visual e aderência à imagem condicional.
Casos de uso de produção representativos
- Geração de assets para jogos: prototipagem rápida de props, cenários, malhas de personagens ou objetos em low e high‑poly + texturas bakeadas; o módulo de estilização low‑poly do Hunyuan3D + bake de textura se integram aos pipelines de jogos.
- E‑commerce 3D / visualização de produtos: converta fotos de produtos ou esboços em prévias 3D rotacionáveis para catálogos.
- Ferramentas / estúdios criativos: fluxos de trabalho de esboço→3D para artistas, bake automático de UV/textura e iteração rápida para look development.
- Conteúdo de AR/VR e prototipagem rápida: gere assets de ambiente ou props para experiências imersivas e, em seguida, otimize por meio do estilizador low‑poly e dos módulos de retargeting/animação.
Como usar o Hunyuan3D 2.0
Etapa 1: Cadastre-se para obter a chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Acesse seu console do CometAPI. Obtenha a chave de API de credenciais de acesso da interface. Clique em “Add Token” no token de API no centro pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API do Hunyuan3D 2.0
Selecione o endpoint “"Hunyuan3D-2"” para enviar a solicitação à API e definir o corpo da requisição. O método e o corpo da requisição são obtidos na documentação da API do nosso site. Nosso site também fornece teste no Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave real do CometAPI na sua conta. O URL base é Hunyuan3D
Insira sua solicitação e imagem no campo content — é a isso que o modelo responderá. Processe a resposta da API para obter a resposta gerada.

Etapa 3: Recuperar e verificar os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API responde com o status da tarefa e os dados de saída.