Hunyuan3D 2.0 é o sistema avançado de IA generativa 3D em larga escala da Tencent. Aproveitando arquiteturas baseadas em difusão, ele transforma descrições de texto ou imagens em ativos 3D ricos em detalhes — malhas enriquecidas com texturas de alta qualidade — por meio de um pipeline de dois estágios. geração de formas e síntese de textura.
Principais recursos (o que faz)
- Geração de dois estágios: desacopla geometria (malha nua) de síntese de textura (mapas UV / texturas PBR), melhorando o controle e a qualidade.
- Modos condicionados por imagem e por texto: aceita imagens de visualização única ou múltipla e / ou prompts de texto para orientar a forma e a textura.
- Texturas de alta resolução: suporta grandes saídas de textura (configurações para fluxos de trabalho de 2K a 6K+) e etapas de SR/aprimoramento. Palavras-chave: resolução de textura, super-resolução, cozimento.
Detalhes Técnicos
- Gerador de forma (Hunyuan3D-DiT): um módulo estilo transformador de difusão treinado para produzir geometria (octree/octree-like ou representações em treliça, dependendo da versão), otimizado para alinhar a geometria com uma imagem de condicionamento ou prompt de texto.
- Sintetizador de textura (sintetizador Hunyuan3D-Paint / PBR): um segundo modelo que gera atlas de textura mapeados em UV com renderização com base física saídas (albedo, rugosidade, mapas metálicos) para que os ativos gerados sejam imediatamente utilizáveis em renderizadores e mecanismos de jogo.
- Decodificação e resolução: versões posteriores aumentam a resolução geométrica (por exemplo, maior resolução de octree/lattice) e tamanhos de textura (configurações comuns da comunidade produzem texturas de até multi-k para exportação).
- Dimensionamento e tamanhos de modelos: Os relatórios da versão 2.5 indicam um aumento considerável (contagens de parâmetros e escala do conjunto de dados) de 2.0 para 2.5 para melhorar a precisão da geometria e a fidelidade da textura.
- Atualizações do Hunyuan3D-2.5: REDE (máximo de 10B parâmetros) para uma geometria mais nítida e limpa; Pipeline de textura PBR com melhorado multi-visualização consistência; texturas de classe 4K relatadas em notas da comunidade.
Computação e VRAM: notas de repositório de referência ~6 GB de VRAM para geração de formas e ~ 16 GB para inferência completa de forma+textura (GPUs típicas de desktop).
Desempenho de referência (v2.0 vs outros)
| Modelo | CMMD ⬇ | CLIPE_FID ⬇ | FID ⬇ | Pontuação do CLIP ⬆ |
|---|---|---|---|---|
| Topo de código aberto | 3.591 | 54.639 | 289.287 | 0.787 |
| Topo de código fechado 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| Código fechado 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| Código fechado 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| Hunyuan3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
Os resultados confirmam notável superioridade em detalhes geométricos e realismo de textura.
Casos de uso
- Modos de entrada: Texto para 3D, imagem para 3D, entrada de múltiplas visualizações (em versões avançadas).
- Saídas: Malha de alta resolução + texturas de alta qualidade (PBR em versões posteriores).
Prototipagem de jogos e pipelines de ativos: conceito rápido → transformação de malha texturizada; reduz o tempo de iteração do artista para adereços/personagens. Palavras-chave: prototipagem, recursos do jogo.
AR/VR / produção virtual: Texturas PBR + exportações compatíveis com mecanismos permitem rápida integração em cenas interativas e pré-visualização. Palavras-chave: AR/VR, PBR, pronto para motor.
Arquitetura e visualização do produto: protótipos 3D estilizados ou realistas a partir de esboços ou imagens de humor. Palavras-chave: visualização, iteração rápida.
Educação / ferramentas criativas: maneira acessível de ensinar conceitos 3D e permitir que os criadores gerem malhas de base para refinamento. Palavras-chave: educação, ferramentas criativas. (Exemplos e tutoriais da comunidade.)
Limitações e Desafios
- Densidade de malha: Contagens altas de triângulos (até ~600k) exigem retopologia para pipelines de produção.
- Detalhe de textura: Detalhes finos (por exemplo, tecidos) podem ficar borrados quando a resolução de entrada é baixa.
- Restrições de região: Preocupações com a UE/GDPR limitam o uso; versões compatíveis estão em andamento.
- Inconsistência de costuras e iluminação: a textura que o cozimento pode produzir costuras ou artefatos de iluminação, especialmente com entradas de imagem única; entradas de múltiplas visualizações e SR/pintura atenuam, mas não eliminam esses problemas.
- Sensibilidade imediata/condicional:** como em outros modelos generativos, fraseado rápido e enquadramento de entrada afetam substancialmente os resultados; casos extremos e restrições geométricas finas podem precisar de refinamento iterativo.
Como ligar Hunyuan3D API da CometAPI
Hunyuan3D-2 Preços da API no CometAPI, 20% de desconto sobre o preço oficial:
| Preço | $0.08000 |
Etapas Necessárias
- Faça o login no cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro
- Obtenha a chave de API da credencial de acesso da interface. Clique em "Adicionar Token" no token da API no centro pessoal, obtenha a chave de token: sk-xxxxx e envie.
- Obtenha a URL deste site: https://api.cometapi.com/
Use o método
- Selecione a opção "
Hunyuan3D-2” endpoint para enviar a solicitação de API e definir o corpo da solicitação. O método e o corpo da solicitação são obtidos da documentação da API do nosso site. Nosso site também oferece o teste Apifox para sua conveniência. - Substituir com sua chave CometAPI real da sua conta.
- Insira sua pergunta ou solicitação no campo de conteúdo — é a isso que o modelo responderá.
- . Processe a resposta da API para obter a resposta gerada.
A CometAPI fornece uma API REST totalmente compatível — para uma migração perfeita. Detalhes importantes para Doc API:
- Endpoint: https://api.cometapi.com/v1/images/generations
- Parâmetro do modelo:
Hunyuan3D-2 - Autenticação:
Bearer YOUR_CometAPI_API_KEY - Tipo de conteúdo:
application/json.
curl --location
--request POST 'https://api.cometapi.com/v1/images/generations' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
