훈위안3D 2.0 API

CometAPI
AnnaAug 17, 2025
훈위안3D 2.0 API

Hunyuan3D 2.0은 텐센트의 고급 대규모 3D 생성 AI 시스템입니다. 확산 기반 아키텍처를 활용하여 텍스트 설명이나 이미지를 3단계 파이프라인을 통해 고품질 텍스처로 강화된 메시인 풍부하고 디테일이 풍부한 XNUMXD 자산으로 변환합니다. 모양 생성텍스처 합성.

주요 기능(무엇을 하는가)

  • 2단계 생성: 분리하다 기하학 (맨 메시)에서 텍스처 합성 (UV 맵/PBR 텍스처) 제어와 품질이 향상되었습니다.
  • 이미지 조건화 모드와 텍스트 조건화 모드: 받아 들인다 단일 또는 다중 뷰 이미지 및 / 또는 텍스트 프롬프트 모양과 질감을 안내합니다.
  • 고해상도 텍스처: 대용량 텍스처 출력(2K~6K+ 워크플로 구성)과 SR/향상 단계를 지원합니다. 키워드 : 텍스처 해상도, 초고해상도, 베이킹.

기술적인 세부 사항

  • 형상 생성기(Hunyuan3D-DiT): 기하학(버전에 따라 옥트리/옥트리 유사 또는 격자 표현)을 생성하도록 훈련된 확산 변환기 스타일 모듈로, 기하학을 조건 이미지나 텍스트 프롬프트에 맞춰 정렬하도록 최적화되었습니다.
  • 텍스처 합성기(Hunyuan3D-Paint / PBR 합성기): UV 매핑된 텍스처 아틀라스를 생성하는 두 번째 모델 물리 기반 렌더링 출력(알베도, 거칠기, 금속성 맵)을 제공하므로 생성된 자산은 렌더러와 게임 엔진에서 즉시 사용할 수 있습니다.
  • 디코딩 및 해상도: 이후 버전에서는 기하학적 해상도(예: 더 높은 옥트리/격자 해상도)와 텍스처 크기가 높아졌습니다(일반 커뮤니티 설정에서는 최대 멀티-k 텍스처를 내보내도록 생성).
  • 스케일링 및 모델 크기: v2.5 보고에서는 기하학적 정밀도와 텍스처 충실도를 개선하기 위해 2.0에서 2.5로 상당한 규모 확장(매개변수 수 및 데이터 세트 규모)이 이루어졌음을 나타냅니다.
  • Hunyuan3D-2.5 업그레이드: 격자 (최대 10B 매개변수) 더욱 선명하고 깨끗한 기하학을 위해 PBR 텍스처 파이프라인 개선 된 멀티 뷰 일관성; 커뮤니티 노트에 보고된 4K급 텍스처.

컴퓨팅 및 VRAM: 참조 저장소 노트 ~6GB VRAM 모양 생성 및 ~ 16 GB 전체 모양+텍스처 추론(일반적인 데스크톱 GPU)

벤치마크 성능(v2.0 대 기타)

모델CMMD ⬇FID_CLIP ⬇FID ⬇CLIP 점수 ⬆
최고의 오픈소스3.59154.639289.2870.787
상위 폐쇄형 소스 13.60055.866305.9220.779
폐쇄형 소스 23.36849.744294.6280.806
폐쇄형 소스 33.21851.574295.6910.799
훈위안3D 2.03.19349.165282.4290.809

결과는 기하학적 세부 묘사와 질감의 사실성 면에서 눈에 띄게 우수하다는 것을 확인시켜 주었습니다.

고객 사례

  • 입력 모드: 텍스트-3D, 이미지-3D, 다중 뷰 입력(고급 버전).
  • 출력: 고해상도 메시 + 고품질 텍스처(이후 버전에서는 PBR).

게임 프로토타입 및 자산 파이프라인: 빠른 컨셉 → 텍스처 메시 처리; 아티스트가 소품/캐릭터를 반복하는 데 걸리는 시간을 줄입니다. 키워드 : 프로토타입 제작, 게임 자산.

AR/VR/가상 제작: PBR 텍스처와 엔진 호환 내보내기 기능을 통해 대화형 장면과 사전 시각화에 빠르게 통합할 수 있습니다. 키워드 : AR/VR, PBR, 엔진 준비 완료.

건축 및 제품 시각화: 스케치나 분위기 이미지를 바탕으로 한 양식화되거나 사실적인 3D 프로토타입입니다. 키워드 : 시각화, 빠른 반복.

교육/창의적 도구: 3D 개념을 가르치고 제작자가 세부 작업을 위한 기본 메시를 생성할 수 있는 접근 가능한 방법입니다. 키워드 : 교육, 창의적 도구. (커뮤니티 예시 및 튜토리얼)


제한 및 과제

  • 메시 밀도: 삼각형 수가 많으면(최대 ~600k) 프로덕션 파이프라인에 리토폴로지가 필요합니다.
  • 텍스처 디테일: 입력 해상도가 낮으면 세부 사항(예: 원단)이 흐릿해질 수 있습니다.
  • 지역 제한: EU/GDPR 우려로 사용이 제한됨. 규정을 준수하는 버전이 개발 중입니다.
  • 이음새 및 조명 불일치: 질감 베이킹은 다음을 생성할 수 있습니다. 이음새 또는 조명 아티팩트특히 단일 이미지 입력의 경우, 다중 뷰 입력과 SR/인페인팅은 이러한 문제를 완화하지만 완전히 없애지는 못합니다.
  • 프롬프트/조건화 민감도:** 다른 생성 모델과 마찬가지로 즉각적인 표현과 입력 프레이밍 결과에 상당한 영향을 미칠 수 있습니다. 예외 사례와 세부적인 기하학적 제약 조건은 반복적인 개선이 필요할 수 있습니다.

전화하는 방법 Hunyuan3D CometAPI의 API

Hunyuan3D-2 CometAPI의 API 가격 책정, 공식 가격 대비 20% 할인:

가격$0.08000

필수 단계

  • 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니신 경우 먼저 등록해 주시기 바랍니다.
  • 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.
  • 이 사이트의 url을 받으세요: https://api.cometapi.com/

사용 방법

  1. "Hunyuan3D-2API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
  2. 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
  3. 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
  4. . API 응답을 처리하여 생성된 답변을 얻습니다.

CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. 주요 세부 정보는 다음과 같습니다.  API doc:

curl --location 
--request POST 'https://api.cometapi.com/v1/images/generations' \ 
--header 'Authorization: Bearer {{api-key}}' \ 
--header 'Content-Type: application/json' \ 
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
더 보기

하나의 API로 500개 이상의 모델

최대 20% 할인