Hunyuan3D 2.0 — это передовая крупномасштабная система 3D-генеративного искусственного интеллекта от Tencent. Используя архитектуру на основе диффузии, она преобразует текстовые описания или изображения в высокодетализированные 3D-объекты — сетки, дополненные высококачественными текстурами — посредством двухэтапного конвейера генерация формы и синтез текстур.
Основные функции (что он делает)
- Двухэтапная генерация: разъединяет геометрия (голая сетка) из синтез текстур (UV-карты / PBR-текстуры), улучшение контроля и качества.
- Режимы, обусловленные изображением и текстом: принимает одиночные или многоракурсные изображения и / или текстовые подсказки для придания формы и текстуры.
- Текстуры высокого разрешения: поддерживает большие выходные текстуры (конфигурации для рабочих процессов 2K–6K+) и шаги SR/улучшения. Ключевые слова: разрешение текстур, супер-разрешение, запекание.
технические детали
- Генератор форм (Hunyuan3D-DiT): модуль в стиле диффузионного преобразователя, обученный создавать геометрию (представления в виде октодерева / октодеревоподобного или решетчатого изображения в зависимости от версии), оптимизированный для согласования геометрии с кондиционирующим изображением или текстовой подсказкой.
- Синтезатор текстур (Hunyuan3D-Paint / PBR-синтезатор): вторая модель, которая генерирует атласы текстур с UV-картами физически обоснованный рендеринг выходные данные (альбедо, шероховатость, карты металличности), благодаря чему сгенерированные ресурсы можно сразу использовать в рендерах и игровых движках.
- Декодирование и разрешение: в более поздних версиях увеличено геометрическое разрешение (например, более высокое разрешение октодерева/решетки) и размеры текстур (общие настройки сообщества позволяют экспортировать текстуры вплоть до multi-k).
- Масштабирование и размеры модели: отчеты v2.5 указывают на значительное масштабирование (количество параметров и масштаб набора данных) с 2.0 до 2.5 для повышения точности геометрии и текстуры.
- Обновления Hunyuan3D-2.5: РЕШЕТКА (максимум 10B параметров) для более четкой и чистой геометрии; Конвейер текстур PBR с улучшенным мульти-вид согласованность; текстуры класса 4K, указанные в заметках сообщества.
Вычисления и VRAM: справочные репо-ноты ~6 ГБ видеопамяти для создания формы и ~ 16 ГБ для полного вывода формы и текстуры (типичные настольные графические процессоры).
Производительность теста (v2.0 по сравнению с другими)
| Модель | CMMD ⬇ | FID_CLIP ⬇ | ПИД ⬇ | Оценка CLIP ⬆ |
|---|---|---|---|---|
| Top Open-source | 3.591 | 54.639 | 289.287 | 0.787 |
| Топ с закрытым исходным кодом 1 | 3.600 | 55.866 | 305.922 | 0.779 |
| Закрытый исходный код 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| Закрытый исходный код 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| Хуньюань3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
Результаты подтверждают заметное превосходство в геометрической детализации и реалистичности текстур.
Случаи использования
- Режимы ввода: Текст в 3D, Изображение в 3D, Многоэкранный ввод (в расширенных версиях).
- Выходы: Сетка высокого разрешения + высококачественные текстуры (PBR в более поздних версиях).
Прототипирование игр и конвейеры активов: быстрая концепция → создание текстурированной сетки; сокращает время итерации художника для реквизита/персонажей. Ключевые слова: прототипирование, игровые ресурсы.
AR/VR / виртуальное производство: Текстуры PBR + экспорт, совместимый с движком, позволяют быстро интегрировать их в интерактивные сцены и предварительную визуализацию. Ключевые слова: AR/VR, PBR, готов к использованию с движком.
Архитектура и визуализация продукта: стилизованные или реалистичные 3D-прототипы по эскизам или изображениям настроения. Ключевые слова: визуализация, быстрая итерация.
Образование/творческие инструменты: доступный способ обучения 3D-концепциям и предоставления создателям возможности создавать базовые сетки для совершенствования. Ключевые слова: Образование, творческие инструменты. (Примеры и руководства сообщества.)
Ограничения и проблемы
- Плотность сетки: Большое количество треугольников (до ~600 тыс.) требует ретопологии производственных трубопроводов.
- Детализация текстур: Мелкие детали (например, ткани) могут быть размыты, если входное разрешение низкое.
- Ограничения по региону: требования ЕС/GDPR ограничивают использование; соответствующие версии находятся в разработке.
- Несоответствие швов и освещения: текстуру выпечки можно получить швы или артефакты освещения, особенно при использовании входных данных с одним изображением; многовидовые входные данные и SR/inpainting смягчают, но не устраняют эти проблемы.
- Чувствительность к подсказкам/условиям:** как и в других генеративных моделях, формулировка подсказок и формирование входных данных существенно влияют на результаты; граничные случаи и тонкие геометрические ограничения могут потребовать итеративного уточнения.
Как позвонить Hunyuan3D API от CometAPI
Hunyuan3D-2 Цены на API в CometAPI, скидка 20% от официальной цены:
| Цена | $0.08000 |
Необходимые шаги
- Войти в cometapi.com. Если вы еще не являетесь нашим пользователем, пожалуйста, сначала зарегистрируйтесь.
- Получите ключ API-интерфейса для доступа к учетным данным. Нажмите «Добавить токен» в API-токене в персональном центре, получите ключ токена: sk-xxxxx и отправьте.
- Получите URL этого сайта: https://api.cometapi.com/
Используйте метод
- Выберите "
Hunyuan3D-2” конечная точка для отправки запроса API и установки тела запроса. Метод запроса и тело запроса получены из нашего веб-сайта API doc. Наш веб-сайт также предоставляет тест Apifox для вашего удобства. - Заменять с вашим реальным ключом CometAPI из вашей учетной записи.
- Введите свой вопрос или запрос в поле «Контент» — на него ответит модель.
- . Обработайте ответ API, чтобы получить сгенерированный ответ.
CometAPI предоставляет полностью совместимый REST API для беспроблемной миграции. Ключевые детали API документ:
- Конечная точка: https://api.cometapi.com/v1/images/generations
- Параметр модели:
Hunyuan3D-2 - Аутентификация:
Bearer YOUR_CometAPI_API_KEY - Тип содержимого:
application/json.
curl --location
--request POST 'https://api.cometapi.com/v1/images/generations' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
