Hunyuan3D 2.0は、テンセントの先進的な大規模3D生成AIシステムです。拡散ベースのアーキテクチャを活用し、テキスト記述や画像を、3段階のパイプライン処理によって、高品質テクスチャで強化されたメッシュなど、詳細なXNUMXDアセットに変換します。 形状生成 および テクスチャ合成.
主な機能(何をするか)
- 2段階生成: 分離 (裸メッシュ)から テクスチャ合成 (UV マップ / PBR テクスチャ)、コントロールと品質が向上します。
- 画像条件付きモードとテキスト条件付きモード: 受け入れる 単一ビューまたは複数ビューの画像 および テキストプロンプト 形状と質感をガイドします。
- 高解像度テクスチャ: 大規模なテクスチャ出力 (2K~6K+ ワークフロー用の構成) と SR/拡張ステップをサポートします。 キーワード: テクスチャ解像度、超解像度、ベイク.
技術的詳細
- 形状ジェネレーター (Hunyuan3D-DiT): ジオメトリ (バージョンに応じて octree / octree のような、または格子状の表現) を生成するようにトレーニングされた拡散トランスフォーマー スタイルのモジュール。ジオメトリを調整イメージまたはテキスト プロンプトに合わせるように最適化されています。
- テクスチャシンセサイザー(Hunyuan3D-Paint / PBRシンセサイザー): UVマップされたテクスチャアトラスを生成する2番目のモデル 物理ベースレンダリング 生成されたアセットはレンダラーやゲーム エンジンですぐに使用できるように、出力 (アルベド、粗さ、メタリック マップ) も作成されます。
- デコードと解決: 後のバージョンでは、幾何学的解像度 (例: より高いオクトリー/ラティス解像度) とテクスチャ サイズ (一般的なコミュニティ設定では、エクスポート用に最大マルチ K テクスチャが生成されます) が向上しています。
- スケーリングとモデルサイズ: v2.5 のレポートでは、ジオメトリの精度とテクスチャの忠実度を向上させるために、2.0 から 2.5 への大幅なスケールアップ (パラメータ数とデータセットのスケール) が示されています。
- Hunyuan3D-2.5 アップグレード: 格子 (最大 10B パラメータ) よりシャープでクリーンなジオメトリを実現します。 PBRテクスチャパイプライン 改善された マルチビュー 一貫性; コミュニティノートで報告された 4K クラスのテクスチャ。
コンピューティングとVRAM: 参照リポジトリのメモ 約6GBのVRAM 形状生成と 〜16 GB 完全な形状+テクスチャ推論用 (一般的なデスクトップ GPU)。
ベンチマークパフォーマンス(v2.0とその他)
| モデル | CMMD ⬇ | FID_クリップ⬇ | FID ⬇ | CLIPスコア⬆ |
|---|---|---|---|---|
| トップオープンソース | 3.591 | 54.639 | 289.287 | 0.787 |
| トップクローズドソース1 | 3.600 | 55.866 | 305.922 | 0.779 |
| クローズドソース 2 | 3.368 | 49.744 | 294.628 | 0.806 |
| クローズドソース 3 | 3.218 | 51.574 | 295.691 | 0.799 |
| フンユアン3D 2.0 | 3.193 | 49.165 | 282.429 | 0.809 |
結果は、幾何学的な詳細とテクスチャのリアリズムにおける顕著な優位性を確認しました。
ユースケース
- 入力モード: テキストから 3D、画像から 3D、マルチビュー入力 (上級バージョン)。
- 出力: 高解像度メッシュ + 高品質テクスチャ (後のバージョンでは PBR)。
ゲームのプロトタイピングとアセットパイプライン: 迅速なコンセプト → テクスチャメッシュのターンアラウンド。小道具やキャラクターのアーティストの反復時間を短縮します。 キーワード: プロトタイピング、ゲームアセット。
AR/VR / バーチャルプロダクション: PBR テクスチャ + エンジン互換のエクスポートにより、インタラクティブなシーンやプリビズレーションへの迅速な統合が可能になります。 キーワード: AR/VR、PBR、エンジン対応。
建築と製品の視覚化: スケッチやムードイメージから、様式化された、またはリアルな 3D プロトタイプを作成します。 キーワード: 視覚化、迅速な反復。
教育 / クリエイティブツール: 3D の概念を教え、クリエイターが改良のためのベース メッシュを生成できるようにするアクセス可能な方法。 キーワード: 教育、クリエイティブツール。(コミュニティの例とチュートリアル。)
制限と課題
- メッシュ密度: 三角形の数が多い場合 (最大約 600 万)、プロダクション パイプラインの再トポロジが必要になります。
- テクスチャの詳細: 入力解像度が低い場合、細かい部分(布地など)がぼやけることがあります。
- 地域の制限: EU/GDPR の懸念により使用が制限されており、準拠バージョンが進行中です。
- 継ぎ目と照明の不一致: テクスチャベイクは 継ぎ目や照明のアーティファクト特に単一画像入力の場合、マルチビュー入力と SR/インペインティングによりこれらの問題は軽減されますが、完全に解消されるわけではありません。
- プロンプト/条件付け感度:** 他の生成モデルと同様に、 プロンプトフレーズと入力フレーミング 結果に大きな影響を与えます。エッジケースと細かい幾何学的制約には反復的な改良が必要になる場合があります。
電話方法 Hunyuan3D CometAPI からの API
Hunyuan3D-2 CometAPI の API 価格、公式価格より 20% オフ:
| 価格 | $0.08000 |
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
Hunyuan3D-2” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- 終点: https://api.cometapi.com/v1/images/generations
- モデルパラメータ:
Hunyuan3D-2 - 認証:
Bearer YOUR_CometAPI_API_KEY - コンテンツタイプ:
application/json.
curl --location
--request POST 'https://api.cometapi.com/v1/images/generations' \
--header 'Authorization: Bearer {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{ "model": "Hunyuan3D-2", "prompt": "A cute baby sea otter", "image": "https://filesystem.site/cdn/20250414/chxiLc2O45zoLT8BCrQ6WQlTvGDDnK.png" }'
