Seedance1.5 Pro の技術仕様
| 仕様 | 詳細 |
|---|---|
| モデルID | doubao-seedance-1-5-pro |
| プロバイダファミリー | Doubao / ByteDance Seed |
| モデルタイプ | ネイティブな音声・動画生成モデル |
| 中核モダリティ | 単一モデルによる映像と音声の共同生成 |
| 主なユースケース | テキストから動画、プロンプト駆動のシネマティックな動画生成 |
| 入力形式 | テキストプロンプト;画像条件付き生成にも対応 |
| 出力形式 | 音声(ボイスや効果音を含む)と同期した動画 |
| 強み | 複雑なプロンプト追従、映像と音声の同期、多言語の音声/リップシンク対応、シネマティックなモーションとストーリーテリング |
| デプロイメント環境 | ByteDance/Volcengine のモデルプラットフォームで提供され、CometAPI ではこのモデルIDで公開 |
| 商用提供状況 | 商用/API 提供可否は、プロバイダおよびプラットフォームの掲載情報に準拠 |
Seedance1.5 Pro とは?
Seedance1.5 Pro は、ByteDance の Seedance 1.5 Pro モデルを指す CometAPI のプラットフォーム識別子で、音声を後処理として切り分けるのではなく、動画と音声を同時に生成するネイティブな音声・映像生成モデルです。ByteDance は Seedance 1.5 Pro を、複雑な指示に正確に従い、テキストプロンプトと画像駆動の両方に対応する音声・映像の共同生成モデルと説明しています。
実務的には、単一のワークフローで、セリフ、環境音、効果音、モーションの一貫性が取れた短尺の生成動画を求めるクリエイターや開発者を対象としたモデルであることを意味します。ByteDance の技術資料では、デュアルブランチ Diffusion Transformer アーキテクチャとクロスモーダル・モデリングを用いた、ネイティブな音声・映像の共同生成のための基盤モデルとして位置付けられており、画面に現れる内容と耳にする音の同期をより密にする設計が強調されています。
また本モデルは、ByteDance の動画生成ソリューションとして、より広い Doubao/Seed エコシステムの中に位置付けられており、Volcengine ではプロダクションモデルのひとつとして Doubao-Seedance-1.5-pro を掲載し、コア機能として「音声と映像を同時生成」を強調しています。
Seedance 1.5 Pro の主な機能
- ネイティブな音声・動画の同時生成:音声と動画を共同で生成することで、後から音声を合成するパイプラインよりも、セリフ、効果音、視覚的アクションのタイミングが自然になりやすくなります。
- 強力なプロンプト追従性:複雑な指示に正確に従うモデルとして明示されており、構造化されたクリエイティブプロンプトやシナリオ制御された出力に適しています。
- テキストから動画・画像駆動のワークフロー:テキストプロンプトから音声・映像コンテンツを合成でき、アイデーション、絵コンテ制作、ファーストフレーム起点のクリエーションに柔軟性を与えます。
- 多様なボイス、空間音響、効果音:多様なボイスと空間的なサウンドエフェクトを視覚と連動させ、より豊かなストーリーテリングと没入感のあるクリップ制作に寄与します。
- 多言語・方言対応:幅広い言語と方言をサポートし、リップシンクやモーション整合に優れるとされ、グローバル向けのメディアアプリケーションに有用です。
- 研究に裏打ちされた同期設計:公開された技術レポートでは、クロスモーダルな共同モデリングと特化した学習パイプラインにより、音声・映像同期と生成品質を高める設計が強調されています。
- プロダクションエコシステムでの提供:ByteDance/Volcengine の公式モデル一覧に掲載され、CometAPI 上では
doubao-seedance-1-5-proとして公開されているため、アプリやメディアワークフローへの API ベースの統合が容易です。
Seedance1.5 Pro へのアクセスと統合方法
ステップ 1: サインアップして API キーを取得
CometAPI にサインアップし、ダッシュボードから API キーを作成します。キーを有効化したら、アプリケーションが API リクエストを認証できるよう、環境変数として安全に保管してください。
ステップ 2: doubao-seedance-1-5-pro API へリクエストを送信
CometAPI の ByteDance/Volcengine 互換エンドポイント POST /volc/v3/contents/generations/tasks を使用します。
ステップ 3: 結果の取得と検証
API はタスク ID を返します。GET /volc/v3/contents/generations/tasks/{task_id} をポーリングして生成状況を確認し、タスク完了時に出力動画の URL を取得します。