Googleは次世代生成AIモデルを発表する予定だ。画像4, イマージェン4ウルトラ, ヴェオ3—Google I/O開発者会議で 20年2025月XNUMX日プレビュー識別子の早期リーク(例: imagen-4.0-generate-preview-05-20, imagen-4.0-ultra-generate-exp-05-20, veo-3.0-generate-preview)は、画像と動画の合成領域の両方で段階的なロールアウトと複数の機能層を示唆しています。Imagen 4は、Imagen 3と比較して、フォトリアリズム、プロンプトの忠実度、スタイルの一貫性において大幅な向上を目指しており、「Ultra」バリアントはさらに高い解像度や特殊なパフォーマンスモードを提供する可能性があります。動画に関しては、Veo 3は、Veo 2と比較して、より一貫したクリップ間の連続性と堅牢なスタイル準拠を約束します。XNUMXつのモデルはすべて、GoogleのGemini AIエコシステムと緊密に統合され、同じワークフロー内でテキストプロンプトから画像または動画へのシームレスな移行を可能にすることが期待されています。
プレビュー識別子とロールアウト戦略
ステージプレビュー: 内部参照など
imagen-4.0-generate-preview-05-20imagen-4.0-ultra-generate-exp-05-20veo-3.0-generate-preview


コード リポジトリと API プレビューに登場し、Google が画像生成に標準と「Ultra」の両方のパフォーマンス レベルを提供し、さらに初期テスター向けに高度なビデオ モデル プレビューも提供する意向を示しています。
Google I/O ローンチ:
これらの識別子は、GoogleがI/Oで開発者にプレビューアクセスを展示し、場合によっては許可することを強く示唆している。 20年2025月XNUMX日Imagen 3 および Veo 2 の以前のロールアウトを反映します。
Imagen 4の新機能
フォトリアリズムと忠実度
- 強化されたレンダリングImagen 4は、より写実的なディテールを実現し、アーティファクトを削減し、色彩精度を向上させていると報告されています。初期の噂では、微妙な照明や反射といった複雑な指示の理解が改善されているとのことです。
- 即時遵守モデルはユーザーの指示に正確に従い、コンテンツとスタイルの指示の両方により適合した画像(例:「山に沈む夕日の油絵」)を提供することが期待されます。
スタイルの一貫性
- 複数画像の結合Imagen 4 は、複数の出力にわたって一貫したビジュアル スタイルを維持するように設計されており、統一性が重要なストーリーボードや製品カタログの作成などのユース ケースに役立ちます。
- ウルトラバリアント: 「Ultra」層 (imagen‑4.0‑ultra) は、エンタープライズおよびクリエイティブ プロフェッショナル向けに、高解像度の出力または特殊な最適化 (印刷メディア向けの超高忠実度など) を提供する可能性があります。
Veo 3の新機能
一貫性の向上
- クリップ間の連続性Veo 3 は、時間の経過に伴う視覚的ドリフトに関する Veo 2 の制限に対処し、連続ショットで一貫したフレーミング、照明、およびキャラクターの外観が維持されるビデオ シーケンスを生成することを目指しています。
- スタイルの忠実性: このモデルは、芸術的または映画のスタイルをより忠実に再現することに重点を置いており、望ましい美的感覚 (ノワール、パステルアニメーションなど) を備えたビデオを簡単に制作できます。
SynthIDウォーターマークの統合
- 電子透かしVeo 2 では、DeepMind の SynthID テクノロジー (Veo 3 で導入) を活用して、目に見えない透かしを埋め込み、AI 生成コンテンツを識別して不正使用を抑制します。
Gemini AIとの統合
- シームレスなアクセスImagen 4 と Veo 3 はどちらも Google の Gemini インターフェースから直接アクセスできるようになり、ユーザーはチャットベースのプロンプト内や Google フォトや Google スライドなどの製品インターフェースを通じて画像や動画を生成できるようになります。
- ジェミニジェムカスタマイズされた AI「Gem」にはこれらのモデルが組み込まれており、ユーザーは専用のアシスタント(例:旅程画像や概要ビデオを生成する旅行計画 Gem)を作成し、ChatGPT の GPT Store に似たマーケットプレイスで共有できます。
提供状況と今後の予定
パブリックプレビュー: 開発者とエンタープライズテスターは、Imagen 4(標準版とUltra版)とVeo 3を試すための招待を受ける可能性があります。 20年2025月XNUMX日 Google I/O で発表され、その後数週間で Labs と Vertex AI に広く展開される予定です。
フィードバックと反復: 以前のリリースと同様に、Google は一般公開前にユーザーからのフィードバックを募り、安全性フィルター、透かしの堅牢性、パフォーマンスの最適化を改良する予定です。
このスペースをご覧ください: 興味のある開発者は、 コメットAPI.
新しいモデルAPIはCometAPIに掲載されます。Googleよりも低価格で提供し、お客様の導入を容易にします。引き続きご注目ください。 APIドキュメント.
