2026年3月25日にリリースされた Google の Lyria 3 Pro は、AI 音楽生成における大きな飛躍を示しています。高度な構造認識、ハイファイな 48kHz オーディオ、マルチモーダル入力により、最長 3 分のフルレングス楽曲を生成します。このモデルは従来版を上回り、Udio のような競合と比べてもプロのクリエイター、開発者、企業向けに際立っています(ただし Suno との比較では相手にも利点があります)。
Google が Lyria 3 Pro を投入した意義は、AI 音楽を短く実験的なクリップから、よりプロダクションに適した形式へと進めた点にあります。つい最近まで、Google の Gemini アプリにおける一般向け音楽機能はカバーアート付きの 30 秒曲に焦点を当てていましたが、Lyria 3 Pro はその体験を、制作者が実際に作曲やアレンジを考えるやり方に近い、より長く構造化された楽曲へと拡張します。
Lyria 3 Pro とは?
Lyria 3 Pro は Google DeepMind のフラッグシップ音楽生成モデルです。複数のヴァース、コーラス、ブリッジを含む複雑な構造的一貫性を備えたフルレングス曲の生成に最適化されており、テキストプロンプトや画像入力から高品質な 48kHz ステレオ音声を生成できます。Lyria 3 はテキストプロンプトから音声を合成する音楽生成システムで、潜在拡散を用い、音楽と歌詞の両方を出力します。
短いクリップに制限されていた従来の Lyria と異なり、Pro モデルは自然な流れ、リズムの複雑さ、感情的ダイナミクスを維持した、まとまりのあるラジオ向けのトラックを提供します。Google は責任ある開発を強調しており、すべての出力に SynthID 技術による不可視の透かしが埋め込まれ、AI による検出が可能です。また、広範な安全フィルターにより有害なコンテンツや著作権を模倣するコンテンツを防ぎます。
機能の詳細説明
Lyria 3 Pro における最大の変化は構造認識です。
Lyria 3 Pro はイントロ、ヴァース、コーラス、ブリッジといった楽曲コンポーネントを理解します。プロンプトで構成を指定すれば、その構成に従って楽曲を作曲します。
1. 高度な楽曲構造コントロール
際立った機能は構造認識です。ユーザーはタイムスタンプや記述的なプロンプト(例:「0:00-0:15 intro, 0:15-0:45 verse 1, 0:45-1:15 chorus」)でセクションを指定できます。モデルは曲全体にわたりメロディ、ハーモニー、エネルギーの一貫性を維持します。これは従来の 30 秒制限からの大きな前進です。
例のプロンプト:
“Cメジャー、128 BPM のアップビートなポップトラックを 3 分で作ってください。0:00-0:20 夢見心地のシンセによるイントロ、0:20-0:50 夢を追うことについてのヴァース、0:50-1:20 レイヤードボーカルのキャッチーなコーラス、1:20-1:50 感情的なドロップのあるブリッジ、1:50-2:20 最終コーラスのビルド、2:20-3:00 フェードするアウトロ。”
2. 高忠実度の音質と音楽性
Lyria 3 Pro は、プロレベルの明瞭さ、リアルな楽器表現、表情豊かなボーカルを備えた 48kHz ステレオ MP3 を出力します。コミュニティのテストや Google のデモでは、Lyria 3 と比べて音楽性と忠実度が向上し、自然な音程遷移とダイナミックレンジが確認されています。
レイヤードハーモニー、打楽器のバリエーション、ジャンルの融合といった複雑なアレンジにも対応し、アーティストの意図を保ちながら生成します。プロデューサーの François K も、アイデアを磨き上げる際のリアリズムと精緻さを称賛しています。
3. マルチモーダル入力: テキスト、画像など
- テキストプロンプト: シンプル(「アップビートなバースデーチューン」)から詳細(テンポ、キー、ムード、歌詞)まで対応。
- 画像→音楽: 画像(写真、アート)をアップロードして、それに合うサウンドトラックを生成。映像同期やビジュアル発想に最適。
- 歌詞コントロール: 自動生成またはカスタム歌詞の提供が可能。モデルがボーカルを正確にアラインします。
Google Vids や ProducerAI と統合され、ビデオ用サウンドトラックの生成やフルプロダクションのワークフローにシームレスに組み込めます。
4. ジャンルの多様性とグローバル対応
スタイルの幅は非常に広く、ポップ、ファンク、モータウンからエレクトロニック、クラシック、ヒップホップまでをカバーします。Google はこれを「プロフェッショナルグレードのオーディオ」と呼んでおり、その表現は誇張ではありません。少なくとも音質面では、Lyria 3 Pro は Suno v5 と十分に競合できます。
数十のジャンルとサブジャンルにわたり、文化的ニュアンスを的確に再現します。複数言語でのボーカルにも対応し、スタジオコストなしでローカライズされたコンテンツを制作したいグローバルなクリエイターを支援します。
5. セーフティ、倫理、エンタープライズ機能
- 追跡可能性のための SynthID 透かし。
- 露骨または侵害的なコンテンツをブロックするフィルター。
- Vertex AI におけるエンタープライズツールで、カスタムチューニングにも対応したスケーラブルな展開が可能。
Lyria 3 Pro の利用方法と料金
現在、複数のアクセス手段があり、これが Lyria 3 Pro の魅力の大きな一部を占めます。一般ユーザー向けには、Google は Lyria 3 が Gemini アプリで18 歳以上の複数言語ユーザーに提供され、Google AI Plus、Pro、Ultra の加入者は上限が引き上げられるとしています。開発者や企業向けには、Lyria 3 Pro が Vertex AI、Google AI Studio、Gemini API で利用可能とされています。さらに Google Vids と ProducerAI が追加の利用先として挙げられています。
コンシューマー向けのアクセスについて、Google のプランページでは、Google AI Pro と Google AI Ultra が該当するサブスクリプションであり、Google AI Pro は 150 以上の国・地域、Google AI Ultra は 140 以上の国・地域で利用可能と記載されています。Google はまた、AI プランは個人の Google アカウントでのみ利用可能で、Workspace の顧客は Gemini アドオンが必要であるとしています。
開発者向けアクセスについて、Google Cloud によると、Vertex AI API を Google Cloud プロジェクトで有効化した後、Google Cloud コンソールまたは Vertex AI API を通じて Lyria を利用できます。新規顧客は Vertex AI やその他の Google Cloud 製品を試すための $300 の無料クレジットを受け取れることも記載されています。
料金(2026年3月時点):
Gemini API: 3 分フル曲(Lyria 3 Pro)1 本あたり $0.08、30 秒クリップは $0.04。Pro モデルに無料枠はありません。
Vertex AI: フル曲 1 本あたり同じく $0.08(入力: テキスト/画像、出力: フル曲)。エンタープライズ向け数量ディスカウントあり。
Gemini アプリのプラン(1 日あたりのおおよそのトラック上限):
- Google AI Plus(約 $19.99/mo): 約 10 トラック/日
- Google AI Pro(約 $29.99/mo): 約 20 トラック/日
- Google AI Ultra(約 $99.99+/mo): 約 50 トラック/日(より大きなストレージを含む)
開発者は生成ごとの従量課金。ホビーユーザーは AI Studio から開始できます。
Lyria 3 Pro の統合: 開発者向け Python コード例
Lyria 3 Pro は Gemini API を通じて完全にプログラマブルです。以下はすぐに使える Python の例です(google-generativeai SDK が必要。pip install google-generativeai でインストール):
import google.generativeai as genai
import os
# API キーを設定(取得: https://aistudio.google.com/app/apikey)
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
# モデルを初期化(フル曲には 'lyria-3-pro-preview' を使用)
model = genai.GenerativeModel('lyria-3-pro-preview')
# マルチモーダルプロンプトの例(テキスト + 画像は任意)
prompt = """
明るくアップビートなエレクトロニック・ダンスの3分フルトラックを生成:
- 0:00-0:20: シンセパッドのアトモスフェリックなイントロ
- 0:20-1:00: 「イノベーション」について歌う女性ボーカルのエネルギッシュなヴァース
- 1:00-1:40: 爆発的なコーラス
- 1:40-2:10: ブレイクダウンのブリッジ
- 2:10-3:00: 最終コーラス + フェードするアウトロ
テンポ: 130 BPM、キー: F マイナー。ハイエナジーでフェス対応。
"""
# 任意: 画像の影響を追加
# image_file = genai.upload_file(path="mood_image.jpg")
# response = model.generate_content([prompt, image_file])
response = model.generate_content(prompt)
# 生成された音声を保存(response には MP3 バイト + 歌詞が含まれる)
if response.parts:
audio_bytes = response.parts[0].inline_data.data # MP3 バイナリ
with open("lyria_pro_track.mp3", "wb") as f:
f.write(audio_bytes)
print("✅ トラックを生成しました!歌詞:", response.text) # 歌詞はテキストとして取得
else:
print("生成に失敗しました:", response)
このコードは数秒でプロダクション対応のトラックを生成します。バッチ処理には Vertex AI でスケールし、Web/アプリに統合できます。完全な音楽生成ガイド: ai.google.dev/gemini-api/docs/music-generation.
結論:
Google Lyria 3 Pro は、構造化と高忠実度を兼ね備えた 2026 年の AI 音楽生成に新たな標準を打ち立てました。構造認識、マルチモーダル能力、そして Google エコシステムとのシームレスな統合により、精度とスケーラビリティを求めるプロフェッショナルや開発者にとって最有力の選択肢となります。カジュアルな長尺生成のコストパフォーマンスでは Suno v5、実験的な長さでは Udio が秀でる一方で、Lyria 3 Pro は API アクセスとエコシステムによりエンタープライズ分野の最前線に位置づけられます。
CometAPI で音楽を作成しますか?CometAPI は現在 suno v5 を提供しており、Lyria 3 Pro は近日公開予定です。