Google 的 Lyria 3 Pro 於 2026 年 3 月 25 日發佈,標誌著 AI 音樂生成的重大躍進。它具備對結構的高級感知能力,可生成最長達 3 分鐘的完整歌曲,輸出高保真 48kHz 音訊,並支援多模態輸入。此模型在效能上超越早期版本,且相較競品如 Udio 表現突出(但與 Suno 相比各有優勢),面向專業創作者、開發者與企業用戶。
Google 發佈的 Lyria 3 Pro 之所以重要,在於它將 AI 音樂從短、實驗性片段推進到更適合製作的格式。直到最近,Google 在 Gemini 應用中的消費者音樂功能仍聚焦於帶有封面的 30 秒歌曲,但 Lyria 3 Pro 將這種體驗延展為更長且更具結構性的作品,更貼近創作者在作曲與編曲上的思維方式。
什麼是 Lyria 3 Pro?
Lyria 3 Pro 是 Google DeepMind 的旗艦級音樂生成模型。它針對生成具複雜結構一致性的完整歌曲進行最佳化,可包含多段主歌、副歌與橋段,並能從文字提示或圖像輸入生成高品質的 48kHz 立體聲音訊。Lyria 3 是一個音樂生成系統,可從文字提示合成音訊,採用潛在擴散(latent diffusion),並能同時輸出音樂與歌詞。
不同於先前僅限短片段的 Lyria 版本,Pro 型號可生成連貫、達到電台級的曲目,並維持自然的流動性、節奏複雜度與情緒動態。Google 強調負責任的開發:所有輸出皆以 SynthID 技術加入不可感知的浮水印以供 AI 檢測,並透過廣泛的安全過濾機制防止有害或模仿受版權保護的內容。
能力詳解
Lyria 3 Pro 最大的改變在於其結構感知能力。
Lyria 3 Pro 能理解歌曲組成部分,例如前奏、主歌、副歌與橋段。你可以在提示中指定結構,它會依據該結構進行創作。
1. 高級歌曲結構控制
最突出的功能是結構意識。使用者可用時間碼或描述性提示指定段落(例如:「0:00-0:15 前奏、0:15-0:45 第一段主歌、0:45-1:15 副歌」)。模型會在整首曲目中維持旋律、和聲與能量的一致性——這相較於先前 30 秒限制是一次飛躍。
範例提示:
「創作一首 3 分鐘、C 大調、128 BPM 的歡快流行曲:0:00-0:20 夢幻合成器前奏,0:20-0:50 主歌描寫追逐夢想,0:50-1:20 朗朗上口的層次人聲副歌,1:20-1:50 情緒跌宕的橋段,1:50-2:20 最終副歌衝刺,2:20-3:00 尾聲淡出。」
2. 高保真音質與音樂性
Lyria 3 Pro 輸出 48kHz 立體聲 MP3,具備專業級清晰度、逼真的配器與富表情的人聲。社群測試與 Google 示範顯示,相較 Lyria 3,其音樂性與保真度更佳,音符轉換自然、動態範圍出色。
它能處理複雜編曲(分層和聲、打擊樂變化、風格融合),同時保留創作意圖。製作人如 François K 讚賞其寫實度與精準度,有助於打磨想法。
3. 多模態輸入:文字、圖像與更多
- 文字提示:可簡單(「歡快的生日旋律」),或詳述節奏、調性、情緒、歌詞等。
- 以圖生音:上傳圖像(照片、藝術作品),生成匹配的配樂——適合影片同步或視覺靈感延伸。
- 歌詞控制:可自動生成或提供自訂歌詞;模型會精準對齊人聲。
與 Google Vids 和 ProducerAI 的整合,可無縫生成影片配樂或進入完整製作流程。
4. 曲風多樣性與全球擴展
其風格範圍相當廣泛,涵蓋從流行、放克、Motown 到電子、古典與嘻哈。Google 稱其為「專業級音訊」,這並非誇張。至少在音訊保真度方面,Lyria 3 Pro 絕對可以與 Suno v5 一較高下。
支援數十種曲風與子類型,並具備真實的文化細節。人聲支援多語言,使全球創作者不用承擔錄音室成本即可製作在地化內容。
5. 安全、倫理與企業功能
- 以 SynthID 浮水印確保可追溯性。
- 過濾器阻擋露骨或侵權內容。
- Vertex AI 中的企業工具支援可擴展部署與自訂微調。
如何取得 Lyria 3 Pro 與費用
目前有多條存取途徑,這正是 Lyria 3 Pro 的重要吸引力之一。對一般用戶而言,Google 表示 Lyria 3 已在 Gemini 應用向 18+ 使用者於多種語言開放,且 Google AI Plus、Pro 與 Ultra 訂閱可享更高上限。對開發者與企業而言,Google 表示 Lyria 3 Pro 可在 Vertex AI、Google AI Studio 與 Gemini API 使用;Google 也列出 Google Vids 與 ProducerAI 為其他使用介面。
對消費者存取而言,Google 的方案頁面顯示 Google AI Pro 與 Google AI Ultra 為相關訂閱方案,其中 Google AI Pro 在 150 多個國家/地區可用、Google AI Ultra 在 140 多個國家/地區可用。Google 亦指出,Google AI 方案僅適用於 個人 Google 帳戶,Workspace 客戶需另購 Gemini 加值功能。
對開發者存取而言,Google Cloud 表示你可在 Google Cloud 主控台或透過 Vertex AI API 使用 Lyria(需先在 Google Cloud 專案中啟用 Vertex AI API)。Google 也提到新客戶可獲得 $300 免費額度用於體驗 Vertex AI 與其他 Google Cloud 產品。
價格(截至 2026 年 3 月):
Gemini API: 每首完整 3 分鐘歌曲(Lyria 3 Pro)$0.08;每段 30 秒片段 $0.04。Pro 型號無免費層級。
Vertex AI: 每首完整歌曲同為 $0.08(輸入:文字/圖像;輸出:完整歌曲)。企業量價折扣可用。
Gemini 應用方案(約略每日曲目上限):
- Google AI Plus(~$19.99/月):~10 首/日
- Google AI Pro(~$29.99/月):~20 首/日
- Google AI Ultra(~$99.99+/月):~50 首/日(含更高儲存配額)
開發者按次付費;愛好者可從 AI Studio 起步。
整合 Lyria 3 Pro:開發者用 Python 範例
Lyria 3 Pro 可透過 Gemini API 全面程式化。以下為可直接使用的 Python 範例(需要 google-generativeai SDK;以 pip install google-generativeai 安裝):
import google.generativeai as genai
import os
# 設定 API 金鑰(可從 https://aistudio.google.com/app/apikey 取得)
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
# 初始化模型(生成完整歌曲請使用 'lyria-3-pro-preview')
model = genai.GenerativeModel('lyria-3-pro-preview')
# 範例多模態提示(文字 + 可選圖片)
prompt = """
生成一首完整 3 分鐘、歡快的電子舞曲:
- 0:00-0:20:氛圍感合成器前奏
- 0:20-1:00:以女性人聲歌唱「創新」主題的充滿能量主歌
- 1:00-1:40:爆發性的副歌
- 1:40-2:10:斷奏式橋段
- 2:10-3:00:最終副歌 + 尾聲淡出
Tempo:130 BPM,Key:F 小調。高能量、適合音樂節舞台。
"""
# 可選:加入圖片影響
# image_file = genai.upload_file(path="mood_image.jpg")
# response = model.generate_content([prompt, image_file])
response = model.generate_content(prompt)
# 儲存生成的音訊(response 包含 MP3 位元組與歌詞)
if response.parts:
audio_bytes = response.parts[0].inline_data.data # MP3 binary
with open("lyria_pro_track.mp3", "wb") as f:
f.write(audio_bytes)
print("✅ 曲目已生成!歌詞:", response.text) # Lyrics as text
else:
print("生成失敗:", response)
這段程式碼可在數秒內生成可投入製作的曲目。可透過 Vertex AI 擴展至批量處理,或整合至網站/應用程式。完整音樂生成指南:ai.google.dev/gemini-api/docs/music-generation。
結論:
Google Lyria 3 Pro 在 2026 年為結構化、高保真 AI 音樂生成樹立新標準。其結構意識、多模態能力與與 Google 生態的無縫整合,使其成為追求精準與可擴展性的專業人士與開發者首選。雖然 Suno v5 在面向休閒長內容創作方面更具性價比、Udio 在實驗性長度上更出色,但憑藉 API 存取與生態優勢,Lyria 3 Pro 在企業級應用中處於領先地位。
想在 CometAPI 上創作音樂嗎?CometAPI 目前提供 Suno v5,Lyria 3 Pro 即將推出。