Google 的 Lyria 3 Pro 于 2026 年 3 月 25 日发布,标志着 AI 音乐生成的一大飞跃。它能够基于多模态输入,生成最长 3 分钟、具备先进结构感知的完整歌曲,并输出高保真 48 kHz 音频。相较早期版本,该模型表现更优,并在与 Udio 等竞品的对比中脱颖而出(但与 Suno 相比各有优势),适用于专业创作者、开发者与企业。
Google 发布 Lyria 3 Pro 意义重大,因为它将 AI 音乐从短小、实验性的片段推进到更适合制作的形态。直到最近,Google 在 Gemini 应用面向消费者的音乐功能仍以带封面图的 30 秒歌曲为主,而 Lyria 3 Pro 将这一体验扩展到更长、更具结构性的作品,更贴近创作者对作曲与编曲的真实思维方式。
什么是 Lyria 3 Pro?
Lyria 3 Pro 是 Google DeepMind 的旗舰级音乐生成模型。它针对具有复杂结构连贯性的完整歌曲进行了优化,涵盖多段主歌、副歌与桥段,并可从文本提示或图像输入生成高质量的 48 kHz 立体声音频。Lyria 3 是一种音乐生成系统,基于文本提示合成音频,采用潜在扩散,并可同时输出音乐与歌词。
不同于早期仅限短片段的 Lyria 版本,Pro 模型能够产出连贯、达播出水准的曲目,保持自然的流畅性、节奏复杂度与情感动态。Google 强调负责任的研发:所有输出均通过 SynthID 技术进行不可感知的水印标记,便于 AI 检测,并配备广泛的安全过滤以防止有害或仿冒受版权保护的内容。
能力详解
Lyria 3 Pro 最大的变化在于其结构感知能力。
Lyria 3 Pro 能理解曲目的各个组成部分,如前奏、主歌、副歌与桥段。你可以在提示中指定结构,它会按照该结构进行创作。
1. 高级歌曲结构控制
最突出的特性是结构感知。用户可通过时间戳或描述性提示指定分段(例如:“0:00-0:15 前奏,0:15-0:45 主歌1,0:45-1:15 副歌”)。该模型在整首曲目中保持旋律、和声与能量的一致性——相较此前 30 秒的限制是一次飞跃。
示例提示:
“创作一首时长 3 分钟、C 大调、128 BPM 的欢快流行曲:0:00-0:20 迷幻合成器前奏,0:20-0:50 关于追逐梦想的主歌,0:50-1:20 具有层叠人声的洗脑副歌,1:20-1:50 带情绪下潜的桥段,1:50-2:20 最终副歌推进,2:20-3:00 尾声淡出。”
2. 高保真音质与音乐性
Lyria 3 Pro 输出 48 kHz 立体声 MP3,具备专业级清晰度、逼真的配器与富有表现力的人声。社区测试与 Google 演示显示,其相较 Lyria 3 在音乐性与保真度上更胜一筹,音符过渡自然,动态范围出色。
它能够处理复杂编配(层叠和声、打击乐变化、风格融合),同时保留艺术意图。包括 François K 在内的制作人称赞其真实感与精确性,适合打磨创意。
3. 多模态输入:文本、图像与更多
- 文本提示: 可为简单(“欢快的生日曲”)或详细(节奏、调性、情绪、歌词)。
- 图像转音乐: 上传一张图片(照片、艺术作品)并生成相匹配的配乐——非常适合视频同步或视觉灵感。
- 歌词控制: 可自动生成或提供自定义歌词;模型会精准对齐人声。
与 Google Vids 和 ProducerAI 的集成可实现无缝的视频配乐生成或完整制作流程。
4. 风格多样性与全球覆盖
其风格覆盖面也相当广泛,从流行、放克、Motown 到电子、古典与嘻哈一应俱全。Google 称之为“专业级音频”,这并不夸张。至少在音频保真度方面,Lyria 3 Pro 完全可以与 Suno v5 抗衡。
它支持数十种风格及子流派,并呈现真实的文化细微差异。人声可覆盖多种语言,让全球创作者无需录音棚成本即可创作本地化内容。
5. 安全、伦理与企业特性
- 使用 SynthID 水印以实现可追溯性。
- 过滤器可拦截露骨或侵权内容。
- Vertex AI 中的企业工具支持可扩展部署与自定义微调。
如何访问 Lyria 3 Pro 及其费用
现在已有多种访问路径,这是 Lyria 3 Pro 吸引力的重要组成部分。对于普通用户,Google 表示 Lyria 3 已在 Gemini 应用 中面向 18 岁及以上 用户、提供多种语言版本,对 Google AI Plus、Pro 与 Ultra 订阅者 提供更高额度。对于开发者与企业,Google 表示 Lyria 3 Pro 可通过 Vertex AI、Google AI Studio 与 Gemini API 使用。Google 还列出了 Google Vids 与 ProducerAI 作为其他入口。
对于面向消费者的访问,Google 的套餐页面显示 Google AI Pro 与 Google AI Ultra 是相关订阅,其中 Google AI Pro 在 150 多个国家/地区 可用,Google AI Ultra 在 140 多个国家/地区 可用。Google 还表示,Google AI 套餐仅面向 个人 Google 帐号 提供,Workspace 客户需要购买 Gemini 附加组件。
对于开发者访问,Google Cloud 表示,在 Google Cloud 项目中启用 Vertex AI API 后,可通过 Google Cloud 控制台 或 Vertex AI API 使用 Lyria。Google 还指出,新客户可获得 $300 免费额度 以试用 Vertex AI 与其他 Google Cloud 产品。
定价(截至 2026 年 3 月):
Gemini API: 每首完整 3 分钟歌曲 $0.08(Lyria 3 Pro);每段 30 秒片段 $0.04。Pro 模型无免费层。
Vertex AI: 每首完整歌曲同为 $0.08(输入:文本/图像;输出:完整歌曲)。提供企业批量折扣。
Gemini 应用套餐(每日曲目上限,约值):
- Google AI Plus(约 $19.99/月):约 10 首/天
- Google AI Pro(约 $29.99/月):约 20 首/天
- Google AI Ultra(约 $99.99+/月):约 50 首/天(包含更高存储)
开发者按次计费;爱好者可在 AI Studio 入门。
集成 Lyria 3 Pro:面向开发者的 Python 代码示例
Lyria 3 Pro 可通过 Gemini API 进行完整编程。以下是一个可直接使用的 Python 示例(需要 google-generativeai SDK;通过 pip install google-generativeai 安装):
import google.generativeai as genai
import os
# Configure API key (get from https://aistudio.google.com/app/apikey)
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
# Initialize the model (use 'lyria-3-pro-preview' for full songs)
model = genai.GenerativeModel('lyria-3-pro-preview')
# Example multimodal prompt (text + optional image)
prompt = """
Generate a full 3-minute upbeat electronic dance track:
- 0:00-0:20: Atmospheric intro with synth pads
- 0:20-1:00: Energetic verse with female vocals about innovation
- 1:00-1:40: Explosive chorus
- 1:40-2:10: Breakdown bridge
- 2:10-3:00: Final chorus + outro fade
Tempo: 130 BPM, Key: F minor. High energy, festival-ready.
"""
# Optional: Add image influence
# image_file = genai.upload_file(path="mood_image.jpg")
# response = model.generate_content([prompt, image_file])
response = model.generate_content(prompt)
# Save the generated audio (response contains MP3 bytes + lyrics)
if response.parts:
audio_bytes = response.parts[0].inline_data.data # MP3 binary
with open("lyria_pro_track.mp3", "wb") as f:
f.write(audio_bytes)
print("✅ Track generated! Lyrics:", response.text) # Lyrics as text
else:
print("Generation failed:", response)
这段代码可在数秒内生成可用于制作的曲目。可结合 Vertex AI 进行批处理扩展,或集成到网页/应用中。完整音乐生成指南:ai.google.dev/gemini-api/docs/music-generation。
结论:
2026 年,Google Lyria 3 Pro 为结构化、高保真 AI 音乐生成树立了新标准。其结构感知、多模态能力与与 Google 生态的无缝集成,使其成为追求精度与可扩展性的专业人士与开发者的首选。尽管 Suno v5 在面向休闲的长篇生成方面更具性价比、Udio 在实验性长度上更为出色,但凭借 API 访问与生态体系,Lyria 3 Pro 成为企业领域的领跑者。
想在 CometAPI 上创作音乐吗?CometAPI 目前提供 Suno v5,Lyria 3 Pro 即将上线。