Lyria 3 Pro là gì?

CometAPI
AnnaMar 30, 2026
Lyria 3 Pro là gì?

Lyria 3 Pro của Google, phát hành vào ngày 25 tháng 3 năm 2026, đánh dấu một bước nhảy vọt lớn trong tạo nhạc bằng AI. Nó tạo ra các bài hát đầy đủ độ dài lên đến 3 phút với khả năng nhận biết cấu trúc nâng cao, âm thanh 48kHz độ trung thực cao và đầu vào đa phương thức. Mô hình này vượt trội so với các phiên bản trước và nổi bật so với đối thủ như Udio (nhưng so với Suno thì mỗi bên đều có lợi thế) dành cho các nhà sáng tạo chuyên nghiệp, nhà phát triển và doanh nghiệp.

Việc Google phát hành Lyria 3 Pro có ý nghĩa vì nó đưa âm nhạc AI từ các đoạn ngắn mang tính thử nghiệm sang định dạng thân thiện với sản xuất hơn. Cho đến gần đây, tính năng tạo nhạc hướng tới người dùng của Google trong ứng dụng Gemini tập trung vào các bài 30 giây kèm ảnh bìa, nhưng Lyria 3 Pro mở rộng trải nghiệm đó thành các tác phẩm dài hơn, có cấu trúc hơn, gần với cách các nhà sáng tạo thực sự nghĩ về việc viết và hòa âm.

Lyria 3 Pro là gì?

Lyria 3 Pro là mô hình tạo nhạc chủ lực của Google DeepMind. Nó được tối ưu để tạo các bài hát đầy đủ với độ liên kết cấu trúc phức tạp, bao gồm nhiều verse, chorus và bridge, và có thể tạo âm thanh stereo 48kHz chất lượng cao từ prompt văn bản hoặc đầu vào hình ảnh. Lyria 3 là một hệ thống tạo nhạc tổng hợp âm thanh từ prompt văn bản, sử dụng khuếch tán tiềm ẩn, và xuất ra cả nhạc lẫn lời.

Không giống các phiên bản Lyria trước bị giới hạn ở các đoạn ngắn, bản Pro cho ra các bản nhạc gắn kết, đạt chuẩn phát sóng, duy trì dòng chảy tự nhiên, độ phức tạp về nhịp điệu và động lực cảm xúc. Google nhấn mạnh phát triển có trách nhiệm: mọi đầu ra đều được đóng dấu thủy vân khó nhận thấy bằng công nghệ SynthID để nhận diện AI, và các bộ lọc an toàn rộng rãi ngăn nội dung gây hại hoặc bắt chước nội dung có bản quyền.

Giải thích chi tiết về khả năng

Thay đổi lớn nhất của Lyria 3 Pro là nhận thức về cấu trúc.

Lyria 3 Pro có thể hiểu các thành phần bài hát như intro, verse, chorus và bridge. Bạn chỉ định cấu trúc trong prompt, và nó sẽ soạn bài theo cấu trúc đó.

1. Kiểm soát cấu trúc bài hát nâng cao

Tính năng nổi bật là nhận thức cấu trúc. Người dùng chỉ định các đoạn với mốc thời gian hoặc prompt mô tả (ví dụ: “0:00-0:15 intro, 0:15-0:45 verse 1, 0:45-1:15 chorus”). Mô hình duy trì sự nhất quán về giai điệu, hòa âm và năng lượng trên toàn bộ track — một bước nhảy so với giới hạn 30 giây trước đây.

Ví dụ prompt:
“Tạo một bản pop sôi động dài 3 phút ở cung Đô trưởng (C major), 128 BPM: 0:00-0:20 phần mở đầu mơ màng với synth, 0:20-0:50 verse về theo đuổi ước mơ, 0:50-1:20 điệp khúc bắt tai với vocal nhiều lớp, 1:20-1:50 bridge với đoạn hạ cảm xúc, 1:50-2:20 build đến điệp khúc cuối, 2:20-3:00 outro fade.”

2. Chất lượng âm thanh độ trung thực cao & nhạc tính

Lyria 3 Pro xuất ra MP3 stereo 48kHz với độ rõ chuyên nghiệp, nhạc cụ chân thực và giọng hát biểu cảm. Thử nghiệm cộng đồng và bản demo của Google cho thấy nhạc tính và độ trung thực vượt trội so với Lyria 3, với chuyển nốt tự nhiên và dải động tốt.

Nó xử lý các phối khí phức tạp (hòa âm nhiều lớp, biến hóa bộ gõ, pha trộn thể loại) đồng thời giữ nguyên ý đồ nghệ thuật. Các producer như François K khen ngợi tính chân thực và độ chính xác của nó trong việc tinh chỉnh ý tưởng.

3. Đầu vào đa phương thức: Văn bản, Hình ảnh & hơn thế

  • Văn bản nhắc: Đơn giản (“giai điệu sinh nhật sôi động”) hoặc chi tiết (tempo, giọng/khóa, tâm trạng, lời).
  • Image-to-Music: Tải lên một hình ảnh (ảnh, tác phẩm nghệ thuật) và tạo soundtrack phù hợp — lý tưởng cho đồng bộ video hoặc gợi cảm hứng thị giác.
  • Kiểm soát lời bài hát: Tự động tạo hoặc cung cấp lời tùy chỉnh; mô hình căn chỉnh giọng hát chính xác.

Tích hợp với Google Vids và ProducerAI cho phép tạo soundtrack cho video hoặc quy trình sản xuất trọn gói một cách liền mạch.

4. Đa dạng thể loại & phạm vi toàn cầu

Phổ phong cách cũng khá rộng, bao trùm từ pop, funk, Motown đến electronic, classical và hip-hop. Google gọi đó là "professional-grade audio", và điều này không hề cường điệu. Ít nhất về độ trung thực âm thanh, Lyria 3 Pro hoàn toàn có thể cạnh tranh với Suno v5.

Hỗ trợ hàng chục thể loại và phân nhánh với sắc thái văn hóa chân thực. Giọng hát hoạt động ở nhiều ngôn ngữ, cho phép nhà sáng tạo toàn cầu tạo nội dung bản địa hóa mà không tốn chi phí studio.

5. An toàn, đạo đức & tính năng cho doanh nghiệp

  • Đóng dấu SynthID để truy xuất nguồn.
  • Bộ lọc chặn nội dung tục tĩu hoặc vi phạm.
  • Công cụ doanh nghiệp trong Vertex AI để triển khai ở quy mô lớn với tinh chỉnh tùy biến.

Cách truy cập Lyria 3 Pro và chi phí

Hiện có nhiều cách truy cập, và đó là phần hấp dẫn lớn của Lyria 3 Pro. Với người dùng phổ thông, Google cho biết Lyria 3 có trong ứng dụng Gemini cho người dùng 18+ bằng một số ngôn ngữ, với giới hạn cao hơn cho người đăng ký Google AI Plus, Pro và Ultra. Với nhà phát triển và doanh nghiệp, Google cho biết Lyria 3 Pro có trong Vertex AI, Google AI StudioGemini API. Google cũng liệt kê Google VidsProducerAI là các bề mặt bổ sung.

Với người dùng tiêu dùng, trang gói của Google cho thấy Google AI ProGoogle AI Ultra là các gói liên quan, với phạm vi sẵn dùng ở hơn 150 quốc gia cho Google AI Pro và hơn 140 quốc gia cho Google AI Ultra. Google cũng nêu rõ các gói Google AI chỉ sẵn cho Tài khoản Google cá nhân, trong khi khách hàng Workspace cần mua add-on Gemini.

Với nhà phát triển, Google Cloud cho biết bạn có thể dùng Lyria qua bảng điều khiển Google Cloud hoặc Vertex AI API sau khi bật Vertex AI API trong một dự án Google Cloud. Google cũng lưu ý khách hàng mới có thể nhận $300 tín dụng miễn phí để thử Vertex AI và các sản phẩm Google Cloud khác.

Giá (tính đến Tháng 3 năm 2026):

Gemini API: $0.08 cho mỗi bài đầy đủ 3 phút (Lyria 3 Pro); $0.04 cho mỗi đoạn 30 giây. Không có tầng miễn phí cho mẫu Pro.

Vertex AI: Cùng mức $0.08 cho mỗi bài đầy đủ (đầu vào: văn bản/hình ảnh; đầu ra: bài đầy đủ). Có chiết khấu theo sản lượng cho doanh nghiệp.

Gói ứng dụng Gemini (giới hạn số bài mỗi ngày ước tính):

  • Google AI Plus (~$19.99/tháng): ~10 bài/ngày
  • Google AI Pro (~$29.99/tháng): ~20 bài/ngày
  • Google AI Ultra (~$99.99+/tháng): ~50 bài/ngày (kèm dung lượng lưu trữ cao hơn)

Nhà phát triển trả theo lượt tạo; người đam mê có thể bắt đầu trong AI Studio.

Tích hợp Lyria 3 Pro: Ví dụ mã Python cho nhà phát triển

Lyria 3 Pro có thể lập trình đầy đủ qua Gemini API. Dưới đây là ví dụ Python sẵn dùng (cần SDK google-generativeai; cài qua pip install google-generativeai):

import google.generativeai as genai
import os

# Cấu hình khóa API (lấy từ https://aistudio.google.com/app/apikey)
genai.configure(api_key=os.environ["GEMINI_API_KEY"])

# Khởi tạo mô hình (dùng 'lyria-3-pro-preview' cho bài hát đầy đủ)
model = genai.GenerativeModel('lyria-3-pro-preview')

# Ví dụ prompt đa phương thức (văn bản + hình ảnh tùy chọn)
prompt = """
Tạo một bản nhạc dance điện tử sôi động dài 3 phút:
- 0:00-0:20: Phần mở đầu giàu không khí với pad synth
- 0:20-1:00: Verse giàu năng lượng với giọng nữ về sự đổi mới
- 1:00-1:40: Điệp khúc bùng nổ
- 1:40-2:10: Bridge breakdown
- 2:10-3:00: Điệp khúc cuối + outro fade dần
Tempo: 130 BPM, Key: Fa thứ (F minor). Năng lượng cao, sẵn sàng cho lễ hội.
"""

# Tùy chọn: Thêm ảnh làm ảnh hưởng
# image_file = genai.upload_file(path="mood_image.jpg")
# response = model.generate_content([prompt, image_file])

response = model.generate_content(prompt)

# Lưu âm thanh đã tạo (response chứa dữ liệu MP3 + lời bài hát)
if response.parts:
    audio_bytes = response.parts[0].inline_data.data  # Nhị phân MP3
    with open("lyria_pro_track.mp3", "wb") as f:
        f.write(audio_bytes)
    print("✅ Đã tạo track! Lời bài hát:", response.text)  # Lời dưới dạng văn bản
else:
    print("Tạo không thành công:", response)

Đoạn mã này tạo một track sẵn sàng cho sản xuất trong vài giây. Mở rộng với Vertex AI cho xử lý hàng loạt hoặc tích hợp vào web/ứng dụng. Hướng dẫn tạo nhạc đầy đủ: ai.google.dev/gemini-api/docs/music-generation.

Kết luận:

Google Lyria 3 Pro đặt ra tiêu chuẩn mới cho tạo nhạc AI có cấu trúc và độ trung thực cao vào năm 2026. Nhận thức về cấu trúc, sức mạnh đa phương thức và tích hợp liền mạch với hệ sinh thái Google khiến nó trở thành lựa chọn hàng đầu cho chuyên gia và nhà phát triển tìm kiếm độ chính xác và khả năng mở rộng. Trong khi Suno v5 mang lại giá trị tốt hơn cho sáng tạo dài hơi mang tính casual và Udio vượt trội ở độ dài mang tính thử nghiệm, khả năng truy cập API và hệ sinh thái của Lyria 3 Pro định vị nó là ứng cử viên hàng đầu cho doanh nghiệp.

Bạn có muốn tạo nhạc trên CometAPI không? CometAPI hiện cung cấp suno v5, Lyria 3 Pro sắp ra mắt.

Sẵn sàng giảm 20% chi phí phát triển AI?

Bắt đầu miễn phí trong vài phút. Bao gồm tín dụng dùng thử miễn phí. Không cần thẻ tín dụng.

Đọc thêm