Lyria 3 Pro firmy Google, wydana 25 marca 2026 r., wyznacza duży skok w generowaniu muzyki przez AI. Produkuje pełnowymiarowe utwory do 3 minut z zaawansowaną świadomością struktury, dźwiękiem o wysokiej wierności 48kHz i wejściami multimodalnymi. Ten model przewyższa wcześniejsze wersje i wyróżnia się na tle konkurentów, takich jak Udio (ale w porównaniu z Suno mają swoje zalety), dla profesjonalnych twórców, deweloperów i firm.
Wydanie przez Google Lyria 3 Pro ma znaczenie, ponieważ przenosi muzykę AI z krótkich, eksperymentalnych klipów do bardziej przyjaznego produkcji formatu. Do niedawna funkcja muzyczna Google skierowana do konsumentów w aplikacji Gemini koncentrowała się na 30‑sekundowych piosenkach z okładką, ale Lyria 3 Pro rozszerza to doświadczenie na dłuższe, bardziej ustrukturyzowane kompozycje, bliższe temu, jak twórcy faktycznie myślą o pisaniu i aranżacji muzyki.
Czym jest Lyria 3 Pro?
Lyria 3 Pro to flagowy model generowania muzyki Google DeepMind. Jest zoptymalizowany do generowania pełnowymiarowych utworów o złożonej spójności strukturalnej, obejmujących wiele zwrotek, refrenów i mostków, a także potrafi generować wysokiej jakości dźwięk stereo 48kHz z podpowiedzi tekstowych lub wejść obrazowych. Lyria 3 to system generowania muzyki, który syntezuje audio z podpowiedzi tekstowych, wykorzystuje dyfuzję latentną i wyprowadza zarówno muzykę, jak i tekst.
W odróżnieniu od wcześniejszych wersji Lyria ograniczonych do krótkich klipów, wersja Pro dostarcza spójne, gotowe do emisji radiowej utwory, które zachowują naturalny przepływ, złożoność rytmu i dynamikę emocjonalną. Google podkreśla odpowiedzialny rozwój: wszystkie wyjścia są niewidocznie znakowane technologią SynthID dla detekcji AI, a rozbudowane filtry bezpieczeństwa zapobiegają treściom szkodliwym lub naśladującym materiały chronione prawem autorskim.
Szczegółowe objaśnienie możliwości
Największą zmianą w Lyria 3 Pro jest jej świadomość struktury.
Lyria 3 Pro rozumie komponenty piosenki, takie jak intro, zwrotka, refren i mostek. Określasz strukturę w podpowiedziach, a model skomponuje utwór zgodnie z tą strukturą.
1. Zaawansowana kontrola struktury utworu
Kluczową cechą jest świadomość strukturalna. Użytkownicy określają sekcje z sygnaturami czasowymi lub opisowymi podpowiedziami (np. „0:00‑0:15 intro, 0:15‑0:45 zwrotka 1, 0:45‑1:15 refren”). Model utrzymuje spójność melodii, harmonii i energii w całym utworze — to skok w porównaniu z wcześniejszym limitem 30 sekund.
Przykładowa podpowiedź:
„Stwórz 3‑minutowy, żywiołowy popowy utwór w C‑dur, 128 BPM: 0:00‑0:20 oniryczne syntezatorowe intro, 0:20‑0:50 zwrotka o pogoni za marzeniami, 0:50‑1:20 wpadający w ucho refren z warstwowymi wokalami, 1:20‑1:50 mostek z emocjonalnym dropem, 1:50‑2:20 finałowa kulminacja refrenu, 2:20‑3:00 wyciszające outro.”
2. Wysokiej wierności jakość dźwięku i muzykalność
Lyria 3 Pro wyprowadza stereo MP3 48kHz o jakości profesjonalnej, z realistycznymi instrumentami i ekspresyjnymi wokalami. Testy społeczności i dema Google podkreślają lepszą muzykalność i wierność w porównaniu z Lyria 3, z naturalnymi przejściami dźwięków i szeroką dynamiką.
Radzi sobie ze złożonymi aranżacjami (warstwowe harmonie, wariacje perkusyjne, mieszanie gatunków), jednocześnie zachowując zamysł artystyczny. Producenci tacy jak François K chwalą jej realizm i precyzję w dopracowywaniu pomysłów.
3. Wejścia multimodalne: tekst, obrazy i więcej
- Tekstowe podpowiedzi: proste („żywiołowa melodia urodzinowa”) lub szczegółowe (tempo, tonacja, nastrój, tekst).
- Obraz‑do‑muzyki: prześlij obraz (zdjęcie, dzieło sztuki), a model wygeneruje pasującą ścieżkę — idealne do synchronizacji z wideo lub wizualnej inspiracji.
- Kontrola tekstu: automatyczne generowanie lub dostarczenie własnych słów; model precyzyjnie dopasowuje wokal.
Integracja z Google Vids i ProducerAI umożliwia bezproblemowe tworzenie ścieżek dźwiękowych do wideo lub pełne przepływy produkcyjne.
4. Wszechstronność gatunkowa i globalny zasięg
Zakres stylów jest bardzo szeroki — od popu, funku, Motown, przez elektronikę i muzykę klasyczną, po hip‑hop. Google określa to jako „audio na poziomie profesjonalnym” i nie jest to przesada. Przynajmniej pod względem wierności dźwięku Lyria 3 Pro z pewnością może konkurować z Suno v5.
Obsługuje dziesiątki gatunków i podgatunków z autentycznymi niuansami kulturowymi. Wokale działają w wielu językach, umożliwiając twórcom na całym świecie tworzenie zlokalizowanych treści bez kosztów studia.
5. Bezpieczeństwo, etyka i funkcje korporacyjne
- Znakowanie wodne SynthID dla identyfikowalności.
- Filtry blokują treści wulgarne lub naruszające prawa.
- Narzędzia korporacyjne w Vertex AI do skalowalnego wdrażania z dostosowywaniem.
Jak uzyskać dostęp do Lyria 3 Pro i ile to kosztuje
Obecnie istnieje wiele ścieżek dostępu i to stanowi istotną część atrakcyjności Lyria 3 Pro. Dla zwykłych użytkowników Google informuje, że Lyria 3 jest dostępna w aplikacji Gemini dla użytkowników 18+ w kilku językach, z wyższymi limitami dla subskrybentów Google AI Plus, Pro i Ultra. Dla deweloperów i firm Google podaje, że Lyria 3 Pro jest dostępna w Vertex AI, Google AI Studio i Gemini API. Google wymienia również Google Vids i ProducerAI jako dodatkowe miejsca dostępu.
W przypadku dostępu konsumenckiego strony planów Google pokazują, że odpowiednimi subskrypcjami są Google AI Pro i Google AI Ultra, z dostępnością w ponad 150 krajach dla Google AI Pro i ponad 140 krajach dla Google AI Ultra. Google podaje też, że plany Google AI są dostępne wyłącznie dla osobistych kont Google, podczas gdy klienci Workspace potrzebują dodatku Gemini.
W przypadku dostępu dla deweloperów Google Cloud informuje, że możesz korzystać z Lyria przez konsolę Google Cloud lub Vertex AI API po włączeniu Vertex AI API w projekcie Google Cloud. Google zauważa również, że nowi klienci mogą otrzymać 300 USD darmowych kredytów, aby wypróbować Vertex AI i inne produkty Google Cloud.
Cennik (stan na marzec 2026):
Gemini API: $0.08 za pełny 3‑minutowy utwór (Lyria 3 Pro); $0.04 za 30‑sekundowy klip. Brak darmowego progu dla modelu Pro.
Vertex AI: Takie samo $0.08 za pełny utwór (wejście: tekst/obraz; wyjście: pełny utwór). Dostępne rabaty wolumenowe dla firm.
Plany aplikacji Gemini (przybliżone dzienne limity utworów):
- Google AI Plus (~$19.99/mo): ~10 utworów/dzień
- Google AI Pro (~$29.99/mo): ~20 utworów/dzień
- Google AI Ultra (~$99.99+/mo): ~50 utworów/dzień (zawiera większą przestrzeń na pliki)
Deweloperzy płacą za generację; hobbyści zaczynają w AI Studio.
Integracja Lyria 3 Pro: przykładowy kod w Pythonie dla deweloperów
Lyria 3 Pro jest w pełni programowalna przez Gemini API. Oto gotowy przykład w Pythonie (wymaga SDK google-generativeai; instalacja przez pip install google-generativeai):
import google.generativeai as genai
import os
# Skonfiguruj klucz API (uzyskaj z https://aistudio.google.com/app/apikey)
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
# Zainicjalizuj model (użyj 'lyria-3-pro-preview' dla pełnych utworów)
model = genai.GenerativeModel('lyria-3-pro-preview')
# Przykładowa multimodalna podpowiedź (tekst + opcjonalny obraz)
prompt = """
Wygeneruj pełny, 3-minutowy, energetyczny elektroniczny utwór taneczny:
- 0:00-0:20: Atmosferyczne intro z padami syntezatorowymi
- 0:20-1:00: Energetyczna zwrotka z kobiecymi wokalami o innowacji
- 1:00-1:40: Mocny, eksplodujący refren
- 1:40-2:10: Mostek typu breakdown
- 2:10-3:00: Finałowy refren + wyciszające outro
Tempo: 130 BPM, Tonacja: F-moll. Wysoka energia, gotowe na festiwal.
"""
# Opcjonalnie: dodaj wpływ obrazu
# image_file = genai.upload_file(path="mood_image.jpg")
# response = model.generate_content([prompt, image_file])
response = model.generate_content(prompt)
# Zapisz wygenerowane audio (response zawiera bajty MP3 + tekst piosenki)
if response.parts:
audio_bytes = response.parts[0].inline_data.data # binarne MP3
with open("lyria_pro_track.mp3", "wb") as f:
f.write(audio_bytes)
print("✅ Utwór wygenerowany! Tekst:", response.text) # Tekst piosenki jako tekst
else:
print("Generowanie nie powiodło się:", response)
Ten kod tworzy gotowy do produkcji utwór w kilka sekund. Skaluj z Vertex AI do przetwarzania wsadowego lub integruj z aplikacjami/webem. Pełny przewodnik generowania muzyki: ai.google.dev/gemini-api/docs/music-generation.
Podsumowanie:
Google Lyria 3 Pro wyznacza nowy standard ustrukturyzowanego, wysokiej wierności generowania muzyki przez AI w 2026 r. Jej świadomość struktury, moc multimodalna i bezproblemowa integracja z ekosystemem Google czynią ją najlepszym wyborem dla profesjonalistów i deweloperów szukających precyzji i skalowalności. Podczas gdy Suno v5 oferuje lepszą wartość dla swobodnego tworzenia długich form, a Udio wyróżnia się pod względem eksperymentalnych długości, dostęp przez API i ekosystem Lyria 3 Pro plasują ją jako lidera w środowiskach korporacyjnych.
Chcesz tworzyć muzykę w CometAPI? CometAPI oferuje obecnie suno v5, Lyria 3 Pro wkrótce.