Firma Meta zaprezentowała kod MusicGen, nowatorskiego narzędzia do generowania muzyki wykorzystującego sztuczną inteligencję. System ten umożliwia przekształcanie opisów tekstowych w autentyczne kompozycje muzyczne. Dostępne online demo pozwala na łatwe przetestowanie jego możliwości za pomocą standardowej przeglądarki internetowej. Uzyskane rezultaty są obiecujące i ilustrują postęp w dziedzinie muzycznych modeli AI.
Poniżej przedstawiamy najważniejsze informacje o MusicGen oraz instrukcję tworzenia muzyki za jego pomocą.
Czym jest MusicGen?
W czerwcu 2023 roku Meta wprowadziła na rynek MusicGen, model sztucznej inteligencji dedykowany generowaniu muzyki. Choć nie jest to pierwsze tego typu rozwiązanie (wcześniej pojawiły się Jukebox od OpenAI czy MusicLM), to wyróżnia się udostępnieniem kodu źródłowego. Dzięki temu, użytkownicy posiadający kartę graficzną z minimum 16 GB pamięci (choć udało się go uruchomić z 11 GB) mogą uruchomić oprogramowanie na swoim komputerze.
Dla osób bez odpowiedniego sprzętu, dostępna jest darmowa aplikacja internetowa. Wersja demo pozwala na wygenerowanie 12-sekundowego fragmentu audio w ciągu około minuty.
Jak brzmi MusicGen?
Według Meta, MusicGen generuje próbki muzyczne o wysokiej jakości. Warto jednak zaznaczyć, że jakość ta została zdefiniowana przez twórców jako 32 kHz, co plasuje się pomiędzy standardem syntezy mowy (16 kHz) a standardową jakością muzyki cyfrowej (44,1 kHz).
Oczywiście, jakość dźwięku nie dorównuje standardom radiowym czy platform streamingowych. Jednak biorąc pod uwagę postęp w dziedzinie generatorów muzyki AI, jakość dźwięku jest zadowalająca, a poziom zakłóceń niski.
Czy generowana muzyka faktycznie odpowiada podanym opisom? Zachęcamy do samodzielnej oceny, zapoznając się z zamieszczonymi przykładami. W ogólnej ocenie, generowane utwory są zgodne z popularnymi gatunkami muzycznymi i wykazują bardziej spójną strukturę niż wcześniejsze generatory.
Jak generować muzykę za pomocą MusicGen
Korzystanie z MusicGen jest intuicyjne i nie wymaga rejestracji. Prostota interfejsu zachęca do eksperymentów.
Oto kroki, które należy wykonać, aby stworzyć muzykę:

Dostarczone melodie będą stanowiły referencję, dzięki czemu uzyskasz bardziej dopasowane rezultaty. To szczególnie użyteczne narzędzie do precyzowania wygenerowanej muzyki.
Jakie są ograniczenia dotyczące korzystania z dźwięku MusicGen?
Kod źródłowy MusicGen jest udostępniany bezpłatnie na licencji MIT. Natomiast, kwestia ograniczeń prawnych dotyczących generowanej muzyki pozostaje niejasna. Warto zapoznać się z ostrzeżeniem od firmy Meta:
„Model nie powinien być wykorzystywany do tworzenia utworów o charakterze wrogim lub wyobcowującym. Obejmuje to generowanie muzyki, która może być odbierana jako niepokojąca, stresująca lub obraźliwa, a także treści propagujące stereotypy.”
Meta podkreśla, że MusicGen ma służyć celom badawczym, a nie działaniom komercyjnym, takim jak dystrybucja wygenerowanej muzyki na platformach streamingowych.
Kwestie etyczne związane z generowaniem muzyki przez AI obejmują także kwestie wykorzystania danych do szkolenia modeli oraz wynagradzania twórców w odpowiednich sytuacjach. Dlatego Meta postępuje z ostrożnością.
Podsumowując, zabawa z modelem nie powinna powodować problemów. Sytuacja komplikuje się, gdy chodzi o komercyjne wykorzystanie dźwięków. Wiele osób zastanawia się, jak sztuczna inteligencja wpłynie na przyszłość muzyki pop.
Meta wprowadziła MusicGen jako otwarty model AI, który potrafi generować muzykę na podstawie opisu tekstowego. Zachęcamy do przetestowania tej technologii za pomocą udostępnionego demo w przeglądarce.
newsblog.pl
Maciej – redaktor, pasjonat technologii i samozwańczy pogromca błędów w systemie Windows. Zna Linuxa lepiej niż własną lodówkę, a kawa to jego główne źródło zasilania. Pisze, testuje, naprawia – i czasem nawet wyłącza i włącza ponownie. W wolnych chwilach udaje, że odpoczywa, ale i tak kończy z laptopem na kolanach.