Czy sztuczna inteligencja zastąpi twórców piosenek? To źle postawione pytanie. Nie czy, tylko kiedy.

Co łączy Steviego Wondera z Billie Eilish, a muzyków Pearl Jam z R.E.M.? Opór wobec sztucznej inteligencji (AI), która rozwija się coraz szybciej i wkrótce może im zabrać pracę. Ponad 200 artystów podpisało w tej sprawie list protestacyjny autorstwa Artist Rights Alliance – stowarzyszenia autorów i wykonawców piosenek działającego na rzecz ochrony ich praw. Sygnatariusze domagają się od firm technologicznych zaprzestania prac nad rozwojem narzędzi, które podważają sens pracy twórczej i mają doprowadzić do eliminacji artystów z rynku. „Ten atak na ludzką kreatywność musi zostać powstrzymany. Musimy chronić się przed drapieżnym wykorzystaniem sztucznej inteligencji do kradzieży głosów i podobizn profesjonalnych artystów, naruszania praw twórców i niszczenia ekosystemu muzycznego” – napisano w liście.

Sztuczna piosenka zastąpi muzyków?

Środowisko nie ma złudzeń: generowanie nowych piosenek za pomocą już gotowych melodii czy linii wokalnych i przerabianie ich wedle dowolnych potrzeb to duży biznes dla producentów nowych technologii oraz platform streamingowych, które przestaną wkrótce potrzebować „kontentu muzycznego” od realnych twórców. Nie wystarczy więc apelować i czekać – trzeba zmieniać prawo, aby nie dać się zwyciężyć sztucznej piosence.

Jak pisze „The Guardian”, w marcu sprawy w swoje ręce wzięły władze stanu Tennessee, który jako pierwszy uchwalił przepisy w celu ochrony muzyków przed generowaniem ich podróbek przez sztuczną inteligencję na potrzeby komercyjne. Ustawa – mająca wejść w życie 1 lipca – dotyczy „zapewniania bezpieczeństwa podobizny, głosu i wizerunku” i zakazuje powielania głosu artystów bez ich zgody. Bo krótko mówiąc, AI uczy się śpiewać cudzym głosem, aby nagrać nowy utwór i nie płacić tantiem artyście, na którego twórczości się wytrenowała.

Metallica zaśpiewa wszystko

Z pozoru wygląda to niewinnie, a nawet fascynująco. Przypomnijmy zeszłoroczną premierę „nowej” piosenki Beatlesów – „Now And Then”. Wielka czwórka z Liverpoolu nie istnieje od ponad pół wieku, ale jej muzyka jest ciągle żywa, a w skrajnych przypadkach nawet ożywiana. Tak właśnie było z „Now And Then” – nagraniem, które w latach 90. nie weszło na żadną ze składankowych płyt z uwagi na bardzo słabą jakość materiału demo. Piosenka odczekała niemal 30 lat, kiedy z pomocą przyszła jej sztuczna inteligencja. Dzięki technologii uczenia maszynowego udało się wyizolować głos nieżyjącego Johna Lennona z tamtego nagrania i wykorzystać do najnowszej produkcji. Komputer nauczył się śpiewać jak Lennon.

Można zgadywać, co by było, gdyby Kurt Cobain żył, a Nirvana ciągle koncertowała i nagrywała. Firma Over The Bridge postanowiła zaspokoić ciekawość fanów kultowego zespołu i doprowadziła do stworzenia takiej piosenki. Rzecz nosi tytuł „Drowned In The Sun” i jest wynikiem działań sztucznej inteligencji. Generator dostał za zadanie nauczenie się, jak być Nirvaną – przeanalizował teksty i muzykę zespołu, przestudiował gitarowe riffy. Nie dał sobie rady jedynie z wokalem Cobaina, ale tutaj w sukurs przyszedł żywy artysta, który specjalizuje się w coverach legendy grunge’u, więc zaśpiewał i tę piosenkę. Eksperyment ubrano w szaty kampanii społecznej – nowy utwór miał towarzyszyć projektowi „The Lost Tapes of the 27 Club” i przypomnieć o przedwcześnie zmarłych artystach (do klubu 27, czyli muzyków, którzy nie dożyli 28. urodzin, poza Cobainem należą m.in. Jimi Hendrix, Janis Joplin, Jim Morrison czy Amy Winehouse), ale też zwrócić uwagę na problemy zdrowia psychicznego.

Nad Nirvaną pracowała profesjonalna firma. Wiele produkcji muzycznych wygenerowanych za pomocą AI to efekt swawolnych zabaw anonimowych internautów. Ktoś postanowił zlecić AI napisane piosenki o dinozaurach i wykorzystać do tego zadania brzmienie Metalliki i głos Jamesa Hetfielda. Rezultat jest gorzej niż kiepski, kreacja nie jest mocną stroną sztucznej inteligencji. Co innego podkładanie głosów. Niskim wokalem Hetfielda można zaśpiewać popową piosenkę z heavymetalowym zaśpiewem. Jak „Kiss From A Rose” Seala albo „Don’t Stop Me Now” Queen. Brzmi całkiem nieźle. Ktoś mógłby pomyśleć, że wokalista Metalliki faktycznie wykonał covery wspomnianych utworów, a to tylko igraszki sztucznej inteligencji – cudzym głosem i obcym utworem. Znawcy tematu nie dadzą się nabrać, ale dla wielu osób, które pierwszy raz natkną się na taką piosenkę w sieci, nie będzie miało znaczenia, kto ją śpiewał w oryginale. Posłuchają, bo fajnie brzmi, i nie będą dociekać nazwiska twórcy czy wykonawcy. Dlatego środowisko muzyków sprzeciwia się podobnym eksperymentom.

Domowy przebój

W internecie jest mnóstwo wirtualnych przewodników, jak zostać gwiazdą rocka czy królem disco. I są serwisy do generowania przebojów „łatwo, szybko i za darmo”. Wystarczy wejść na taką stronę i zarejestrować się, aby otrzymać bezpłatną pulę wirtualnych – dajmy na to: żetonów – do zrealizowania swoich nagrań. Tym sposobem da się wygenerować kilkanaście piosenek. Działa to podobnie jak abonament – jeśli przekroczymy limit, a zabawa spodobała się nam na tyle, że dalej chcemy produkować utwory, to musimy zapłacić za miesięczną subskrypcję.

Zabieramy się do „tworzenia”. W kreatorze jest wąskie okno dialogowe, w którym należy wpisać swoją myśl przewodnią: o czym ma być piosenka, np. „rockowy protest song pracowników korporacji przeciwko nadgodzinom w firmie”. Po chwili system wygeneruje żądany utwór – sam „napisze” słowa, sam „skomponuje” melodię. Nie musi być rock, może być blues albo rap – trzeba tylko poinformować AI, jakim stylem muzycznym ma operować. A jeśli ktoś nie wie, co to ma być i o czym, to wcale go nie wyklucza. Może się odwołać do wiedzy ChatGPT, a ten podsunie kilka dostępnych już pomysłów. Zrobione. Tekst napisany, utwór zaaranżowany, wizualizacja gotowa.

Co dalej? Nic, tylko opublikować na TikToku albo YouTubie i dołączyć do grona twórców. Jak tłumaczy przewodnik po takiej stronie internetowej, to najkrótsza droga, aby zostać producentem, tekściarzem i wokalistą w jednym. Lada chwila duzi wydawcy – za jednym kliknięciem myszki – będą mogli korzystać z takich wirtualnych artystów z toną przebojów i darmowych teledysków w dorobku. Albo sami ich wykreują. Ale po co komu wytwórnia czy studio nagrań, skoro w swoim mieszkaniu wyprodukuje oczekiwaną piosenkę zaśpiewaną ulubionym głosem na interesujący go temat?

Obietnica zrobienia twórcy przebojów z każdego trafia na podatny grunt. Czytam komentarze pod filmikiem. Ktoś już wyprodukował taką piosenkę i teraz chce zrobić teledysk. Ktoś inny chce z brytyjskiej piosenki Jamesa Blunta stworzyć polski hit i potrzebuje pomocy AI. Jednak gotowa muzyka, tekst i wykonanie to za mało – jeden z internautów zastanawia się, jak do tego podłożyć własny głos. Pojawia się w końcu wpis rozsądku, że tworzenie to wielomiesięczny proces i frajda, którą z tego można czerpać; AI to chwilowa zabawka; nie zastąpi radości prawdziwego tworzenia. Wywiązuje się dialog. Ktoś odpowiada, że jedno drugiemu nie przeszkadza – można tworzyć samemu, można polegać na AI (komponowanie zostawmy idealistom, a zarabianie pieniędzy każdemu, kto umiejętnie wykorzysta właściwości sztucznego generatora).

Muzyka będzie zabawą

Skoro tworzenie hitów jest tak dziecinnie proste, trzeba postawić pytanie, czy twórcy i wykonawcy są jeszcze komukolwiek potrzebni. Przecież powstają już całe albumy na podstawie zastosowania narzędzi AI. Taką płytę – „Matcha Latte, Contemplation” opublikował z pomocą wytwórni Dyspensa Records Julek Płoski, młody producent muzyki elektronicznej.

– Mówiąc pół żartem, pół serio, muzycy już od dawna nie są potrzebni, aby stworzyć piosenkę w studiu, ponieważ istnieją wirtualne instrumenty VST (ang. Virtual Studio Technology, czyli oprogramowanie od efektów studyjnych – red.) oraz całe cyfrowe środowisko produkcji muzycznej, które pozwala stworzyć chociażby utwór orkiestrowy w zaciszu swojego pokoju – odpowiada Piotr Lenartowicz, prezes Dyspensy Records oraz współzałożyciel start-upu Dyspensa. AI monitorującego rozwój sztucznej inteligencji w dziedzinie dźwięku i muzyki. Po chwili poważnieje i dodaje: – Nie doszliśmy jeszcze do momentu, w którym jesteśmy w stanie stworzyć pełny utwór muzyczny za pomocą narzędzi AI. Kluczowe jest tutaj słowo „jeszcze”, bo dosłownie kilka dni temu polska firma Eleven Labs opublikowała wyniki swoich prac nad narzędziem, które ma to już gwarantować. Efekty są fascynujące, ale i… przerażające.

Co przeraża? Fakt, że na podstawie zwykłego promptu (podpowiedzi, czego oczekujemy od AI) otrzymujemy kompletny utwór, naprawdę świetny – z ładną melodią, ciekawymi zabiegami artykulacyjnymi oraz zabawnym tekstem. To już nie są niedoskonałe przymiarki internautów do pisania tekstów i komponowania muzyki rękoma AI, z czego więcej jest zabawy niż dobrych piosenek. Eksperci mówią, że wynalazek Eleven Labs wygląda na absolutny game changer, który wstrząśnie branżą muzyczną.

Ona sama jest sobie trochę winna. Instytut Goldmedia sprawdził, jakie notowania ma AI wśród twórców w Niemczech i we Francji. Okazało się, że nieco ponad jedna trzecia autorów korzystała w pracy z algorytmów AI. W grupie poniżej 35. roku życia ten odsetek wzrósł aż do 51 proc. Twórcy złorzeczą na AI, ale coraz bardziej jej potrzebują. A ona ich coraz mniej. Co więcej, odbiera im chleb, który wydawał się najbardziej stabilnym źródłem dochodów i zapewniał względną niezależność zawodową. Mowa o opanowanym przez sztuczną inteligencję rynku reklamy.

– Realizując muzykę do dużych kampanii reklamowych, posiłkowaliśmy się już narzędziami bazującymi na algorytmach AI – przyznaje Lenartowicz. – Oczywiście do tej pory było to jedynie wspomaganie, ale nietrudno wyobrazić sobie scenariusz, że kiedy narzędzia, takie jak choćby wspominany produkt Eleven Labs, wejdą do powszechnego użytku, każda agencja reklamowa będzie z nich korzystać i nie zamówi już muzyki u producenta. Pierwszy raz to się stało, kiedy w branży pojawiała się muzyka stockowa. I bardzo „przerzedziła” rynek, na szczęście wyszedł z tego produkt niskiej jakości. Sztuczna inteligencja będzie, niestety, w stanie dostarczyć bardzo jakościową muzykę. I jak tu z nią konkurować?

Koniec historii piosenki

W całym tym procesie kluczowi są słuchacze. Kulturoznawca Stanisław Trzciński – autor książki „Zarażeni dźwiękiem. Rynek muzyczny w czasach sztucznej inteligencji” – zgadza się z tezą opublikowaną w czasopiśmie „Ruch Muzyczny” w 2022 r., że najbardziej prawdopodobnym scenariuszem staje się personalizacja doświadczenia słuchaczy, w tym dopasowanie ścieżki dźwiękowej do nastroju dnia i otoczenia danego odbiorcy, także poprzez tworzenie nieskończenie wielu wariantów tego samego utworu. Co to w praktyce oznacza? Koniec historii – używając określenia słynnego amerykańskiego politologa Francisa Fukuyamy – komponowania piosenek.

Ale znowu: to nic nowego. Trzciński przypomina esej Glenna Goulda. Pianista już w 1966 r. pisał o ludzkim uzależnieniu od muzyki, która jest w naszym życiu wszechobecna i dlatego traci szacunek w oczach odbiorców. Teraz to pole do zagospodarowania przez AI. Ona dostarcza słuchaczowi pożądany wariant muzyczny, zgodny z jego chwilowymi potrzebami czy emocjami. – Z badań wynika, że przeciętny człowiek ma kontakt z muzyką trzy, cztery razy dziennie. Jest coraz bardziej obeznany w muzyce i sprawny w radzeniu sobie z doznaniami muzycznymi. Cyfrowa dystrybucja jeszcze bardziej przyspieszyła te procesy. Bo przecież nie ma wątpliwości co do emocjonalnej siły piosenek i ich oddziaływania na zdecydowaną większość społeczeństwa – mówi Trzciński.

Jako przykład podaje pracę inżynierki dźwięku Susan Rogers nad albumem Prince’a „Purple Rain”. Razem z kolegą z uczelni, neurobiologiem Ogim Ogasem, Rogers zbadała, dlaczego lubiane przez nas utwory tak nas poruszają; dlaczego ich słuchamy i co to o nas mówi. Wyniki pokazują, że każdy człowiek ma unikalny profil słuchacza (o czym doskonale wiedzą Spotify i inne platformy streamingowe) zdefiniowany przez unikalną reakcję mózgu na siedem kluczowych wymiarów każdego nagrania: rytm, barwę/brzmienie, melodię, tekst, bycie nowością lub nie, realizm i autentyczność.

Profilowaniem zajmie się AI. Dopasuje piosenkę do prywatnych potrzeb. Tak będzie wyglądać ten rynek. To najpewniejszy scenariusz.

– Tak naprawdę nie jesteśmy w stanie przewidzieć, co się wydarzy. Rozwój sztucznej inteligencji jest tak szybki, że trudno nawet sobie wyobrazić, jaki będzie stan tej technologii za rok. W mojej opinii część artystów, a na pewno producentów, masteringowców, realizatorów nagrań i tym podobnych, niechybnie zostanie zastąpiona przez AI. Pozostają pytania: kiedy, jak wielu i w jakich obszarach – zastanawia się na głos Trzciński.

Spóźnione prawo

Na razie pewnym bezpiecznikiem dla żywych twórców są przepisy. Nic, co powstaje za pomocą AI – grafika, wideo, piosenka, tekst – nie jest utworem, czyli indywidualnym wytworem pracy twórczej. Aby nim było, musi zostać stworzone przez człowieka, bo tylko on jest podmiotem praw autorskich. Gdyby przyjąć, że wygenerowanie treści przez AI ma charakter aktu twórczego, to i tak rezultat tych działań nie będzie objęty ochroną prawną.

Takimi utworami można swobodnie obracać. – Sprzedawać, wykorzystywać w celach marketingowych, publikować, umieszczać na YouTubie – mówi dr Paula Skrzypecka, starsza prawnicza z Kancelarii Creativa Legal. – Na tyle, na ile zapewniają to warunki korzystania z narzędzia umożliwiającego jego generowanie, w szczególności postanowienia licencyjne. Jeśli tego rodzaju działania będą się odbywać na podstawie umowy o współpracę (np. pomiędzy agencją a marką), to wytwory mogą podlegać prawnej ochronie przewidzianej w tej konkretnej umowie. Przykładowo strony uznają, że wprowadzenie do wygenerowanej piosenki jakiegoś zakresu zmian spowoduje, że uznają tę piosenkę za utwór, na skutek czego agencja przenosi autorskie prawa majątkowe lub udziela licencji.

Autorzy – co wynika ze wspomnianego na początku listu – obawiają się kradzieży swojego wkładu twórczego do piosenek. I nie ma co zwalać winy na AI. Za sztuczną inteligencję bierze odpowiedzialność ten, kto ją wytrenował, czyli pozyskał dane i nakarmił nimi generator. Bo przecież mechanizm tylko wykonuje polecenia: analizuje wsad, wykrywa wzorce i na ich podstawie wytwarza zadaną treść – w tym przypadku piosenkę. Winny jest trener, czyli producent, który pobiera z sieci utwory i nie płaci za nie licencji. Winę ponosi też użytkownik, jeśli steruje generatorem w taki sposób, że bez zgody twórcy pierwotnego utworu dokonuje np. opracowania albo – co gorsza – dopuszcza się plagiatu.

– Jeśli chodzi o wykorzystanie już wygenerowanej piosenki, która może naruszać prawa autorskie, bo np. jej elementem jest utwór, do którego osoba posługująca się wytworem AI nie ma praw czy też licencji na takie jej wykorzystanie, odpowiedzialność będzie podążać za podmiotem korzystającym, czyli publikującym, sprzedającym, wykorzystującym w celach marketingowych. Dlatego m.in. tak ważna jest regulacja kwestii korzystania z generatywnej AI chociażby w umowach. Wyjątkiem tutaj może być skorzystanie np. z komercyjnej bazy piosenek na TikToku czy Instagramie i jej modyfikacja wyłącznie przy wykorzystaniu udostępnionych przez daną platformę narzędzi. Wówczas poruszamy się w ramach licencji właściciela tej platformy i nie powinniśmy narażać się na roszczenia – tłumaczy dr Skrzypecka.

Spodziewana jest liberalizacja przepisów. Prawniczka przypomina o czekającej nas implementacji dyrektywy DSM (Digital Single Market), która wprowadzi nową postać dozwolonego użytku utworów obejmującą m.in. wytrenowanie modelu AI.

Czy to uspokoi rynek? Zdaniem Lenartowicza regulacje prawne nie nadążą za rynkową praktyką. Inicjatywy podejmowane przez rząd amerykański czy Komisję Europejską przyszły za późno. – Co nie znaczy, że nie należy ich podejmować – zaznacza Lenartowicz. – Kluczowe jest pytanie, w jaki sposób powinni zachować się artyści, których twórczość stanowi „pokarm” dla algorytmów sztucznej inteligencji. Można się oczywiście na to nie godzić i próbować z tym walczyć, ale nie ma raczej większych szans na powodzenie. Inną postawą jest ta prezentowana np. przez Grimes (pseudonim kanadyjskiej piosenkarki Claire Boucher – red.), która pozwala wszystkim na korzystanie z jej utworów. Ale pod warunkiem uwzględnienia jej w ewentualnych profitach, jaki ten nowy twór przyniesie. ©Ⓟ

Za sztuczną inteligencję bierze odpowiedzialność ten, kto ją wytrenował, czyli pozyskał dane i nakarmił nimi generator. Bo przecież mechanizm tylko wykonuje polecenia: analizuje wsad, wykrywa wzorce i na ich podstawie wytwarza zadaną treść – w tym przypadku piosenkę