Eminem-, Oasis-, The Beach Boys-klónok tűntek fel a közösségi médiában

2023. május 05. - ferenck

Egyre gyakoribb jelenség művészek utánzása mesterségesintelligencia-technikákkal. 2021-ben például fiatalon elhunyt sztárokat, köztük Jimi Hendrixet, Kurt Cobaint és Amy Winehouse-t emulálták, tavaly pedig az OpenAI bemutatta a népszerű zenészek stílusában számokat generáló Jukebox rendszert.

A lemezipar igyekszik szigorúan fellépni mindenféle fake ellen, a világpiac harmadát uraló UMC (Universal Music Group) pár hete szólította fel a legnagyobb streaming-szolgáltatókat a hozzá tartozó művészek zenei adatait használó MI-muzsikák blokkolására.

Az UMC hozzáállása nem meglepő, mert minden új technológiageneráció komoly és nehezen kezelhető kihívást jelent az ipar számára. Az 1970-es években elterjedt audiókazetták megkönnyítették a másolást, a következő évtizedben jött a hangmintavétel (sampling), az 1990-es és a 2000-es években pedig a remixek és a mashupok. Ma az MI jelenti az új kihívásokat.

Az iparágban nincs mindenki ellene. Az elektronika és a pop határán alkotó kanadai Grimes közölte, hogy bárkivel megosztja a bevételeit, aki lemásolja a hangját. Liam Gallaghernek, az Oasis korábbi énekesének kifejezetten tetszett az MI-utánzat.

A közösségi médiában az utóbbi hetekben több ismert zenész MI-vel generált utánzata tűnt fel: a Drake and The Weeknd stílusában előadott hip-hopot több tízmillióan hallgatták meg, mielőtt levették volna a netről. Aztán az 1990-es évek britpop sztárzenekera, az Oasis, a rapper Eminem, de még a jellegzetesen hatvanas évekbeli The Beach Boys is sorra került.

Hagyományosan szerzett és előadott számok csendülnek fel, amelyek hírességekre emlékeztető vokálokkal rétegződnek, folynak egybe. Utóbbiakat hangklónozó modellek hozzák létre.

Első lépés néhány perctől több óráig tartó hanganyag beszerzése, amelyen az énekes hangszeres és bármilyen kíséret nélkül hallható. A modell (Demucs3, Splitter, lalal.ai) „demixeli” az anyagot, kiszedi belőle a szükséges részeket. Az adatsoron hangklónozó modell (Soft Voice Cloning VITS, Respeecher, Murf.ai) tanulja meg az énekes hangszínének, hangmagasságának stb. utánzását.

Az új hanganyag felvétele a következő lépés. A modell az általa betanított hang hangszínének az előadás hangmagasságához és a szöveghez való hozzárendelésével dalt generál, amelyet digitális audió-munkaállomás (Audacity, Ableton Live, Logic Pro) kever össze hangszerekkel.