Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Közeleg a szövegből zenét készítő mesterséges intelligencia áttörése?

2024. május 03. - ferenck

A korábbi szövegből zenét (text-to-music) generáló eszközöket viszonylag kötetlen formájú instrumentális kompozíciókra, és kevésbé dalokra, szerkesztett versekre, kórusokra, vokálokra tervezték.

Az áprilisban kiadott Stable Audio 2 maximum háromperces hangszeres számokat generál, jól megkülönböztethető nyitánnyal, középső résszel és befejezéssel. A felhasználó feltölthet audio track-eket, és a modellel módosíthat rajtuk.

hanggeneratorok.jpg

A szövegből képeket gyártó egy évvel ezelőtti modellekhez hasonlóan, a mostani szöveg-zene generátoroknál is nehezen irányítható az output. Alig reagálnak alapvető terminológiákra (tempó, harmónia stb.), és általános stílusokat kérnek, mint például az utóbbi ötven évben igencsak sok változáson átment, alstílusokban bővelkedő pop.

Hiteles dalokat előállító modellek megjelenésével eljöhet az audió MI-k „Midjourney pillanata”: a felhasználók széles köre jön rá, hogy a modell promptokra személyes igényeinek, ízlésének megfelelő muzsikát tud előállítani.

hanggeneratorok0.jpg

Az Udio webalapú generátora bevásárlóközponti háttérzenétől heavy metalig változatos stílusokban alkot. A 2023 végétől szolgáltató Sumo hasonló, nemrég frissítették a kínálatát.

Mindkettő promptokból teljes zenekaros anyagokat, promptonként kettőt generál, dalszövegekkel, énekkel, hangszer-szólókkal. A felhasználó létrehozhat vele szövegeket, sajátját is feltöltheti, letöltheti, megoszthatja másokkal az outputot.

A lejátszás és a lájkok száma alapján ranglisták készülnek róluk.

Az Udio regisztrált felhasználói maximum havi 1200 dalt generálhatnak ingyen. A szöveges utasítás mellett meg kell adniuk a stílust is. A rendszer automatikusan leírásokkal helyettesíti művészek neveit, és a kimenetek gyakran egy az egyben úgy hangzanak, mintha a kért zenészek munkái lennének.

A modell 33 másodperces hangszegmenseket generál, amelyeket meghosszabbíthatunk, remixelhetünk, módosíthatunk. A cég semmit nem árult el a mögöttes technológiáról.

A Sumo felhasználói napi tíz dalt generálhatnak ingyen. Megadjuk a promptot, mire a rendszer maximum kétperces anyaggal áll elő. Külön utasításokban specifikálhatjuk a szöveget, stílust, címet. Valódi művészek nevét tartalmazó promptból Sumo nem generál zenét, és a technológiáról sincs infónk.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr8718391831
süti beállítások módosítása