A Massachusetts állambeli Modulate startup személyek hangját álcázó, inkognitóba rejtő megoldást kínál. Az ezúttal jó célokat szolgáló deepfake-technológia elsősorban a hangjukkal negatív előítéleteket kiváltó és verbális online visszaélésnek kitett transzneműeknek, de az online szexuális molesztálás más céltábláinak, elsősorban nőknek is hasznos lehet.
Az online visszaélések háttérbe szorításában, a mesterséges hangok mellett azonban a humán és a gépi moderátoroknak is hatékonyabban kellene tevékenykedniük. Például kiszűrhetik a rosszindulatú hangklónokat, mert természetesen ez a technológia is felhasználható alantas célokra.
A hang miatti előítéletek következményeként sokan hagynak ott népszerű videojátékokat, tűnnek el a közösségi médiáról, lépnek le más platformokról, olyanokról, ahol az audió a kommunikáció és az ottani „létezés’ alapeleme. Ezek az oldalak egy idő után kevésbé lesznek vonzók, az üzemeltetőknek komoly anyagi és erkölcsi veszteségei lehetnek.
A Modulate internetes chat közben, valósidőben hallható mesterséges hangjai egész élethűnek, realisztikusnak tűnnek. A VoiceWear rendszer generatív ellenséges hálózatként (GAN) működik. Egy idegháló-modell a beszélő szavait szintetikus hangra cseréli, és egy másik ideghálót megpróbál átvágni vele. Utóbbi kiértékeli az outputot, megmondja róla, hogy valódi vagy szintetikus.
A VoiceWeart többszáz személy hangmintáin gyakoroltatták. A beszélők sok intonációval, érzelemgazdagon kommunikáltak.
A Moderate eredetileg speciális karaktereket játszó gamerekre gondolt, de a transznemű közösség visszajelzései meggyőzték a céget, hogy a gender-identitásra is figyeljenek oda, a géphang kapcsolódjon hozzá.
Animaze appjukon egy női és egy férfihang hallható, videohívásoknál vagy live streameknél digitális avatárokat generálnak hozzájuk. A cég már hét játékstúdióval dolgozik együtt azon, hogy a technológia minél szélesebb körben legyen ismert, bővüljenek a piaci értékesítés lehetőségei.
Rendelkezésre állnak a hangot megváltoztató más rendszerek is, legtöbbjük viszont – egyszerű számítási technikákkal – csak a hangmagasságot viszi lejjebb vagy feljebb. Torzított vagy robotikus hangok a végeredmény.