Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Feltámaszthatók a dinoszauruszok

2021. április 08. - ferenck

Elon Musk 2016-ban alapította a Neuralinket. A techguru egyik legambiciózusabb vállalkozásának célja az emberi agy tényleges összekötése a számítógéppel (Brain Computer Interface, BCI), mert csak így tudjuk magunkba integrálni, a szerinte az emberiségre leselkedő legnagyobb veszélyt, a mesterséges intelligenciát.

Max Hodak társalapító nemrég nyilatkozta, hogy BCI technológiájukkal a játékipart is forradalmasítani fogják, a napokban pedig még meghökkentőbbet mondott.

„Ha akarnánk, valószínűleg létre tudnánk hozni a Jurrasic Parkot. A dinoszauruszok genetikailag ugyan nem lennének autentikusak, de… Tizenöt év tenyésztés és mérnöki tervezés után szuperegzotikus új fajok jelenhetnek meg” – jelentette ki.

jurrasic.jpg

A Jurrasic Park és a Jurrasic Világ a sci-fi író Michael Crichton bestsellerén alapuló filmsorozat, eddig öt mozi, de már készül a hatodik. Mindegyik arról szól, hogy mennyire rossz ötlet a jura-kori élővilág, nevezetesen a dinoszauruszok újraalkotása napjainkban.

A genetikai kutatások legújabb eredményeinek felhasználása új lények létrehozására nagyon izgalmas ötlet, viszont ha valami elvileg kivitelezhető, egyáltalán nem biztos, hogy tényleg van értelme. Sőt, sok esetben úgy tűnik: nagyon nincs.

Új dinoszauruszok teremtése nemcsak szórakoztató és játékos munka, hanem Hodak szerint a biológiai sokszínűség, a biodiverzitás növelése is egyben. Azért van szükség rá, mert a jelen egyik trendje pontosan ezzel ellentétes folyamatok összessége: fajok tömeges kipusztulásának, a beszűkülő életterek korszakának közepén járunk.

„A biodiverzitás komoly érték, a természet megőrzése nagyon fontos. De miért állunk meg ott, hogy ezt elmondjuk? Miért nem lépünk tovább? Miért nem hozunk tudatosan létre újabb sokszínű élővilágokat?” – folytatja eszmefuttatását Hodak.

Természetvédők évek óta többször kifejezték kihalt fajok feltámasztása miatti aggodalmukat. Részben azért ellenzik, mert az ökoszisztémák, amelyben éltek, változatos okok miatt, de nélkülük is működtek tovább. Ha viszont újjáélesztünk kipusztult állatokat, ha a biodiverzitás teljesen új formáit hozzuk létre, ugyanazt érhetjük el, mintha invazív fajokat eresztenénk rá az ellenük való védekezésre már alkalmatlan ökoszisztémákra.

Vizsgálják a Tesla önvezető technológiájának biztonságát

Az Egyesült Államok egyik szövetségi szabályozószerve, az autópályák biztonságos közlekedéséért felelős hivatal vizsgálja az önvezetésre alkalmas Tesla-járművek utóbbi évekbeli baleseteit. Huszonhárom esetet; sajnos, van köztük halálos kimenetelű is. Közös vonásuk, hogy akkor történtek, amikor az autók önvezető módban működtek.

A hatóság eddig négyszer vizsgálta a Tesla-karambolokat. A legismertebb, 2016-os, floridai balesetnél a jármű nekiment egy fúrótoronynak, és a sofőr szörnyethalt. Kiderült, hogy részben a technológia volt a felelős érte, a másik három esetben viszont nem.

Egy másik szövetségi bizottság a floridai és egy 2018-as kaliforniai esetet vizsgált. Mindkétszer az önvezető rendszert találta hibásnak.

tesla_1.jpg

A Tesla szerint járművei biztonságosak. A flottája által gyűjtött adatokból kiderül, hogy autonóm irányítási módban, mérföldenkénti bontásban, kevesebb balesetet okoznak, mint a humán vezetők. Azt nem árulták el, hogy az Autopilot be volt-e kapcsolva a karamboloknál.

A cég járművein két önvezető mód létezik.

Az összes új autóban szabvánnyá vált Autopilot a kormányt, a fékeket és a gázpedált vezérli. A technológiát középen jól láthatóan elválasztott autópályákra találták ki.

A sofőrök plusz tízezer dollárért a Teljes önvezetés (Full Self-Driving) opciót is választhatják. A név ellenére, a Tesla egyik ügyvédje közölte a kaliforniai szabályozókkal, hogy a rendszert nem szabad teljesen autonómnak tekinteni.

Használja a vezető bármelyik módot is, a gyártó tanácsa, hogy kezét tartsa a kormány mellett, a szemével pedig figyelje az utat. A rendszer viszont akkor is aktív marad, ha a sofőr nem tartja be ezeket az ajánlásokat. Videókból egyébként az is kiderült, hogy az Autopilot módot nemcsak középen osztott autópályákon használják.

Az új vizsgálatok során tények után kutatnak, és közvetlenül nem fognak a Teslát és az önvezető járműipar egészét érintő új törvényeket eredményezni. A vállalat hírnevének és a robotautók körüli hype-nak viszont kifejezetten nem tesznek jót. Összességében az egész mesterségesintelligencia-fejlesztő közösséget érintik, minden egyes ilyen vizsgálattal csökken az MI-be vetett bizalom.

Míg a Tesla megítélése a tiszta energia használatának promótálása miatt pozitív, a „teljes önvezető” címke használata, mint kiderült, megtévesztő. Az autonómia szintjéről célszerű lenne tényleg konzisztens infókat szolgáltatniuk.

Mesterséges intelligencia alakítja a legendás Star Trek színészt

William Shatner, a kultikus Star Trek (Űrszekerek) sci-fi tévéfilmsorozat James T. Kirk kapitányát, az Enterprise Csillaghajó parancsnokát alakító színész nemrég töltötte be a 90. életévét.

A Los Angelesi StoryFile mesterségesintelligencia-fejlesztő startup megalkotta Shatner digitális hasonmását, a doppelgänger májustól lesz elérhető online, akkortól cseveghet a rajongókkal.

shatner.jpg

A cég korábban Holokauszt-túlélők avatárjait készítette el, dolgozott ki társadalmi távolságot tartó Mikulást, és a klímakatasztrófáról tudósokkal való beszélgetést biztosító platformot is fejlesztett.

Shatnerrel többórás anyagot rögzítettek, kérdésekre válaszolt, miközben a térbeli megjelenítésre ideális volumetrikus kamerákkal 3D-ben rögzítették. Zöld háttér előtt vették fel, lehetővé téve, hogy a színész képét könnyen kivegyék a jelenetből, és nappali szobába helyezzék át.

shatner0.jpg

A StoryFile mérnökei a saját fejlesztésű Conversa nyelvi modellel begyakoroltatták, hogy kérdéseket és válaszokat kapcsoljon egymáshoz. Ha a felhasználó kérdez valamit, a mesterséges intelligencia megtalálja a kérdéshez leginkább passzoló feleletet, és elmondja azt.

Shatner szerint a rendszer segítségével leszármazottai majd akkor is interakcióba léphetnek vele, amikor már nem lesz köztünk.

Más cégek szintén fejlesztenek elhunyt szeretteinkkel való kommunikációra lehetőséget adó chatbotokat. A Microsoft technológiája tavaly decemberben kapott szabadalmi oltalmat: szöveges üzenetek, audióanyagok, videók és más digitális felvételek alapján „alkot újra” személyeket.

Egy másik beszélgető bot, Replica magányosokon igyekszik segíteni. A rendszert autóbalesetben elhunyt férfi régi szövegein gyakoroltatták.

Emberek infokommunikációs technológiákkal megvalósított digitális utánzatai a sci-fi irodalom és filmek klasszikus témái közé tartoznak. Mivel kevés tudományos-fantasztikus mű alakította, befolyásolta annyira a jövőképünket, mint a Star Trek, William Shatner élethű avatárja méltó tisztelgés a halhatatlan sorozat előtt.

Miért nem jók a megismételhetetlen kutatási eredmények?

A Kód nélküli tanulmányok honlap azon mesterségesintelligencia-rendszerek gyűjteménye, amelyeket más kutatók ugyan próbáltak lemásolni, de nem jártak sikerrel. Az oldal rendeltetése, hogy időt spóroljon meg a felesleges másolást eredetileg megkísérlő szakembereknek. A kudarc oka az adott rendszerek hiányos technikai leírása.

A felhasználó feltöltheti az eredeti anyag, majd az abban leírtak reprodukálására tett kísérlet linkjét, és elmagyarázza, megindokolja az eredmény nélküli próbálkozást.

A linkek átnézése után, a honlap adminisztrátorai felveszik a kapcsolatot az eredeti anyag szerzőivel, kiegészítéseket – pluszadatokat, kódot, és az újbóli megvalósításhoz nélkülözhetetlen más infókat – kérnek tőlük. Amennyiben a szerzők nem válaszolnak, vagy információik nem elegendők, anyaguk nyilvános listára kerül.

kod_nelkul.jpg

Eddig tíznél több jelzést kaptak, hatot fel is töltöttek. Két szerző mellékelte a kért kódot. Ha az anyag így már megfelel az elvárásoknak, a szerzőket a Tanulmányok, kóddal weboldalra való posztolásra buzdítják. Az oldalon 40 ezernél több megismételt, tehát bizonyítottan működő számítástudományi anyag található.

A Kód nélküli tanulmányok honlap mögött álló, a Redditen ContributionSecure14 nick alatt futó kutatók azért vágtak bele ebbe a projektbe, mert előtte két hetük ment kárba egy gépitanulás-anyag eredménytelen reprodukálásával.

A kód, adatok és infrastruktúra közkinccsé tételét szerzői jogi okok miatt elutasító szerzőknek azt tanácsolják, hogy próbáljanak másokkal közvetlenül együttdolgozni, majd hozzáfűzték: „nincs értelme nyilvánosan publikálni valamit, ha mások nem építhetnek rá.”

Pete Warden, a Google egyik mérnöke már 2018ban „gépitanulás-reprodukciós válságról” beszélt. Azóta tovább romlott a helyzet. Tavaly például pont a Google rákvizsgáló rendszerét kritizálta 31 szakember. A rendszer hiába teljesített jobban orvosoknál, a technikai leírás nem volt elegendő. Az anyag egyik szerzője, Joelle Pineau (McGill Egyetem) az MI-közösségnek kódok, adatok stb. megosztására biztonságos környezetet kínáló NeurIPS szervezettel közösen azon munkálkodik, hogy a konferenciákon ismertetett tanulmányok az ismétléshez szükséges minden adatot tartalmazzanak.

A reprodukálhatóság érthető okokból nélkülözhetetlen, válsága nagyon komoly probléma. Ha egy kísérletet nem látunk át, nem ismételhetünk meg, az eredmények megkérdőjelezhetők, és nem bizonyosodhatunk meg például új, esetleg forradalmi gépitanulás-rendszerek működőképességéről.

Fecsegő robotok mentik meg a depressziósokat?

A mesterséges intelligenciát egyre gyakrabban használják mentális problémák kezelésére, a mentális egészség megőrzésére.

Az amerikai háborús veteránokkal foglalkozó ReachVet katonai nyilvántartásokat fürkészve, készít havi listát az öngyilkosságra leginkább hajlamosnak tűnő személyekről. Egyes csevegő botok, például a Flow, a Lyssn és a Woebot rendeltetése az olyan hangulati rendellenességek, mint a szorongás vagy a depresszió enyhítése.

Különböző felmérések szerint LGBTQ tinédzserek között kétszer-hétszer nagyobb az öngyilkosságok száma, mint másoknál. Egyértelműen veszélyeztetettebbek – hangsúlyozza az eredményeket ismertető amerikai kormány.

depresszio.jpeg

Az évente százezernél többször hívott Trevor Projekt nonprofit szervezet huszonnégy órás forró vonalat tart fenn a lelki problémákkal küszködő érintett fiatalok számára. Válság-kapcsolat szimulátort használva, gyakoroltatják a tinédzserekkel kommunikáló önkénteseiket. Megmutatják nekik, hogyan beszélgessenek velük, mire vigyázzanak közben.

Az önkéntesek munkáját, az öngyilkosságok megelőzését nyelvi modell is segíti. A fecsegő virtuális robot (chatbot) játssza el a depressziós tizenéves szerepét, míg egy gyakorlott tanácsadó igyekszik meghatározni a probléma okait.

A rendszert a szervezet mérnökei fejlesztették, a Google segítségével. Több modellt teszteltek, mielőtt a GPT-2 mellett döntöttek. 45 millió honlapon trenírozták, gyakornokok és a Trevor Projekt munkatársai közötti szerepjáték átiratán finomhangolták.

Egy másik, szintén a Google közreműködésével fejlesztett modell a bejövő hívások csoportosításában segít. Amikor valaki bejelentkezik a csevegő-rendszerre, hangüzenet kéri meg, hogy írja le az érzelmi állapotát.

A rendszer önkárosításra utaló jelek alapján elemzi a válaszokat, felcímkézi a nagy kockázatot jelentő személyeket, akik elsőbbséget kapnak, hogy minél előbb szaktanácsadóval beszélgethessenek. Minél gyorsabb, annál több életet ment meg.

Mit lát az agyunk?

Az agytevékenység komplex és dinamikus képi megjelenítése mind a gépi tanulás, mind az idegtudományok egyik legnagyobb kihívása. Egy új fejlesztés sokat segíthet.

Mi lehet ijesztőbb a Doctor Who? sci-fi tévéfilmsorozat képeinél? Például a megtekintése közben a nézők agyában végbemenő folyamatok vizuális megjelenítése.

brain2pix.jpg

A holland és német kutatók által fejlesztett Brain2Pix rendszer az ő agytevékenységükről készült szkenek alapján pontosan ezeket vizualizálja.

Az agy egymás melletti idegsejteket használ szintén egymás melletti vizuális jegyek reprezentálására. A konvolúciós ideghálók ideálisak hozzá, mert kiváló teljesítményre képesek térbeli mintázatok megtalálásában, használatában, amelyekkel aztán képeket generálnak. Aktív idegsejtek agyszkeneken megfigyelhető térbeli kapcsolataiból tudják rekonstruálni a kapcsolódó képeket. (A többi ideghálótól nagymértékben különböző, főként képfeldolgozási funkciókkal rendelkező, de videóval és hanggal is elboldoguló konvolúciós ideghálók a bemenő adatot ahelyett, hogy egészében értelmeznék, részleteiben szkennelik le.)

brain2pix0.jpg

A kutatók ilyen megoldással, funkcionális mágneses rezonanciás képkészítésen (fMRI) alapuló generatív ellenséges hálózattal (GAN) dolgoztak képről képre. Az agyban történő véráramlást ábrázoló szkenek az idegsejtek aktivitását jelzik. A GAN-t a Doctor Who fMRI-n, a sorozat 30 epizódjából kigyűjtött képkockákon (frames) és a nézők fMRI-jét tartalmazó adatsoron gyakoroltatták.

Minden egyes 3D szkent az agy különféle területeit megjelenítő 2D képpé konvertáltak. A GAN egymással „ellenséges” két hálójából az egyik, a generátor munkáját folyamatosan bíráló megkülönböztető dönti el, hogy a kép az eredeti sorozatból származik, vagy a generátor munkája. Utóbbit úgy gyakoroltatták, hogy megtévessze a megkülönböztetőt.

Ezt két beépített funkcióval, egyrészt a videó képkocka és a létrehozott kép közötti pixelértékek, másrészt a megjelenítések közötti különbségek minimalizálásával éri el. A generátor hálózati rétegei segítettek az agyról készült szkenek térbeli mintázatainak megőrzésében, és a hosszú visszacsatolásos folyamat (képgenerálás, bírálat, újabb képgenerálás, újabb bírálat, mindaddig, amíg a két kép meg nem egyezik egymással) végén sikerrel járt.

A kutatók a Brain2Pix képeket és a Doctor Who képkockák közötti különbségeket összehasonlítva, minden eddiginél jobb eredményt kaptak.

Mesterségesen intelligens kamerák figyelik a járműveket

Mesterséges intelligenciával működő kamera-hálózatok jóvoltából, az amerikai rendőrség országszerte egyre nagyobb mértékben képes nyomon követni járműveket. A sors különös fintora, hogy sok kamera civilek birtokában van.

Az automatikus rendszámtábla-olvasókat árusító Flock arra buzdítja vásárlóit, hogy hálózatát használva, monitorozzanak „gyanús” járműveket. Lakástulajdonosi szervezetek, üzleti vállalkozások és bűnüldöző szervek az ügyfeleik.

megfigyeles0.jpg

Az ügyfél eldöntheti, hogy adatait megosztja a rendőrséggel, vagy sem, és viszont: a Flock elemzőhálózatán (Total Analytics Law Officers Networks, röviden: Talon) a bűnüldözők is közzétehetik az infókat.

A Talon havonta kb. 500 millió járműről gyűjt szkeneket. A kamerák eltárolják az adatokat, és figyelmeztetéseket küldenek a különféle listákon szereplő autókról. A felhasználók, rendszám mellett, modell, szín és egyéb tulajdonságok, például tetőcsomagtartó alapján végezhetik a keresést.

megfigyeles1.jpg

A Talon adatai a Nemzeti Bűnügyi Információs Központtal, az FBI szökésben lévő, eltűnt személyekkel, lopott járművekkel kapcsolatos információkat tartalmazó adatsorával együtt is használható. Jelenleg több mint 500 amerikai rendőrség fér hozzá.

A Flock szerint a Talon óránként négy-öt eset megoldásában segít. A rendszer csak harminc napig tárolja az adatokat, a rendőrség pedig letöltheti a bizonyítékként szolgáló információkat. A rendszám-azonosítás például a Capitolium elleni január 6-i roham egyes részvevőinek letartóztatásában is segített.

A mesterségesen intelligens kamerák érthető okokból egyre népszerűbbek a bűnüldöző szervezeteknél. Használatuk viszont komoly aggályokat vet fel, ráadásul elég nehéz megállapítani a határokat, hogy alkalmazásuk meddig bűnüldözés, és mikortól a személyiségi jogok (privacy) megsértése.

Rendőrök dolgoztak már például az Amazonhoz tartozó Ring MI-vel működő megfigyelő-kameráival, eredményesen használják a Vigilant rendszámtábla-olvasóját. És nemcsak az USA-ban, hanem más országok bűnüldöző szervei is élnek az MI adta lehetőségekkel.

Ezeket a kereskedelmi megfigyelő-hálózatokat különösebb felülvizsgálat és hozzájárulások nélkül telepítik, és a rendőrség nehezen vonható felelősségre a túlzott használatukért. Bűnesetek felderítése mellett ártatlan emberek millióinak indokolatlan nyomon követése, adataik gyűjtése az eredmény. Az MI ugyan segíthet bűnözők elfogásában, de az ilyen alkalmazásokkal a szabadságjogok is csorbulnak. Az arcfelismerés, a rendszámtábla-olvasás és személyek követésére alkalmas minden más technológia esetén a mostaninál sokkal egyértelműbb, szigorúbb szabályozás kellene.

Egy új algoritmussal leegyszerűsíthető a big data

Legalább egy évtizede a big data korszakában élünk, és a digitálisan előállított adat mennyisége exponenciálisan nő. Például a tudományos kísérletek eredményeit is számokba öntik, gyakran keletkeznek emberi ésszel már-már felfoghatatlan nagyságú, gigantikus adatsorok.

Méretüket elvileg a statisztikailag legrelevánsabb, az igazán lényeges jegyeket megtaláló és kivonatoló algoritmusokkal csökkenthetik. Sok adatsor viszont akkora már, hogy az algoritmusok többsége nem alkalmazható rájuk.

Amerikai kutatók pontosan az óriási adatsorokra fejlesztettek egy, a lényeget közvetlenül kiemelő algoritmust. A kivonatolás sok ad hoc gépitanulás-módszerrel megoldható, de az új modell a többinél megalapozottabb elméleti alapokon áll.

bigdata.jpg

A gépi tanulás egyik ága komponenselemzéssel, nyers adatok jegyeinek azonosításával és kivonatolásával foglalkozik. Az adatsorok dimenzióinak csökkentése a célja. Az azonosítást követően a jegyeket az adatok annotált mintáinak elkészítéséhez, vagy más gépitanulás-feladatokhoz, például osztályozáshoz, klaszterezéshez, vizualizációhoz vagy modellezéshez használják fel.

Ilyen típusú algoritmusokat már a múlt század végén is próbáltak fejleszteni, a mostani kor viszont a big data, a több tízezer tulajdonságjeggyel rendelkező sokmillió adatpont miatt teljesen más. Ezeknek a masszív soroknak az elemzése humán programozók számára bonyolult és időigényes, az emberi agy információfeldolgozását bizonyos szintig szimuláló mesterséges ideghálókkal (ANN, Artificial Neural Network) viszont megoldható. Tucattól többmillió neuronból állhatnak, egységeik réteg-sorozatokba rendezik, a háló próbál értelmet adni az adott információnak.

Sokféleképpen használhatók, de főként az adatra leginkább jellemző tulajdonságok azonosítására, és az információ alapján, különböző kategóriákba rendezésére, osztályozására alkalmazzák.

Az Alexa, a Siri vagy a Google Fordító is mesterséges ideghálókkal működik: beszédminták, kiejtések és hangok felismerésére gyakoroltatták be őket.

De nem minden jegy egyformán szignifikáns, ezért sorrendbe állíthatók. Eddig speciális ANN-eket használtak hozzájuk, de még ők sem tudták pontosan lokalizálni a jegyeket, illetve kideríteni, hogy melyik fontosabb a másiknál. Elvileg lehetséges volt, gyakorlatilag nem.

Intelligensebb algoritmusoknak ezeket kell közvetlenül észlelniük, és a mostani fejlesztés pontosan ezt célozza. Hatékonyabb lesz vele az adatfeldolgozás, és óriási adatsorokkal is elboldogul, tényleg leegyszerűsíti a big datát. Egyelőre viszont csak egydimenziós mintákra alkalmazható, a kutatók azonban fejlesztik tovább, hogy sokkal komplexebb adatstruktúrákat is tudjon kezelni.

Nagyon sebezhető az amerikai elektromos hálózat

Az Egyesült Államok elektromos hálózatának elosztórendszerei sebezhetők, és nagyon ki vannak téve cybertámadásoknak – derül ki a Kormányzati Elszámolási Hivatal (GAO) friss beszámolójából.

Megállapították, hogy az Energiaügyi Minisztérium cyberbiztonsági stratégiája túlnyomórészt a termelési és az átviteli rendszerekre összpontosított eddig. Ajánlásukban az elosztórendszerek kockázataira figyelmeztetnek, sokkal többet kellene foglalkozni velük.

us_elektromoshalozat.jpg

Mivel a fogyasztókhoz ezek a rendszerek juttatják el közvetlenül az áramot, egyértelmű, miért aggasztó a támadásoknak való kitettségük. Ráadásul a megfigyelő és a vezérlőtechnológiáktól való egyre markánsabb függésük miatt, egyre nagyobb a veszély.

Az ipari vezérlőrendszerekkel folyamatosan nőnek a kockázatok. További probléma, hogy ezek a rendszerek lehetővé teszik a távolból való hozzáférést, azaz rossz szándékú szereplők is rákapcsolódhatnak. A szövetségi cyberbiztonsági szabványok nem vonatkoznak rájuk. Szerencsére azért vannak kivételek, de azok inkább a minisztériumtól független, egyedi esetek.  

„Ugyanakkor, szinte senki nem fogta fel teljesen az ilyen jellegű támadások hatásának potenciális léptékét” – áll a beszámolóban.

A minisztérium tervei nem fedik le teljesen az elosztóhálózatokban rejlő veszélyeket – vonták le a következtetést a szerzők. Például az ellátási láncokkal kapcsolatos sérülékenységükkel sem foglalkoznak. Illetékesek szerint azért nem, mert a termelési és az átviteli rendszerek veszélyei a prioritás.

Az elosztórendszerek kihagyásával a tervek korlátozottak maradnak, szövetségi szinten kis mértékben fogják támogatni biztonságosabbá tételüket. Minisztériumi alkalmazottak el is mondták, hogy nincs tudomásuk a veszélyeket felmérő kutatásokról. A hivatalos álláspont szerint a másik két rendszer megtámadása súlyosabb következményekkel járna. A beszámoló viszont egyértelműsít: egyes ellátórendszerek sérülésének az egész országot érintő hatásai lesznek. Koordinált támadással akkor is lehetnek több térségben áramkimaradások, ha az nem érinti a központi rendszert.

Hangklónok árasztják el a médiát és a szórakoztatóipart

Egyre többen használnak mesterségesintelligencia-módszereket színészek hangjának utánzására. Ezek a technológiák a képes, mozgóképes kamuképek vagy „mélyhamisítványok” (deepfakes) audió megfelelői.

Játékfejlesztők és marketingesek egyrészt pénzmegtakarításból, másrészt termékeik még immerzívebbé tétele miatt klónoznak hangokat.

hangfake0.jpg

Az erre specializálódott brit Sonantic startup például bejelentette, hogy húszpercesnél rövidebb gyakorlóadatból bármely színész hangját reprodukálják. Technológiájuk lehetővé teszi médiakészítők számára, hogy fokozzanak, változatosabb intenzitással adjanak vissza különböző érzelmeket, például dühöt, boldogságot vagy félelmet. A cég egyébként az így szerzett bevételeket megosztja az eredeti hang tulajdonosával.

hangfake1_1.jpg

Az amerikai Replica Studios az angol fonetika lényegét lefedő, színészek által felolvasott húsz mondaton gyakoroltatja rendszerét. Az általuk módosított Cyberpunk 2077-ben a nem játékos karakterek név szerint szólítják meg a játékosokat. A cég a bevételeket ugyanúgy megosztja a színészekkel, mint a Sonantic.

Az MSCHF marketingcég Gucci Mane rapper hangját szintetizálta, és a hasonmás olyan klasszikusokat mesél el, mint a Büszkeség és balítélet vagy a Don Quijote.

A szórakoztatóipar nagy része rendezte a színészek hangja feletti jogokat, sok amatőr tartalomgyártó viszont előszeretettel alkalmazza a technológiát, és jogi szempontból gyakran téved ingoványos terepre. Tim McSmythers kutató például a közösségi médiában futó Speaking AI-ban hírességek hangját utánzó, begyakoroltatott gépi modelleket használ, és közkedvelt film- vagy televízió-jelenetekbe illeszti azokat. Így fordulhatott elő, hogy Homer Simpson magyarázott el egy legendát Anakin Skywalkernek. A 15.ai webes alkalmazás pedig játék- és tévésorozat-karakterek remek minőségű hangját „kölcsönzi” egyedi párbeszédekhez.

hangfake.jpg

A hangklónozás a kamuképekhez és videókhoz hasonlóan kreatív energiákat is felszabadít, praktikus is, például a színészek bekapcsolódása előtt könnyebb a párbeszédeket letesztelni, de a mellékszereplők is gyakrabban szóhoz juthatnak így. A technológiával természetesen vissza is lehet élni, sajnos ez elkerülhetetlen.

süti beállítások módosítása
Mobil