Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Szerzői jogok illetik meg az alkotó mesterséges intelligenciákat?

2023. január 27. - ferenck

Stephen Thaler, a St. Louis-i (Missouri állam) Imagination Engines alapító-főmérnöke, ismert számítástudományi szakember január tizedikén Washington D.C.-ben, egy szövetségi bíróságon kérelmezte, hogy mesterségesintelligencia-rendszerét illessék meg az általa készített művészi alkotásokért járó szerzői jogok.

Egy tavaly júniusban megindított perben, tárgyalás előtti győzelem reményében, a fővárosi bíróságtól el szeretné érni az Egyesült Államok Szerzői Jogi Hivatala döntésének megsemmisítését, melynek értelmében kreatív munkákkal csak akkor járnak jogdíjak, ha ember az alkotó.

copyright.jpg

A témában ez az egyik első ügy, de a mesterségesintelligencia-alapú kreatív rendszerek, programok és alkalmazások, mint a ChatGPT, a DALL-E és a többiek gyors elterjedésével a jövőben rengeteg hasonló pereskedés, jogorvoslat várható.

Thaler ügyvédei szerint a probléma pénzügyi szempontból is fontos, míg egy-két éve ez nem volt még ennyire egyértelmű. Állításuk alapján a mesterséges intelligenciával létrehozott művészet védelme elősegítené a szerzői jogi törvény céljainak érvényesítését, és egy évtized múlva bizarrnak fog tűnni, hogy ezekért kell most pereskedni.

copyright0.jpg

A Szerzői Jogi Hivatal nem fogadja el az ügyvédek álláspontját.

Thaler a világ tizennyolc joghatóságánál külön-külön igyekszik elérni rendszere jogi védelmét, de eddig (USA, Egyesült Királyság, EU, Ausztrália) nem ért el eredményt. Egy brit bíróság márciusban tárgyalja az ügyet.

Már 2018-ban is szerzői jogi védelmet kért a Creativity Machine rendszere által generált „A Paradicsom új bejárata” képhez, amelynek alkotója a beadvány szerint a rendszer volt. A beadványt az érvényben lévő törvényre, bírósági precedensekre, a szervezet gyakorlatára és a humán alkotó hiányára hivatkozva, tavaly februárban utasította vissza a Szerzői Jogi Hivatal.

Thaler szerint a hivatal rosszul értelmezi a szerzői jogi törvényt, és a döntést idejétmúlt bírósági precedensek alapján hozták. A kreativitásra a hagyományok alapján romantikusan és emberközpontúan gondolnak – állítja.     

Autonóm drónhordozó hajót bocsátottak tengerre Kínában

Az ENSZ javasolta már a teljesen autonóm fegyverek betiltását. Egy autonóm hajó természetesen nemcsak katonai, hanem sokkal békésebb, értékesebb célokat szolgál: oceanográfiai kutatásokat, keresési és mentési műveleteket, teherszállítást stb.

Ne legyenek illúzióink, előbb-utóbb megjelennek a fegyverrel felszerelt autonóm vízi járművek. A haditengerészet számára a működtetésük olcsóbb, mintha legénység van rajtuk, nem kell gondoskodni a személyzet ellátásáról, ha pedig elsüllyed, nincsenek áldozatok.

kinai_hajo.jpg

Kína első autonóm katonai hajóját júniusban tesztelték tengeren. A fejlesztők nem pontosították a jármű rendeltetését, megfigyelők szerint viszont a DARPA, az USA Védelmi Minisztériumának fejlett technológiai projektekért felelős ügynöksége Sea Hunter, azaz Tengeri vadász nevű, tengeralattjárókra vadászó és aknákat eltüntető autonóm hajójára hasonlít.

Kína egy másik, szintén az amerikaira emlékeztető, személyzet nélküli vízi járművet is fejleszt, míg az Egyesült Államok ugyancsak dolgozik további autonóm hajókon, repülőkön.

A júniusban, tizenkét órás teszten átment kínai hajó autonóm navigál és irányítja a fedélzetén lévő drónrajt.

Fedélzeti szenzorai által gyűjtött és műholdas adatokat használva kerüli el a kockázatokat, és ha tényleg szükség van rá, távolban lévő humán operátorok működtethetik.

A végétől az orráig közel kilencven méter hosszú, sebessége óránkénti majdnem harminchárom kilométer (húsz mérföld). Járőrözés, térképkészítés, megfigyelés, tengeri mintavétel lesznek az idei feladatai.

Nem pontosított létszámú légi, szárazföldi és tengeralatti drónnal szerelték fel. Ezek a drónok akár negyvenöt kilométer távolságra is „ellátnak”, első munkájuk a környezet folyamatos figyelése.

A vízrebocsátás előtti utolsó próbán a drónokat vizsgáztatták, hogy a hajó hogyan bocsátja útra őket, majd a küldetés után, miként térnek vissza a fedélzetre. Mind átment a vizsgán.

A „rekonstruált” II. Ramszesz fáraó úgy néz ki, mintha élne

II. Ramszesz fáraó Krisztus előtt 1279 és 1213 között, az ókori Egyiptomban második leghosszabb ideig uralkodott. Egyes vélemények szerint ő késztette menekvésre Mózest és népét az Exodusban. Múmiáját 1881-ben, Luxorban fedezték fel.

A liverpooli John Moores Egyetem Arclaboratóriumában szoftverekkel és az „öregedés-visszafejtés” számítógépes módszerrel rekonstruálták az uralkodó arcát, hogy hogyan nézhetett ki fénykorában (1. kép). A folyamatnál a halott arcából indulnak ki, a koponya és az arc öregedésének ismeretében kiszámítható, hogyan nézett ki az adott személy fiatalabban. A számításokhoz az öregedéssel járó ráncosodást, az orr és a fülek megereszkedését, fogak elvesztését stb. veszik figyelembe.

ramzesz.jpg

II. Ramszesz fejéről, koponyájáról Sahar Saleem, a Kairói Egyetem radiológiaprofesszora CT-szkennerrel készített 3D modellt, a liverpooli laboratóriumot vezető Caroline Wilkinson és csapata azt használta a rekonstrukcióhoz.

Az egyiptomi múmiák sokkal jobb állapotban maradtak fenn az utókornak, mint például gyilkosságok áldozatai, és így könnyebben megsaccolható, hogyan néztek ki az életben. A pontosságot növelő járulékos infókkal rendelkezünk róluk: fülforma, ráncok, hajmintázat.

ramzesz0.jpg

A nehezebb rész ezután következett – a bőr, a szem és a haj színének, textúráknak a kidolgozását egyiptológusok tanácsai, információi alapján végezték, majd jöhetett II. Ramszesz szintén komoly kihívásokkal járó „megfiatalítása.”

Ilyen rekonstrukciókkal jobban megérthetjük a múltat, jobban kapcsolódunk hozzá, mintha csak múzeumi tárgyakat nézegetünk. Történészek kimutatták, hogy az arc – különösen vezetők esetében – sokat számított személyek státuszának megítélésében, sikereikben.

Az egykori egyiptomi uralkodó valóban tekintélyes, nagyhatalmú vezetőnek tűnik, arcát akár mai politikusokkal is összehasonlíthatjuk.

ramzesz_harmadik_richard.jpg

Wilkinson és munkatársai az elmúlt években III. Richárd angol király (3. kép), Szent Miklós, egy viking harcos, 2000 éve halott, terhes egyiptomi múmia, és két másik múmia arcát rekonstruálták.

Az arcrekonstrukció nemcsak régen halott uralkodók és mások vizualizálásában, hanem eltűnt személyek vagy azonosítatlan testek esetében is sokat segítenek. A csontváz szerkezetéből kb. hetven százalékos pontossággal lehet az arcra következtetni – állapította meg Wilkinson csapata élő önkéntesekkel végzett munkák alapján.

A kódok kódjai túl magabiztossá tehetik a kódolókat

A kódgeneráló eszközökre gyakran a programozók számára időt megtakarító és alapfeladatokat automatizáló módszerként tekintünk. A hatékonyságnak azonban ára van, mert az ezeket az eszközöket használó kódolónak jobban oda kell figyelnie a hibákra, megszüntetésükre és a biztonságra.

A Stanford Egyetem kutatói ugyanis megállapították, hogy az OpenAI számítógépes kódot generáló Codex modelljét használó programozók nagyobb valószínűséggel készítenek hibás szoftvert, mint a „semmiből” indulók.

Negyvenhét résztvevőt – diákokat, több évtizedes gyakorlattal rendelkező programozókat stb. – választottak ki biztonság témájú kódolási feladatokra. Harminchárman egyedi felhasználói felületen keresztül használhatták a GPT-3 finomhangolt változatát, a Codexet, míg a maradék tizennégy nem kapott automatizált segítséget. Mindkét csoport másolhatott kódot a webről.

codex.jpg

Négy feladatot kaptak, háromban Python, a negyedikben Javascript funkciókat kellett írniuk. (A funkció speciális feladatot végrehajtó kódblokk.)

A kutatók manuálisan, annak megfelelően értékelték ki a válaszokat, hogy azok mennyire működnek, mennyire biztonságosak.

A Codexet használók által létrehozott kódok általában kevésbé működtek és kevésbé voltak biztonságosak, a kódolók viszont nagyobb bizalmat mutattak irántuk. Az eredmények egyébként a feladat és a programnyelv függvényében változtak.

A Codex-szel nem működő kódot készítők nagyobb valószínűséggel tartották a válaszukat pontosnak, mint a korrekt kódokat író és Codexet nem használó csoport tagjai.

Python esetében, a Codex nélküli résztvevők kétszer nagyobb valószínűséggel készítettek biztonságos kódot.

A digitálisbiztonság-tapasztalattal nem rendelkező „Codexesek” nagyobb valószínűséggel használtak nem szerkesztett, generált kódokat, mint az azzal rendelkezők. Ez különösen a sok résztvevő által kevésbé ismert Javascriptben történő kódolásra volt érvényes.

A gépi kódgenerálás azonban a kutatási eredmény ellenére izgalmas és előremutató trend, ráadásul a következő kutatásokban a „Codexesek”, a világhálóról kódot másolók és a semmiféle külső segítséggel nem élők eredményét is érdemes lenne összehasonlítani.

Vége lehet a Google-kereső egyeduralmának?

December végén a Google megkongatta a belső vészharangokat, mert a vezetőség érzékelte, hogy a nagy nyelvmodellek (large language models, LLM), mint az OpenAI ChatGPT-je veszélyesek lehetnek a vállalat üzleti tevékenységére, a keresőmotor businessre.

Hogy miért? Mert megoldandó technikai és üzleti problémáik ellenére megváltoztathatják az információhoz való hozzáférés módját. Webes kutakodás helyett megkérdezhetünk egy LLM-et, és honlap helyett szöveges választ kapunk.

google_vs_chatgpt0.jpg

Egyelőre csak egyszerű és tényszerű kérdéseknél működik, összetettebbeknél vagy speciális ismeretek esetén már kevésbé, sőt, egyes válaszok félre is vezethetnek.

Csakhogy a mai LLM-ek óriási, de paradox módon mégsem elegendő számítási kapacitásokat fogyasztanak el. A ChatGPT elődje, a GPT-3 175 milliárd paraméterrel rendelkezik, 16-bitet, lebegőpontos bájtokat használva, 350 – egyes vélemények szerint 800 – gigabájt tárhelyet foglal el, míg például a Wikipédia 150-et. A számokból egyértelmű, hogy egy LLM a Wikipédia tárolásánál lényegesen több memóriával rendelkezik, így ezen a téren is komoly potenciál rejlik bennük.

Igen ám, de a Wikipédia az interneten hozzáférhető, ötmilliárd gigára saccolt ismereteknek csak nagyon kicsi részét jelenti. Egy keresésnél, amikor a web bármely szegletében lévő honlapra rátalálhatunk, törvényszerűen több kérdésre kaphatunk választ, mint a fix memóriájú LLM-ektől.

google_vs_chatgpt.jpg

Andrew Ng, gépitanulás-szakértő egy új, kiterjesztett keresésen alapuló technológiában, az RAG-ben (retrieval augmented generation) az LLM-eknél is komolyabb potenciált lát. Ez abból áll, hogy korlátos LLM helyett először online, vagy máshol megtaláljuk a releváns dokumentumokat, majd csak ezt követően fordulunk valamelyik nagy nyelvmodellhez. A lekérdezést és a dokumentumokat válasszá dolgozza össze, ami a jelenlegi webes keresés komoly alternatívája lehet. Olyan, mintha a keresésre és az eredmények összefoglalására is lenne egy LLM-ünk. A technológiát ma a Meta Atlas és a DeepMind RETRO rendszere szemléltetik.

A keresőóriások üzleti modellje az eredmények melletti hirdetésekre történő klikkelésen alapul. Próbáljuk elképzelni, mit tennének, ha a szöveget is megadnák, hol lennének akkor a hirdetések? A Google-nak ezt a problémát mindenképpen meg kell oldania, mielőtt LLM-ekre cseréli legendás keresőmotorját.

Egyes startupoknak és talán még a Microsoft Bingjének sincs annyi veszítenivalója, mint a Google-nak, és valószínűleg könnyebb szívvel cserélnék le a mostani üzleti modellt.

Egyelőre a Google a Chrome böngésző és az Android mobil oprendszer miatt is versenyelőnyben van, a rengeteg hirdetővel és a szofisztikált hirdetési rendszerrel jobban pénzzé tudja tenni a felhasználók figyelmét, mint a versenytársak.

Kérdés persze, hogy meddig, mert a generatív MI csak-csak eljutott arra a szintre, hogy a keresőóriásnál riadót fújtak.

Ellenségeket keres az arcfelismerő rendszer

A 2020-ban alakított Madison Square Garden (MSG) Entertainment szórakoztatóipari holding az Egyesült Államok több városában működtet létesítményeket. A cég mostanában arcfelismerő technológiával igyekszik megakadályozni vélt ellenségeinek bejutását a Madison Square Gardenbe és a Radio City Music Hallba.

A technológiát legalább két alkalommal használták a cég elleni bírósági eljárásokban résztvevő ügyvédi irodáknál dolgozó jogászok kiutasítására.

madison_sg.jpg

November 22-én a Radio City Music Hall őrei, miután az arcfelismerő rendszer azonosította, nem engedték be egy hangversenyre a lánya társaságában megjelenő Kelly Conlon ügyvédet. Conlon személyi sérülés kárvallottját képviseli egy perben az MSG ellen.

Októberben, szintén az arcfelismerőre hagyatkozva, az MSG egyes részvényeseit a vállalat elleni peres eljárásban képviselő Barbara Hart jutott ugyanerre a sorsra a Madison Square Garden bejáratánál.

madison_sg0.jpg

A MSG bejelentette: jogilag egyik eset sem támadható. Bejáratott stratégiájuk, hogy a velük szemben aktív perekben érintett cégek által alkalmazott ügyvédek nem jelenhetnek meg a vállalat szórakoztatóipari létesítményeiben, függetlenül attól, hogy az adott ügyvéd szerepel a pereskedésben, vagy sem.

A beengedés megtagadása azért történhetett meg, mert magáncégek esetében New York nem korlátozza az arcfelismerő technológiák használatát. Az MSG legalább 2018 óta alkalmaz arcfelismerést: a szórakoztatóipari létesítményeinél megjelent személyeket a rendszer fényképes adatbázissal veti össze, és azonosság esetén, felcímkézi a nem kívánatosnak vélteket.

Mielőtt Coulont nem engedték be a Madison Square Gardenbe, egy bíróság kimondta, hogy az MSG jogában áll érvényes jeggyel nem rendelkező személyektől – bárkitől – megtagadni a belépést. A bíróság (nyilván a kezeit mosva) abban már nem foglalt állást, hogy mi van, ha egy „ellenségnek” van jegye.

A magánjog (privacy) megsértésétől félő aktivisták régi aggodalma, hogy az arcfelismeréssel lehetővé válik vállalatok számára egyéneken megtorolni az őket ért valós vagy vélt sérelmeket. Az MSG a technológiát pont erre a célra, feltételezett ellenségeinek kiszűrésére, büntetésére alkalmazza.

Széndioxidot, műanyaghulladékot alakít hasznos üzemanyaggá egy napenergiás gép

A Cambridge Egyetem kutatói a széndioxidot és a műanyaghulladékot is fenntartható üzemanyaggá és más értékes anyagokká átalakító, kizárólag napenergiával működő gépet fejlesztettek.

Fejlesztői szerint a gép több szempontból is egyedi: nem csak azért, mert a bolygónkat elpusztító melléktermékeket hasznos anyagokká változtatja, hanem azért is, mert több anyaggal tud egyszerre dolgozni.

A kutatás legfőbb célja a hulladék valóban hasznos termékké alakítása napenergia segítségével.

ujrahasznositas.jpg

„A műanyaghulladék világszerte óriási probléma, és gyakran előfordul, hogy az újrahasznosításra szánt kukákba dobott műanyagok nagy részét vagy elégetik, vagy hulladéktárolóban végzik” – magyarázza Erwin Reisner, a kutatás egyik vezetője.

A műanyaggal történő környezetszennyezés és az üvegházhatású gázok ellen hatékony napenergia vezérelte technológia pontosan ezért változtathat meg mindent, lehet mérföldkő a körkörös technológiák fejlődésében.

A gép működése bonyolult.

Az üvegházhatású gázok és a műanyaghulladék külön tárolására kidolgozott két rekeszből álló reaktor a következőgenerációs napelemekhez a szilícium ígéretes alternatíváját jelentő fényelnyelőt, perovszkitot (kalcium-titanátoxidásványt) használ. A fényelnyelőbe, a gép outputjának függvényében módosítható, finomhangolható vegyi katalizátor ágyazható.

A rendszert pontosan ez a módosíthatóság, finomhangolhatóság teszi egyedivé. Most egyszerű szénalapú molekulák, de a jövőben, csupán a katalizátort megváltoztatva, komplex termékek is készíthetők vele.

A széndioxid átalakításához általában sok energia kell, az új rendszerrel viszont elég a napfény, és a káros anyagokat elkezdi hasznossá és fenntarthatóvá változtatni. Előtte semmiféle megoldás nem létezett értékes termékek szelektív és hatékony létrehozására.

Az anyagokat átlagos nyomás és hőmérséklet mellett tesztelve, a fotoelektrokémiai rendszer PET műanyag palackokat és széndioxidot többfajta szénalapú üzemanyaggá és más keresett matériákká, például a fenntartható folyékony üzemanyagok kulcskomponensévé, szintetikus gázzá, valamint a bőrápoló cégek kedvenc vegyszerévé, glikolsavvá alakította.

A következő években a kutatók komplexebb részecskék újrahasznosítását, reciklálását és megváltoztatását tanulmányozzák. Idővel a rendszer teljes újrahasznosító üzemek energiaellátását is megoldhatja.

Az Instagramon azonosítják a szélsőjobboldali lázadókat Brazíliában

Január nyolcadikán Brazíliaváros legfontosabb közhivatalait, köztük a nemzeti kongresszus, a legfelsőbb bíróság épületét és az elnöki palotát az októberi elnökválasztási eredményeket, a baloldali Lula győzelmét megkérdőjelező, (bizonyítékok nélküli) csalást kiáltó Bolsonaro-hívek rohamozták meg, és foglalták el.

A „puccs” nem tartott sokáig, a hatóságok hamar véget vetettek a randalírozásnak, majd néhány órával később új Instagram-fiók, a Contragolpe Brasil (Brazil Ellenpuccs) jelent meg a közösségi hálózaton. A lázadás résztvevőit ábrázoló fotókat posztoltak rajta, azzal a bevallott céllal, hogy azonosítsák őket, és a hatóságok számára megkönnyítsék az elmenekült „puccsisták” azonosítását, elfogását.

Huszonnégy óra elteltével már 1,1 millióan követték a fiókot.

brazilia.jpg

David Nemer, a Virginia Egyetem médiatanulmányok professzora szerint egyáltalán nem meglepő az új fiók. A lázadók is WhatsApp csoportokban, Telegram csatornákon szervezkedtek, az egészet kvázi bejelentették a közösségi médián. Lehetett számítani rá, senki nem lepődött meg rajta, nem maradt titokban.

A lázadók az eseményeket követően is masszív nyomot hagytak maguk mögött a közösségi médiában: videókat, fényképeket osztottak meg, továbbítottak üzenetküldő alkalmazásokon. Ezek közül többtucatnyit összegyűjtöttek, majd közkinccsé tettek a Contragolpe fiókon. A képeken szinte kivétel nélkül Brazília sárga és zöld színeibe öltözött személyek arca látható.

A fiók üzemeltetői őrzik anonimitásukat, médiumok kérdéseire nem válaszolnak, a posztolókat viszont arra kérik, hogy a lázadókat leleplező információikat küldjék el a rendőrségnek is.

A Contragolpe Brasil nem az egyetlen a „tömegek bölcsességén” (crowdsourcing) alapuló közösségi kezdeményezés, mert az Agéncia Lupa tényellenőrző ügynökség is létrehozott egy, az olvasók által generált szöveges, képi és videoanyagokból álló adatbázist a lázadás napjáról. Az összes infót anonim küldik nekik.

Tömegmegmozdulások résztvevőinek a közösségi médián történő azonosítása nem új. 2021. január hatodika, a Capitolium Trump-hívők általi megrohamozása után az Egyesült Államokban szintén azonosítottak posztok alapján az online térben összeesküvő szervezeteket, személyeket.

A Contragolpe Brasil elindítása után özönleni kezdtek a posztok is, nevekkel, címekkel, fotókkal, Instagram-fiókokat taggeltek be, amelyek aztán gyorsan el is tűntek.

Személyek online azonosításának megvannak a súlyos kockázatai is. A legevidensebb, hogy tévedünk. Egy nő például azt mondta, hogy egyáltalán nem vett részt a lázadásban, hanem egy résztvevő meghackelte. Rosszakarók is árthatnak így haragosaiknak, vagy felébred az állampolgárokban rejlő ősi feljelentő ösztön. Minden szöveg, kép, videó manipulálható. Ráadásul egyes állításokat szinte lehetetlen ellenőrizni.

Egyelőre nem tudni, hogy a hatóságok használják-e a Contragolpe Brasil Instagram-fiókot.

Mi lesz a nagy nyelvmodellekkel?

Mi történik a jövőben a mesterséges intelligencia egyik leggyorsabban fejlődő területével, a nagy nyelvmodellekkel (large language models, LLM), a felhasználók csak kevés cég csúcstechnológiái, vagy sokkal több fejlesztő szintén hatékony modelljei közül válogathatnak? – teszi fel a kérdést Andrew Ng, a gépi tanulás egyik abszolút szaktekintélye.

Azonnal meg is válaszolja: ugyan az LLM-fejlesztések kezdeti szakaszában járunk, de a felhasználók sok vállalat modelljeihez hozzáférhetnek majd, ami nagyon jót tesz az innovációnak.

llm.jpg

Ezen a területen is ugyanaz történik, mint az infokom más szegmenseiben: a tegnap szuperszámítógépei a holnap zsebóráivá válnak. Egy mai LLM begyakoroltatásához rengeteg adat és komoly infrastruktúra kell, a trendek viszont a szélesebb körű elérhetőséget vetítik előre.

Ng hármat emel ki.

Népszerűvé válnak és egyre jobb teljesítményt nyújtanak a nyílt modellek, mint a Big Science BLOOM-ja, a Tsinghua Egyetem GLM-je és a Meta OPT-je. Az utóbbit a kutatókat bátorító, a kereskedelmi felhasználást viszont kizáró, szigorú licenc alapján tették közzé. A mai nyílt modellek kétségtelenül nem annyira jók, mint egyes cégek szabadalmaztatott darabjai, viszont gyors fejlődés előtt állnak.

A kutatók a gyakorlás hatékonyságát növelő technikákat fejlesztenek. A terület egyik élenjárója, a Google-hoz tartozó londoni DeepMind ajánlásokat tett közzé LLM-ek trenírozásáról: hogyan tegyük eredményesebbé őket fix, tehát korlátos költségvetés mellett. Kiderült: akár egyetlen GPU-n (grafikus feldolgozó egységen), egy nap alatt szignifikáns mértékben növelhető egy modell teljesítménye, ráadásul nyolc-, sőt, négy-bites számításokkal is komoly haladás érhető el.

Minél többen fejlesztenek és tesznek közzé nagy nyelvmodelleket, annál szisztematikusabb lesz a költségek, hozzáférhetőség és más feltételek alapján történő kiválasztást segítő összehasonlítás. A felhasználó könnyebben megtalálja, amire tényleg szüksége van. Szerencsére léteznek már kimerítő és pontos összehasonlító LLM-elemzések.

Ng többször (Stanford, Google stb.) dolgozott már a legnagyobb rendszerekkel, de aztán mindig jöttek még gyorsabbak, még jobbak. Egy mai LLM esetében rengeteg számítási kapacitás szükséges, de az infokom eddig történelméből egyértelműen kiderül: ez nem lesz mindig így, és inkább előbb, mint utóbb, lényegesen leegyszerűsödik a gyakorlás és a tanulás.

(Az ábra a mai nagy nyelvi modellek összetett és bonyolult, időnként ellentmondásos működését szemlélteti.)

Kamuágensünk beszélget az ügyfélszolgálattal

Senki nem szereti az idejét azzal tölteni, hogy telefonon ügyfélszolgálattal beszélget. Szerencsére a mesterséges intelligencia idejétmúlttá teheti ezt a gyakorlatot. Emellett időt spórol meg, és valószínűleg valamilyen kártérítést is kibeszél nekünk.

Joshua Browder, a DoNotPay (Ne fizess) fogyasztóvédelmi szervezet igazgatója a telefon menüjében önállóan navigáló, saját hangjának kamuváltozatát (deepfake) használva, ügyfélszolgálatosokkal beszélgető rendszert mutatott be. A cég általános hangokkal működő ingyenes, és a felhasználóét leklónozó fizetős változatot is kínál a nagyközönségnek.

do_not_pay.jpg

Egy, a YouTube-ról eltüntetett videó demón hallható és látható volt, ahogy a rendszer egy bank képviselőjével elektronikus átutalási díjak visszatérítéséről tárgyal.

Az OpenAI GPT-3.5 nyelvi modelljének automatizált ügyfélszolgálati felszólításokra finomhangolt példányát használva, lépett interakcióba vállalati hangportálokkal.

A Resemble.AI klónszolgáltatás létrehozta Browder hangjának szintetikus változatát.

Elérve a humán ügyfélszolgálatost, a rendszer beszélgetés közbeni válaszokat generált, és a Huggingface nyíltforrású GPT-J modelljének a segítségével töltött fel a Clone-ra. (A GPT-3.5-öt jogi okok miatt nem használták.)

Ennyi történt.

Megválaszolatlan etikai kérdés: embereket, legyen szó fogyasztókról vagy ügyfélszolgálatosokról, értesíteni kell-e arról, hogy bottal beszélgetnek? Ez azért fontos, mert a technológia magában hordja a csalás lehetőségét, sőt, „fel is kínálja” azt. Cyberbűnözők adathalász támadásoknál visszaéltek már az OpenAI nagy nyelvmodelljeivel. 2020-ban például ügyfél hangját szintetizálva, egy bűnözőcsoport négyszázezer dollárt csalt ki az egyik dubai banktól.

Egy automatizált doppelgänger persze mindig jókor jön, és valóban hasznos, ha helyettünk beszél az ügyfélszolgálattal. De mivel vállalatok és pénzügyi szervezetek egyre jobban megerősítik a csalás elleni védelmüket, ebből kifolyólag, az automatizált ügyfeleknek nyújtandó szolgáltatásokat is könnyen visszaminősíthetik.

süti beállítások módosítása