Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Etikus MI 2.0

2022. július 19. - ferenck

Az Egyesült Államokban és a világ más térségeiben is egyre többet foglalkoznak a mesterséges intelligencia szabályozásával, nő a félelem, hogy a gépi rendszerek kárt okoznak, miközben az MI markánsan jelen van a hétköznapokban. Írtak már sokszáz fejlesztési irányelvet, dicséretesek az erőfeszítések, a leírtak viszont ritkán valósíthatók meg a gyakorlatban.

A Microsoft felülvizsgálta 2019-ben kidolgozott Felelős MI Szabványát, igyekszik proaktívan hozzáállni a témakörhöz.

Az új anyag hat alapérték támogatására hívja fel a figyelmet.

etikus_mi_1.jpg

Az elszámoltathatóság arra vonatkozik, hogy a fejlesztőknek fel kell mérniük rendszerük társadalmi hatásait, tényleg működő megoldás-e a kapcsolódó problémára, és kié az MI és az adatok miatti felelősség. Érzékenyebb területeken (pénzügy, oktatás, munkaerő-piac, egészségügy, ingatlanok, biztosítás, társadalmi jólét) az átlagosnál is nagyobb figyelemre van szükség.

A rendszereket alaposan dokumentálni kell, azaz átláthatónak kell lenniük, és a felhasználónak is tudnia kell, hogy MI-vel lépett interakcióba.

etikus_mi0.jpg

A méltányosság szintén alapérték, úgy kell kidolgozni az MI-t, hogy a különböző demográfiai csoportokkal egyformán igazságos legyen, minimalizálja a különbségeket. A felhasználókat figyelmeztetni kell az azonosított kockázatokra.

A rendszer legyen megbízható és biztonságos, definiálni kell, hogy meddig, milyen keretek között működik kockázatmentesen, minimalizálni kell az előrejelezhető hibákat. Módszerek szükségesek a folyamatos monitorozáshoz, illetve iránymutatók a meghibásodás esetében történő visszavonáshoz.

A privacy és a biztonság a fejlesztőcég e területen megfogalmazott alapelveihez igazodjon, a felhasználó tudja mindig, ha adatot gyűjtenek róla.

Az MI-nek befogadónak kell lennie, be kell tartani a vonatkozó szabványokat, hogy például fogyatékkal élők is hozzáférjenek.

Az új irányelveknek való megfelelés érdekében a Microsoft korlátozta az Azure felhőplatformja által nyújtott mesterségesintelligencia-szolgáltatásokat. Új felhasználóknak hozzáférést kell kérniük az arcfelismerő és a szöveget beszéddé alakító (text-to-speech) alkalmazásokhoz. Az arcfelismerő szolgáltatás portré alapján többé nem készít becslést az illető koráról, neméről, érzelmi állapotáról. Jelenlegi felhasználók 2023 júniusáig használhatják ezt a funkciót.

A Microsoft azért döntött a 2.0 mellett, mert az első változatot elnagyoltnak tartják. Az új egyértelműbb irányelveket ad a fejlesztőknek. Ezt segítendő, a nagyvállalat kb. húsz eszközt bocsát a rendelkezésükre, amelyekkel könnyebb felelős MI-t kidolgozni. Például a HAX Workbook az ergonómián javít, az InterpretML segít elmagyarázni a modell viselkedését, a Counterfit biztonsági stressz-tesztet végez.

Amikor az önvezető autók nem vezetnek sehova

A General Motors leányvállalata, a Cruise június másodikán kapott engedélyt arra, hogy San Franciscói robottaxi szolgáltatásáért pénzt kérhessen az utasoktól. Az engedély önvezető autók fizetős taxiként történő használatát tette lehetővé este tíz és reggel hat között. A megengedett maximális sebesség tiszta időben 30 mérföld/óra (kb. 48 km/h).

Az önvezető autók elterjedése sokkal lassabban megy, mint prognosztizálták évekkel ezelőtt. Ezért számított mérföldkőnek a Cruise engedélye.

cruise.jpg

A vállalat komoly fejlődésen ment keresztül a taxiprogramjával, jelentősen csökkentette a mozgás közbeni kockázatokat. A kockázatcsökkentés mértéke pedig épp elég volt ahhoz, hogy a járművek megkapják az engedélyt a közúti vezetésre.

A központi irányításnak, vezérlésnek viszont megvannak a maga veszélyei, arról nem is beszélve, hogy tökéletes célpont lehet rosszban sántikáló hackerek számára.

Több sajtóorgánum számolt be ugyanis arról a sajnálatos tényről, hogy a Cruise önvezető taxijai nemrég tömegesen leálltak. De mi is történt?

cruise0.jpg

Május óta a járművek legalább négy alkalommal elveszítették a kapcsolatot a cég szervereivel. Ezekben az autókban egyáltalán nincs biztonsági humán vezető, így a kapcsolat megszakadása miatt az autók jelentős ideig mozgásképtelenné váltak.

Május 18-án a Cruise a teljes flottával elveszítette a kapcsolatot. Az alkalmazottak képtelenek voltak a járművek távvezérlésére, és az utasokkal sem tudtak kapcsolatba lépni.

Június 28-án közel hatvan Cruise-taxi kilencven percen keresztül nem állt összeköttetésben a szerverekkel. Legalább tucatnyi ugyanabban az útkereszteződésben tartózkodott, gátolva az utat és a keresztutakat. Emiatt egy takarító jármű nem tudta végezni a munkáját, amiért a Cruise-nak bírságot kell majd fizetnie. A távirányítás megint nem működött, az alkalmazottaknak manuálisan kellett a járműveket a garázsba vezetni.

Június 21-én és 24-én hasonló esetek történtek.

A vállalat megoldást keres az ilyen jellegű jövőbeli problémák kezelésére, hogy a jármű semmilyen körülmények között ne veszítse el a kapcsolatot a szerverekkel, távoli irányítókkal. Jelenlegi technológiákkal komoly kihívás a baj orvoslása.

Testtartásunkat és mozgásunkat is érzékelik az intelligens textíliák

Az MIT (Massachusetts Institute of Technology) kutatói új gyártótechnológiával a testhez szorosan illeszkedő, ezért viselője testtartását és mozgását is érzékelő intelligens textíliákat dolgoztak ki.

Speciális műanyag fonalat hővel enyhén megolvasztottak – az eljárás neve hőformázás (thermoforming) –, amellyel jelentősen javítottak a többrétegű kötött textíliákba (3DKnITS) szőtt nyomásérzékelők pontosságán. Ezzel a folyamattal hoztak létre „okos” cipőt és szőnyeget, majd a nyomásérzékelők adatait valósidőben mérő és értelmező hardver- és szoftverrendszert dolgoztak ki. A gépitanulás-alapú rendszer 99 százalékos pontossággal előrejelezte a cipőt viselő és a szőnyegen álló személyek mozgását, jógapozícióit.

mit_textiliak.jpg

A digitális kötés előnyeit kiaknázó gyártófolyamat lehetővé teszi a gyors prototípuskészítést, és könnyen bővíthető nagyüzemi gyártáshoz.

A technika többféle alkalmazással kecsegtet, az elsőkre az egészségügyben és a rehabilitációban számíthatunk. Például súlyos sérülés után a járást újratanuló személyek mozgásának követésére alkalmas cipők, vagy cukorbetegek lábára nehezedő nyomást monitorozó zoknik fejleszthetők így. A zoknival fekélyek kialakulása előzhető meg.

A digitális kötés teljes szabadságot biztosít a fejlesztőnek saját mintázatok tervezéséhez, szenzoroknak a szerkezetbe való integrálásához. A technológiát a testükhöz kialakított, kényelmes cipők, textíliák stb. viselője nem érzékeli, jelenléte láthatatlan.

Az MIT Médialaboratóriuma már az 1990-es évek vége felé foglalkozott intelligens textíliákkal. Az akkor nagyon futurisztikus, úttörő munkákba elektronikát ágyaztak be. Az anyagtudomány, a beágyazott technológiák és a gyártórendszerek, például a digitális kötőgépek rengeteget fejlődtek azóta, és a jövő a mainál is rugalmasabb megoldásokkal, kvázi végtelen lehetőségekkel kecsegtet – vélik a fejlesztők.

A munkában a szintén Massachusetts állambeli Wellesley College és a szingapúri Nanyang Műszaki Egyetem is részt vett.

Lehűti magát a kvantumszámítógép

Hagyományos komputerek amikor felmelegednek, általában lelassulnak, kvantumszámítógépeknél pedig jóval nagyobb a kockázat. Ugyanis, ha nagyon felmelegednek, nemcsak lelassulhatnak, hanem, rosszabb esetben, teljesen le is állhatnak.

A hagyományos gépeket jellemzően ventillátorok hűtik, kvantumszámítógépek esetében komolyabb a kihívás: mivel az izolált qubiteket (kvantumbiteket) hidegen kell tartani, számítások közben viszont mindig felmelegszenek, hatékony hűtőtechnika kell több kvantumalgoritmus egymás utáni futtatásához, a gép eredményes működéséhez.

kvantum_11.jpg

Úgy tűnik, hogy a Stuttgarti Egyetemen megtalálták az ellenszert, speciálisan tervezett, számítások közben is hűlő, új típusú – nem tökéletes – gyémántokat. Ezek a gépek egyetlen algoritmus futtatásával képesek megakadályozni, hogy túlmelegedjenek.

A legtöbb kvantumgépet alacsony hőmérsékleten kell tartani, és az úgynevezett algoritmikus hűtés lehetővé teszi, hogy a jövő kvantumkomputerei szobahőmérsékleten is tökéletesen működjenek, pontosan hajtsák végre a rájuk bízott feladatokat.

A német kutatók matematikai műveletek sorozatával magát hidegen tartó, gyémántalapú kvantumszámítógépet fejlesztettek.

A gép három kvantumbitből áll egy gyémántban. Hiányzik két szénatom, az egyiket nitrogénatom helyettesíti, a másik helyén üresedés van. A kvantumbiteket mikrohullámokkal „sokkolták”, amelyre vagy a nitrogénatom magja, vagy az üresedéshez közeli szénatomok magjai, egész pontosan a hozzájuk kapcsolódó spin megváltozott. (A spin sajátperdület vagy sajátimpulzus-momentum kvantummechanikai részecskék perdületének egyik, a részecskék mozgásától független összetevője, nincs klasszikus mechanikai megfelelője.)

A qubitek ilyen jellegű módosításai logikai kapukként funkcionálnak, a kapuk szekvenciájával pedig megváltoztatható a gép energiája, lehűthető a kvantumkomputer. A kutatók szerint ez az algoritmikus hűtés nagyon közel áll a maximális hűtési hatékonyság elméleti határaihoz.

Bűnvádi eljárásokhoz keres bizonyítékokat a mesterséges intelligencia

A joghoz kapcsolódó IT-megoldásokkal foglalkozó Everlaw ügyvédek bizonyítékgyűjtő munkáját segítő, akár 25 millió dokumentumot automatikusan rendszerező, klaszterező szoftverét bírósági eljárásoknál is felhasználják.

Az algoritmus felügyelet nélküli, előfordulási gyakoriság alapú klaszterezéssel elemez szöveges dokumentumokat, és készít vizuális térképet szófelhőkről. Minimum 35 dokumentum kell egy klaszterhez, amelyekben a szöveg mellett e-mailes metaadatokat is vizsgál: tárgy, cím, feladó, címzett stb. A felhasználó manuálisan létrehozhat kisebb klasztereket, illetve új klaszterekbe csoportosíthat át dokumentumokat.

everlaw0.jpg

A szoftver olyan részleteket, bizonyítékokat is észrevehet, amelyek felett elsiklik az ügyvédek figyelme.

A szófelhők között görgethetjük az egeret, zoomolással felnagyítva, kicsinyítve vizsgálhatunk dokumentumokat. Egy előrejelző kódolás nevű funkció megtanulja felismerni az adott eset szempontjából releváns dokumentumokat. A program 109 nyelvre lefordítja a szövegeket.

everlaw.jpg

Egy ismert esetben a szoftver egymillió dokumentumból negyvenben talált a vádlott csalási szándékát alátámasztó bizonyítékokat.

A mesterséges intelligencia egyre nagyobb szerephez jut jogi eljárásokban, és a jövőben sokkal több okos algoritmus dolgozhat ezen a területen.

A Lex Machina jogi elemzőplatform a tárgyalás hosszúságát és az egymással szemben álló jogászok, jogászcsoportok korábbi tevékenységét figyelembe véve, előrejelzi, hogy egy adott bíró milyen döntést hozhat egy-egy ügyben.

A CorsearchNow és a SmartShell szellemi tulajdonjogi esetekben nyújt hatékony támogatást ügyvédeknek.

Az USA több tagállama kockázatértékelő algoritmusok előrejelzéseit is tanulmányozva, dönt például az óvadék nagyságáról, vagy a büntetés hosszáról. Ezek az algoritmusok felmérik, hogy a vádlott mekkora eséllyel lesz visszaeső, mennyi a valószínűsége, hogy megjelenik a tárgyaláson stb. Alkalmanként viszont részrehajlók, például egy 2016-os floridai eset során, a visszaesés valószínűségének előrejelzésénél, megállapították az algoritmus bőrszín szerinti elfogultságát.

Ember nélküli kutatóhajó szelte át az Atlanti-óceánt

Az IBM és a nonprofit ProMare tengerkutató szervezet által épített ember nélküli Mayflower Autonóm Hajó 400 (MAS 400) két korábbi sikertelen „nekifutás” után, június utolsó hetében az angliai Plymouthból az új-angliai Plymouthba (Massachusetts állam) ért.

Az autonóm navigáló hajó működése az IBM Operációs Döntéskezelőjén, gépi tanulással és más forrásokból gyűjtött adatokat integráló szabályalapú rendszeren alapul, az segíti a tengeri navigáció szabályainak betartásában. Ember nincs rajta, de, ha szükséges, akkor a ProMare csapata átveheti a távirányítást.

ship.jpg

Gépi látással támogatott hat kamera detektálja a kockázatokat, veszélyeket. A fejlesztők több mint egymillió tengeri képpel tanítottak be egy algoritmust más hajók, bóják, hulladék és szárazföld felismerésére.

Egy másik szabályalapú rendszer detektálja a közeli hajókat, és reagál rájuk. Kamera, radar, szonár és adóvevő inputokat vesz figyelembe más hajókról, hogy a szabályoknak megfelelően feltérképezze az irányt a másik hajó elkerüléséhez. Iránymódosítás előtt biztonsági rendszer ellenőrzi a döntést.

ship0.jpg

A hajó tudományos célokra is gyűjt adatokat. Szenzorok mérik a légszennyezéssel és a klímaváltozással kapcsolatos környezeti feltételeket: az óceán hőmérsékletét, sótartalmát, savasságát, fluoreszcenciát, mikro-műanyagok jelenlétét. Hangérzékelők bálnák és delfinek hangját veszik fel, gyorsulásmérők a hullámenergiát rögzítik.

A 2021-re tervezett Plymouth-Plymouth távval az eredeti és legendás Mayflower majdnem 400 évvel korábbi (1620-as) útjáról kívántak megemlékezni, amikor Angliából vallási üldözöttek – puritánok – csoportja menekült Amerikába. A jármű már egy hete úton volt, amikor technikai problémák miatt abba kellett hagynia a három hétre tervezett utat. A ProMare személyzete visszanavigálta Angliába. A második kísérlet több mint két hónapig tartott, két nem tervezett kikötő-vizittel: az Azori-szigeteken és Új-Skóciában. Végül generátor és elemprobléma miatt hiúsult meg az út.

A MAS 400 nem az egyetlen autonóm hajó a tengereken, óceánokon.

Az Orca AI nemrég tett meg 790 kilométert a japán partok mellett. Egy norvég jármű Norvégia és Finnország partjainál tesz meg tövid távolságokat. Tavaly nyáron autonóm vitorlás kutatóhajó ment Kaliforniából Hawaiira, útközben az óceánfeneket igyekezett feltérképezni.

Ha nincs személyzet egy hajón, tér, üzemanyag és pénz takarítható meg. Az iparág figyeli a fejleményeket, és a Nemzetközi Hajózási Szervezet elkezdte kidolgozni az autonóm hajók szabályozását.

Földfelszíni változások műholdas követése

A gépi látás egyik nagy kihívása a műholdas képalkotás javítása, ezeknek a képeknek a helyes értelmezése. Több kutatócsoport e felvételekre támaszkodva követi a klímaváltozás hatásait, jelez előre vulkánkitöréseket, vagy figyeli Kína covid utáni gazdasági felépülését. A műholdas képek hírszerző ügynökségek számára is kulcsfontosságú anyagok.

A földfelszínen bekövetkező változások lefényképezése mindent megváltoztathat az erre szakosodott technológiai területeken, változatos szegmensekre (mezőgazdaság, logisztika, katasztrófavédelem) lehet komoly hatással.

smart_1.jpg

Embernek egyáltalán nem praktikus, kvázi lehetetlen feladat a bolygót figyelő 150-nél több műhold képözönének az elemzése. A folyamat automatizálásával, gépi tanulással azonban komoly lehetőségek nyílnak meg – persze nemzetbiztonsági szervezetek számára is.

Az USA kormánya által szervezett, szórakoztató nevű SMART (Space-based Machine Automated Recognition Technique) verseny résztvevőinek nagyszabású építkezéseket szekvenciális műholdfelvételeken lekövető rendszereket kellett fejleszteniük.

smart0.jpg

Dömperek, méretes daruk, kopár talaj az építkezések jól ismert vizuális jelei, csakhogy ezek a jelek nem mindig észlelhetők egyszerre, és más célokat is szolgálhatnak. Tegyük hozzá, hogy különféle műholdaknak más a képalkotó rendszerük, másként keringenek, más az ütemezésük stb. Mindezek tovább nehezítik az automatizált osztályozást.

A verseny első szakaszában, 2021 januárja és idén április között a résztvevők képforrástól függetlenül ugyanazon a helyen, de nem ugyanabban az időben látható jeleket összekapcsoló modelleket építettek.

Dubaitól Amazóniáig, 27 régióról készült 100 ezer műholdfelvétellel dolgoztak. Kb. 13 ezret címkéztek fel, ezek 1000 építkezésre és 500 hasonló, de más tevékenységre utaltak. Az adatsor nyilvános volt, a modelleknek meg kellett találni az építkezés-helyszíneket, megállapítani a munkafázist, jelezni a speciális változásokat, plusz azonosítani az érdeklődést felkeltő jegyeket: hőmérsékleti anomáliákat, a talaj áteresztőképességét, munkagépeket stb.

A NASA, az amerikai Geológiai Megfigyelőközpont és más akadémiai szervezetek szakembereiből álló zsűri döntése alapján hat csapat jutott a 2023-as második körbe, amelyben az építkezést felismerő modelleket időbeli változásokhoz kötődő feladatokhoz, például a termésnövekedés detektálásához kell alkalmazniuk. A 2024-ben kezdődő harmadik körben a még álló versenyzőknek a változatos földhasználati módokat általánosító rendszert kell fejleszteniük.

Gyurmáznak a robotok

A play dough különleges mechanikai tulajdonságokkal rendelkező gyurma, és már egy kétéves gyereknek is könnyű formákat gyúrni belőle.

Robotoknak viszont nehéz. A gépek egyre inkább boldogulnak merev tárgyakkal, puha, rugalmas szerkezetű, módosítható dolgok viszont komoly kihívást jelentenek számukra. A feladatot tovább bonyolítja, hogy ha egy elemet elmozdítunk, az valószínűleg a többire is hatással van.

robot_gyurma.jpg

Az MIT (Massachusetts Institute of Technology) és a Stanford kutatói nemrég robotokkal gyurmáztattak. A vizuális inputból közvetlenül tanuló rendszert fejlesztettek, a kétujjas markolóval felszerelt gép ezen a RoboCraft nevű rendszeren alapul, ez teszi lehetővé, hogy lásson, szimuláljon és átformáljon gyurmadarabokat.

A rendszer megtervezi a gép viselkedését, hogy például különböző betűket, köztük soha nem látottakat is kihozzon az anyagból. A teszteken mindössze tíz perc adatból történő tanulás után ugyanúgy, alkalmanként jobban teljesített, mint amikor ember távirányította.

robot_gyurma0.jpg

Ezek az ismeretek fontosak a komplex ipari környezetben vagy lakásban folytatott interakciókhoz, például szushi sodrásához, vagy kerámiázáshoz. Ruhák és kötelek elmozdítása már egyre jobban megy, de gyurmával vagy tésztákkal nem tudnak mit kezdeni.

A gép agya, RoboCraft előrelépést jelent.

Puhább anyagoknál a hatékony modellezés és tervezés előtt a teljes szerkezetet figyelembe kell venni. A képek apró részecskékből álló gráfokká alakításával, algoritmusokkal összetársítva, RoboCraft gráf-alapú ideghálóval működik, és pontosabb előrejelzéseket készít az anyag formaváltozásairól.

A tárgyakra kifejtett erőt, nyomatékot és a dinamikát szimulátorral modellezték, és próbálták megérteni. RoboCraft viszont csak vizuális adatot használ, működése három részen alapul, azokkal formálja valamivé, például R betűvé a puha anyagot.

Az első az érzékelés, azaz megtanul látni. Kamerák gyűjtik a képi adatokat, majd az idegháló részecskeadatokon gyakorolva sajátítja el tárgyak dinamikájának, mozgásának a szimulálását. Ezt követően algoritmusok segítik a robotkar mozgásának kidolgozását, formák kialakítását.

A távolabbi tervek között a háztartási munkába történő besegítés is szerepel.

Algoritmus tanulmányozza az agy huzalozását

Indiai és brazil kutatók az emberi agy különböző részei közötti kapcsolatokat tanulmányozó algoritmust fejlesztettek. Rendeltetése, hogy jobban megismerjük az agy huzalozását.

Diffúziós mágneses rezonanciás képalkotással (dMRI) generált nagymennyiségű adat elemzésében segít. Kb. 150-szer gyorsabb, mint egy desktop gépen futó átlagos algoritmus, de a csúcsalgoritmusoknál is jóval nagyobb tempóban dolgozik.

A keresett mintázatok állatoknál invazív technológiákkal vizsgálhatók, embereknél viszont dMRI-t használnak a fehérállomány mintáival kapcsolatos következtetésekhez. Tudósok a molekulák nyomon követésével átfogó térképet készíthetnek az agyi idegsejtek közötti kapcsolatokról, a kapcsolatok alkotta hálózatokról.

brain_2.jpg

A kutatók elmondták, hogy az összeköttetések meghatározása ugyan nehéz, az „információs autópálya” – ahol az agyban áramlanak az adatok – forgalmi mintázatait figyelve próbálnak következtetéseket levonni. Ezen az autópályán a molekulák a járművek.

Például megnézik a vízmolekulák mozgását, és próbálják kiszámítani belőlük a huzalok helyét. Ezek a molekulák az agy különféle részeit összekapcsoló kábelek (axonok – az idegsejtek sajátos, leghosszabb nyúlványai) mentén mozognak. Az útvonal mérésével kikövetkeztethetők az összekötött területek.

Mindehhez rengeteg számítás kell, amelyeket hatékonyan használt GPU-kkal hajtanak végre (a GPU a grafikus vezérlőkártya központi egysége). Korábban órákig, napokig tartó feladatokat másodpercek alatt képesek elvégezni.

Információs hálózatok pontos azonosításához, hagyományos algoritmusok egyeztették az előrejelzett és a megfigyelt dMRI jeleket. Optimalizáláshoz is fejlesztettek hasonló algoritmust (LIFE-nak hívják), de mivel klasszikus CPU-kkal működött, túl időigényesek voltak a számítások.

Az új kutatáshoz a LIFE-ot újratervezték, hogy GPU-kon is működjön, amellyel – a redundáns kapcsolatok eltüntetése mellett – jelentősen felgyorsultak a számítások.

Az algoritmust az egészségügy több területén alkalmazhatják, például a diagnosztikában és a viselkedéstudományban játszhat fontos szerepet.

Ember-gép együttműködés a gépi fordításban

A voice over (hangrámondás) automatizált fordítása azoknak a feladatoknak az egyike, amelyekben a gépek versengenének az emberrel. Egyrészt, az automatizáció segítene alacsony költségvetéssel dolgozó producereknek, például új piacokat szerezhetnének vele, másrészt viszont, ha elterjednek ezek a rendszerek, több előadóművész elveszítheti a munkáját.

A londoni Papercup startup különleges megoldást kínál videós hangrámondások több nyelvre történő fordításában. Az algoritmikus fordítást, a hangszintézist az ember által végzett minőségi ellenőrzéssel kapcsolják össze, azaz humán résztvevő is van a folyamatban.

papercup.jpg

A legutóbbi befektetői kör alapján a piac bízik a Papercup megközelítésében.

A rendszer működése logikus és egyértelmű: videókészítők feltöltik az anyagukat és meghatározzák, hogy milyen nyelven, nyelveken kell nekik a fordítás. Egyelőre az angol, a mandarin, az olasz, a latinamerikai spanyol és a brazil portugál a választék.

papercup0.jpg

Választhatnak a különféle nemeket, életkort megörökítő szintetizált hangok között, módosíthatnak a hang mélységén/magasságán és karakterén, ráadásul megváltoztathatják az általa kifejezett érzelmet (boldog, szomorú, dühös stb.) is, ami persze nem biztos, hogy célszerű.

Algoritmusok szöveggé alakítják a beszédet, és lefordítják a célnyelvre. Következő lépésként, szöveget beszéddé alakító algoritmus (text-to-speech generator) az új nyelvre „ülteti át” a voice overt. Az algoritmust a startup külső és belső adatokon gyakoroltatta.

Itt jön képbe az ember: anyanyelvi „lektor” ellenőrzi, és ha kell, manuálisan szerkeszti az eredményt.

Humán résztvevő bevonása logikusnak tűnik, mert így jobban működik a fordítás. Jelenlegi technológiákkal viszont a folyamat további automatizálása is megvalósítható. A Papercup hangválogatást kínál, ahelyett, hogy az eredetit próbálná a célnyelven utánozni, így pedig jól érzékelhetők az eredeti és a kimeneti hang közötti különbségek, a beszédaktus eltérései. Nem ártana ezen változtatni.

süti beállítások módosítása