Beszéd közben agyunk jeleket küld szájunkra, nyelvünkre, gégénkre és állkapcsunkra, együttes tevékenységük eredménye az óhajtott hang.
A San Franciscói Kaliforniai Egyetem (UCSF) kutatói öt agyműtéten átesett epilepsziás személy jelzéseit rögzítették, miközben 100 mondatos listát használva beszéltek. A jeleket az emberi hangrendszer számítógépes modelljébe táplálták, amely félig-meddig érthető szintetizált beszédet generált belőlük.
A kutatók nem elvont gondolatok rögzítésével, nem közvetlenül a beszéd dekódolásával, hanem az idegek hangképző szerveket mozgásra utasító jelzéseivel foglalkoznak. Korábban robotkarok irányítására használtak fel az agy más részeiről érkező motorikus jelzéseket.
A felvételeket az agyfelületre helyezett rugalmas elektródasorral készítették. A szintetizált hangokat a Mechanikus Török közösségi ötletbörzén (crowdsourcing) tesztelték, a lehetséges szavak készletével dolgozó önkéntesek próbálták átírni, és átlagosan 50-70 százalékot értettek belőlük.
Andrew Schwartz, a Pittsburgh Egyetem kutatója szerint ez az agy-számítógép interakció (brain-computer interface, BCI) kutatásban eddig végzett legjobb munka. Ha pedig az agyszövetre is kiterjesztenék, még pontosabb eredményt kapnának.
A BCI-k egyelőre nem elég fejlettek, még nem képesek bénulásban szenvedő személyek segítésére, ami az ezirányú kutatások egyik legfőbb célja.
Az UCSF szakemberei tavaly Lou Gehrig-kóros betegekkel kezdtek el foglalkozni, és a mostani vizsgálathoz hasonló elektródákból álló implantátumokat terveznek. Egyrészt a beszédszintézis, másrészt külső váz (exoskeleton) irányítása a cél. A rendszert pácienseken még nem tesztelték, és azt sem lehet tudni, hogy milyen eredményt érnek el szájuk mozgatására képtelen személyekkel. (A Lou Gehrig-kór vagy amiotrófiás laterálszklerózis lényege, hogy a központi idegrendszer mozgató idegsejtjeinek pusztulása következtében az akaratlagos izmok fokozatosan elgyengülnek, végül elsorvadnak.)
Az eredmények mindenesetre kevésbé voltak meggyőzőek, amikor a száj mozgatásával, s nem hangos beszéddel kellett szavakat formálni.
Egyes szilícium-völgyi cégek közölték, hogy szeretnének gondolatokat szöveggé alakító kereskedelmi célú „agyolvasókat” fejleszteni. A Facebook például anyagilag támogatja az UCSF idevágó kutatásait (a „percenként száz szót gépelő első csendesbeszéd-interfészt”), a mostanit viszont nem.
Egyelőre bizonytalan, hogy nem invazív módszerrel kivitelezhető-e egy ilyen interfész (a Facebook nem fejleszt sebészi beavatkozást igénylő implantálható eszközöket). Ha létezne ilyen technológia, nagyon komoly egészségügyi következményei lennének.
Jelen kutatás mindenesetre fontos lépés a súlyosan lebénult személyek verbális kommunikációját segítő, működő kereskedelmi rendszerek felé.