Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


A Microsoft MI-je kiszedi a mellékzajokat a videobeszélgetésekből

2020. április 01. - ferenck

Karantén és kijárási tilalom idején a társasági távolságtartás, az önizolálás, a távmunka és a nagyobb csoportosulások elkerülése válik normává, így sokan jóval több időt töltenek csoportos videobeszélgetéseken, videokonferenciákon, mint eddigi életük során bármikor. Új megoldások általában új…

Tovább

Emberi módon válaszol a chatbot?

A berlini Rasa startup kutatói arra a kérdésre keresik a választ, hogy mi a velünk folytatott interakciók közben természetesebben, emberszerűbben reagáló chatbotok (csevegő/beszélgető robotok, egész pontosan szoftverágensek) titka, hogyan fejleszthetők ilyen botok? A kutatók szerint a szelektív…

Tovább

Új asszisztens segíti a vakok és gyengénlátók webes böngészését

A montreali Waterloo Egyetem, a Washington Egyetem (Seattle) és a Microsoft Research kutatói vakok és gyengénlátók webes tartalmakhoz való lehető leggyorsabb és leghatékonyabb hozzáférését segítő hangasszisztenst fejlesztettek. Az asszisztenst okos hangfalakra és hasonló más eszközökre találták…

Tovább

A szerző helyett az avatárja olvas fel könyveket

Szöveg beszéddé alakítása (text-to-speech) ma már viszonylag egyszerű, a technológia jóvoltából hamar létrehozható könyvek audiováltozata, digitalizált, szintetikus hangokkal. Cseppet sem meglepő módon folyamatosan bővül a hangoskönyvek (audiokönyvek) piaca. Ha nem trendteremtő, akkor a nyugati…

Tovább

Hang alapján kitalálja az MI, hogyan nézünk ki

Mennyire vagyunk képesek beszéde alapján következtetni egy személy kinézetére? A beszédgenerálás módjának közvetlen következménye, hogy a kettő, a beszéd és az arc között erős kapcsolat áll fenn. Hallgatás közben mentális modellt építünk az illetőről – kora, neme,…

Tovább

Közvetlenül fordítja a beszédet egyik nyelvről a másikra a Google új rendszere

Az elmúlt hónapokban a Google finomhangolta fordítótechnológiáját, a Translate-et tavaly kiejtésfajtákkal bővítette, így egyes nyelvek dialektusait is képes visszaadni. Az eszközt több nyelvvel egészítette ki, év elején pedig „fordító móddal” bővítette a Google…

Tovább

Megvédi magát az MI a beszédbe rejtett rosszindulatú üzenetektől

Több kutatócsoport próbálkozik a gépi beszédfelismerés és szövegértés biztonságosabbá tételével, hogy mesterséges intelligenciákat ne tévesszenek meg például az emberi fül számára jóindulatú, de rejtett, például egy eszköz virtuális asszisztensen keresztüli…

Tovább

Hang alapján mutatja ki a poszttraumás stressz-zavart egy MI

A többek között amerikai háborús veteránoknál jelentkező poszttraumás stressz-zavar (PTSD) az egyik legnehezebben diagnosztizálható pszichés betegség, és évek óta a diagnosztika egyik legnagyobb kihívása. Hagyományos módszerek, például a szemtől szembeni klinikai interjúk az…

Tovább
süti beállítások módosítása