Nincs többé szükségünk például japánul beszélni ahhoz, hogy bárkivel, bárhol elhitessük: folyékonyan elboldogulunk a távol-keleti nyelvvel.
Julia White, a Microsoft Azure egyik vezetője egy múlt heti konferencián, Las Vegasban bemutatta, hogyan készíthető személyekről döbbenetesen élethű hologram. A hologram ráadásul nemcsak külsőnket utánozza, hanem a mi hangunkat használva általunk nem ismert idegen nyelveken is beszél.
A bemutató két technológiának, a kevert valóságnak (mixed reality, MR) és szövegek neurális alapon történő beszéddé alakításának (neural text-to-speech) köszönhető. A kommunikáció jövőjét vetíti előre, amikor a technológia jelentősen csökkenti, kvázi lebontja az emberi interakció verbális korlátait.
Első lépésként White külsőre azonos életnagyságú hologramját alkották meg. A felvétel a Microsoft egyik kevertvalóság-stúdiójában történt, White angolul tartotta a prezentációt.
Ennyi pedig a Microsoft HoloLens MR headsetjét viselő bármelyik személynek elegendő ahhoz, hogy úgy érezze: White pont vele szemben áll, hozzá beszél. A japán szöveghez a cég neurális „fordító” technológiáját használták, az alkotta meg a beszélő személyes „hang-aláírását”. Mihelyst elkészült, a hologrammal bármit, bármilyen nyelven elmondathatott. A hallgatóság White hangját hallotta, a nő japánul magyarázott.
Nemzetközi közönség a hangot mesterségesintelligencia-módszerrel utánzó hologram használata nélkül is sokat profitálhat a kombinált megoldásból, mert az anyagot megnézhetik televízión vagy számítógépes képernyőn, a beszédet pedig humán fordító ülteti át az illető anyanyelvére.
A technológia felszámolja az előadó és hallgatósága közti korlátok nagy részét. Képzeljük el, hogy a világ egyik vezető politikusa szónokol, és minden egyes hallgatója – a bolygó különböző pontjain – úgy érzi, mintha az illető a szobájában lenne, és az ő nyelvén beszélne.
Vagy egy világhírű professzor előadást tart, és bárki anélkül látja és érti, hogy ki kellene mozdulnia otthonról, és meg kellene tanulnia a prof anyanyelvét.
Mi lehet a következő lépés? MR-alapú kontaktlencsék, és nem lesz többé headsetre szükség? A beszédet a beszélő hangján valósidőben fordító MI?
„Ezek a technológiák mind léteznek. A jövő már itt van” – fejezte be prezentációját White.