A voice over (hangrámondás) automatizált fordítása azoknak a feladatoknak az egyike, amelyekben a gépek versengenének az emberrel. Egyrészt, az automatizáció segítene alacsony költségvetéssel dolgozó producereknek, például új piacokat szerezhetnének vele, másrészt viszont, ha elterjednek ezek a rendszerek, több előadóművész elveszítheti a munkáját.
A londoni Papercup startup különleges megoldást kínál videós hangrámondások több nyelvre történő fordításában. Az algoritmikus fordítást, a hangszintézist az ember által végzett minőségi ellenőrzéssel kapcsolják össze, azaz humán résztvevő is van a folyamatban.
A legutóbbi befektetői kör alapján a piac bízik a Papercup megközelítésében.
A rendszer működése logikus és egyértelmű: videókészítők feltöltik az anyagukat és meghatározzák, hogy milyen nyelven, nyelveken kell nekik a fordítás. Egyelőre az angol, a mandarin, az olasz, a latinamerikai spanyol és a brazil portugál a választék.
Választhatnak a különféle nemeket, életkort megörökítő szintetizált hangok között, módosíthatnak a hang mélységén/magasságán és karakterén, ráadásul megváltoztathatják az általa kifejezett érzelmet (boldog, szomorú, dühös stb.) is, ami persze nem biztos, hogy célszerű.
Algoritmusok szöveggé alakítják a beszédet, és lefordítják a célnyelvre. Következő lépésként, szöveget beszéddé alakító algoritmus (text-to-speech generator) az új nyelvre „ülteti át” a voice overt. Az algoritmust a startup külső és belső adatokon gyakoroltatta.
Itt jön képbe az ember: anyanyelvi „lektor” ellenőrzi, és ha kell, manuálisan szerkeszti az eredményt.
Humán résztvevő bevonása logikusnak tűnik, mert így jobban működik a fordítás. Jelenlegi technológiákkal viszont a folyamat további automatizálása is megvalósítható. A Papercup hangválogatást kínál, ahelyett, hogy az eredetit próbálná a célnyelven utánozni, így pedig jól érzékelhetők az eredeti és a kimeneti hang közötti különbségek, a beszédaktus eltérései. Nem ártana ezen változtatni.