Az NJSZT blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

A Microsoft MI-jével jobb az angolról indiai nyelvekre fordítás

2018. február 26. - ferenck

A Microsoft bejelentette, hogy mesterséges intelligenciával, mély ideghálókkal (deep neural networks, DNN) igyekszik javítani az indiai nyelvekre, hindire, bengálira és tamilra történő valósidejű gépi fordításon.

A DNN-ek az input és output között több rejtett réteggel rendelkező, összetett nemlineáris kapcsolatokat is jól modellező mesterséges ideghálók. A módszer általában a gépi tanulás manapság nagyon népszerű mélytanulás (deep learning) módszeréhez kapcsolódik.

indiai_forditas.jpg

A pontosabb és természetesebb fordításhoz Microsoft Edge böngészőt, Bing keresőt és Bing Translatort kell használni, ami e feltételek mellett bármelyik honlapon működik.

Az új technológiával javulnak a Microsoft Office 365 termékeinek (Word, Excel, PowerPoint, Outlook, Skype) kereső- és fordítófunkciói. A redmondi cég bizakodik, hogy a mesterséges intelligencia javítani fog felhasználói életszínvonalán, és pozitív hatással lesz az indiai mezőgazdaságra, egészségügyre, oktatásra, a kormány munkájára.

indiai_forditas0.jpg

A Digitális India koncepció megvalósulásának motorját látják benne.

A technológia a Translator appon keresztül iOS-es és androidos készülékeken is elérhető. Partnerek és ügyfelek a Microsoft felhőplatformján, az Azure-on használhatnak alkalmazásprogramozási felületeket (API-kat), amelyekkel termékeikbe tudják integrálni a fordítót.

A hozzátartozó „TrueText” DNN-alapú rendszer ismétlések, szünetek és semleges szavak szűrésével pontosabbá, hitelesebbé teszi a lefordított szöveg és környezete (kontextusa) kapcsolatát.

DNN-ekkel többrétű fogalmak, mint például a nem (hím, nő, semleges), udvariassági szintek (szleng, kötetlen, írott, formális), szófajok is kódolhatók, és az eddigi tesztekből kiderült, hogy legalább 20 százalékkal javított a Microsoft által támogatott összes indiai nyelvre történő fordítás minőségén.

A cég több mint két évtizedig statisztikai gépi fordítást (statistical machine translation, SMT) használt minden nyelvre, és a DNN-ek integrálása előtt régen volt ilyen látványos előrelépés. Indiai nyelvekkel az 1998-ban indult Bhasha projekt óta foglalkozik, termékei a szubkontinens mind a 22 alkotmányosan elismert nyelvét támogatják.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr7813667490

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.