Valódi videókat generál a mesterséges intelligencia?

0

2024. március 14. - ferenck

Sora, az OpenAI új szövegalapú videógenerátora magasra emelte a lécet részletességben és realizmusban. Korábban egyetlen MI sem érte el ezt a szintet, nem alkottak ennyire meggyőző, csúcsminőségű mozgókép-világot. Magáról a rendszerről, a rendszer felépítéséről viszont keveset tudunk.

Sora kódoló-dekódolót és transzformert használó, zajt videóvá alakító látens diffúziós modell. A rendszert maximum 1920x1080 pixeles és egyperces videókon gyakoroltatták.

Az OpenAI a biztonság kiértékelése miatt külsős kutatókkal ugyan megosztotta a technológiát, kvantitatív részleteket és a korábbi munkákkal való összehasonlítást viszont nem közölt róla. A modellarchitektúrák és a gyakorlómódszerek részletes leírása szintén hiányzik. Egyes eredmények arra engednek következtetni, hogy nemcsak a zaj tokenekről történő eltávolítására, hanem jövőbeli tokenek előrejelzésére és más tokenek közötti tokenek generálására is megtanították az MI-t. A forrásokról és az adatkészletről szintén nincs infó.

Az eredmények elég meggyőzőek ahhoz, hogy feltegyük a kérdést: Sora milyen szinten érti a fizikát, mert a jelenetekben nyilvánvalóan promptok és vágás nélküli részletek is bőven szerepelnek, összességük pedig konzisztens, részletesen kidolgozott anyag. Hibák és folyamatossági problémák persze előfordulnak, de első látásra szinte semmit nem veszünk észre belőlük. Másodszorra, harmadszorra is nehezen.

Eddig láttunk már videókat generáló transzformereket, diffúziós modelleket, képeket generáló diffúziós transzformereket, videógeneráló diffúziós transzformerre viszont Sora az első példa. Szépen szemlélteti, mennyire alkalmasak ezek a modellek mozgókép-készítésre.

De vajon megtanult egy világmodellt? – teszi fel a kérdést Andrew Ng, gépitanulás-szakértő. Megtanulta, hogy előrejelezze a környezet jövőbeli állapotát, megadtak neki egyes történéseket?

Ezt megtanulni nem ugyanaz, mint a környezet pixelekben történő ábrázolási készségének elsajátítása. Ha azt prognosztizáljuk, hogy egy vicc meg fog mosolyogtatni valakit, nagyon nem azonos a mosoly megjelenítésének képességével.

Ha Sora jelenteket vetít a jövőbe, valamit értenie kell a világból. Még nem sokat, de az első lépések nagyon ígéretesek.

komment

MI és wifi egymásra találása a Qualcomm legújabb chipjében

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 13. - ferenck

A wifi spektrum mindig prémiumnak számított, az iparág ezért gondolkozik folyamatosan, hogy miként hozza ki a legtöbbet a rendelkezésre álló spektrumból. A félvezetőket, processzorokat és telekommunikációs eszközöket fejlesztő, gyártó amerikai multinacionális Qualcomm FastConnect 7900 chipje a legújabb példa rá.

A cég MI-vel megtámogatott Wi-Fi 7-ként beszél róla, a mesterséges intelligenciát pedig komoly lehetőségnek látja megbízhatóbb vezetéknélküli kapcsolatok kialakításához. A chip jobban is integrálja fogyasztói alkalmazásokhoz a különféle technológiákat: wifit, bluetooth-t és ultra-szélessávot, ráadásul ugyanahhoz az eszközhöz ugyanabban a spektrumban két kapcsolatot is támogat.

A vezetéknélküli szabvány legújabb generációjával, a Wi-Fi 7-tel a megbízhatóság ismét az iparág fejlesztési fókuszába került. A hangsúly emellett az átviteli sebesség javításán és a késleltetés csökkentésén van, amelyekhez minden egyes wifi-generáció hozzájárul.

A Qualcomm szerint a wifi egy kicsit olyan, mint a Vadnyugat: léteznek mindenféle eszközök, be- és kikapcsolnak, hozzáférési pontok, amelyek ezt meg ezt teszik, más hozzáférési pontok, azok meg azt és azt csinálják, és mindezeket együtt figyelembe véve, nagyon nehéz garantálni a szolgáltatást.

Az MI tökéletes technológia lehet ennek az állapotnak a megváltoztatására.

A FastConnect 7900 kulcsa, hogy képes megállapítani, milyen alkalmazást használ az eszköz. Videó streamelése nagyobb átviteli sebességet igényelhet, míg hangchat-nél az alacsonyabb késleltetést kell előnyben részesíteni, és így tovább. Miután a chip definiálta, milyen alkalmazások vannak használatban, eseti alapon optimalizálhatja a teljesítményt és a késleltetést.

Az MI használata vezetéknélküli spektrumkapcsolatok kezelésére se nem új probléma, se nem új megoldás. A Qualcomm-chip előnye, hogy mindent az eszközön futtat (wifi, bluetooth és ultraszélessáv mind egyben), döntéseket pedig mikromásodperc-szinten kell hozni. Mire a chip megkapná valahonnan az információt, az információ elavulna.

Ráadásul nem fogyaszt pluszáramot, hanem áramot takarít meg. Nyilván egyszerű MI-modell, nem ötmilliárd paraméteres mesterséges intelligencia, hanem sokkal kisebb, teljesítményének kulcsindikátora pedig a sebesség és a pontosság.

komment

wifi chip mesterséges intelligencia

Új cyberbiztonsági keretek az USA-ban

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 12. - ferenck

Az Egyesült Államok Nemzeti Szabványügyi és Technológiai Intézetének (NIST) új Cyberbiztonsági Kerete (CSF), a 2.0 változat szakterületi ismereteiktől függetlenül, mindenféle közönségnek, iparági szektornak és szervezettípusnak szólnak. A CSF 2.0 által lefedett terület a kritikus infrastruktúrától ágazattól függetlenül, bármilyen szervezetig terjed.

Tartalmaz egy, a cyberbiztonság jelentőségét hangsúlyozó, azt kitüntetett vállalati kockázatként kezelő irányítási komponenst is. A többéves vitákat, a közzétett vázlathoz fűzött nyilvános kommenteket figyelembe vevő, jelentősen frissített CSF 2.0 referenciaeszköz segítségével a felhasználók alapvető CSF-útmutatókban böngészhetnek, kereshetnek és használhatnak fel, exportálhatnak adatokat.

A nemzetközileg is széles körben használt CSF sok vállalat számára vált a cyberbiztonsági fenyegetéseket megelőző és kezelő, nélkülözhetetlen eszközzé. A ráépülő 2.0 azonban nemcsak egy dokumentum, hanem „személyre szabható”, egyedi célokra használható, a szervezet szükségleteinek változásaihoz, lehetőségeinek fejlődéséhez alakítható forráscsomag – hangsúlyozza az NIST.

A Nemzeti Cyberbiztonsági Stratégia implementálását támogató új változat szervezeti stratégiák, információalapú döntések meghozatalában segít. Vállalati vezetőknek a pénzügyek és a cég jó hírneve mellett immár a cyberbiztonságot is kritikus kockázati tényezőként kell kezelniük, és a CSF 2.0 komoly támaszt nyújt ebben.

Mivel az NIST döntéshozókkal együtt dolgozott és a legfrissebb kihívásokat, azokat kezelő gyakorlatokat is megvitattak, a frissítéssel a keret amerikai és az USA-n kívüli felhasználók sokkal szélesebb köre számára releváns.

Az első CSF-et egy 2014-es elnöki rendelet után adták ki. Szervezeteket volt hivatott cyberbiztonsági kockázatok megértésében, csökkentésében és kommunikálásában segíteni. A mostani keret magja hat kulcsfunkcióra épül: identitás, védelem, detektálás, reagálás, helyreállítás és irányítás. Az utóbbi a teljesen új komponens. A funkciók együtt átfogó képet adnak a cyberbiztonsági kockázatok kezelésének életciklusáról.

A 2.0 kereshető katalógust és informatív hivatkozásokat szintén tartalmaz, mellettük szervezetek a Cyberbiztonsági és Privacy Referenciaeszközt (CPRT) is igénybe vehetik.

Az NIST tovább bővíti a forrásokat, és igyekszik a Keretet még átfogóbbá, használhatóbbá tenni.

komment

biztonság szabályozás hacker információbiztonság

Egyre népszerűbb a Google Go programnyelve

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 11. - ferenck

A Go vagy golang, a Google programnyelve még soha nem volt olyan előkelő helyen a Tiobe számítógépes nyelvek népszerűségi indexén, Top 10-jén, mint most. Több éve jön felfelé, jelenleg a nyolcadik a Docker és a Kubernetes fejlesztéséhez használt nyelv. (A Docker operációs rendszer-szintű vizualizációt végző, a Kubernetes nyílt forrású alkalmazáskezelő, azokat automatizáló program.)

Tavaly a tizedik volt a 2009 novemberében bemutatott Go. A rangsor az adott hónapra vonatkozik, de teljes évre is vannak statisztikák. A Google nyelve esetében a korai népszerűség rövidéletűnek bizonyult, 2015-ben volt amikor már csak a 122. helyen szerepelt, és úgy tűnt: befellegzett neki.

2016-ban félévenkénti frissítési, ráncfelvarrási, újrakiadási ciklusra állt a Go, azaz a Google, és minden egyes újítással javult is. A Docker és a Kubernetes párhuzamosan és jelentősen fejlődött.

A Go-t ma sok szoftveres területen, például backend (szerveroldali, weboldalak hátsó részének) programozáshoz, webszolgáltatásokhoz, mint az API-k (alkalmazásprogramozói interfészek) használják.

A Tiobe vezérigazgatója, Paul Jansen szerint a Go sokáig az első tízben fog maradni. Legutóbbi verzióját, a Go 1.22-t február hetedikén adták ki.

A nyelvek értékelése több kritérium, az azt használó képzett mérnökök, tanfolyamok, „külsős” értékesítők száma alapján történik. A pontos kimutatáshoz Google-, Bing-, Wikipédia-keresések és más hasonló honlapok adatait használják fel.

A februárban megjelent indexen a Google C++ utódjának tartott Carbon nyelve először került be az első százba. A sorrend a következő: Python, C, C++, Java, C#, JavaScript, SQL, Go, Visual Basic, PHP.

A vetélytárs Pypl Programnyelvek Népszerűségi Indexén a Go nincs az első tízben. A rangsort a kapcsolódó oktatóanyag (tutorial) Google-kereséseinek száma alapján állapítják meg. Náluk a következő sorrend alakult ki: Python, Java, JavaScript, C/C++, C#, R, PHP, TypeScript, Swift, Objective-C.

komment

programozási nyelv Google

Fejlesztik és eddig kifejezetten ígéretes az Amazon nagy szöveget beszéddé alakító nyelvmodellje

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 08. - ferenck

Az Amazon kutatói új nagy nyelvmodellen (LLM) dolgoznak, szöveget alakít beszéddé (text-to-speech). BASE TTS 980 paraméteres, változatos méretű modelleket treníroztak hozzá, az MI változatai százezer órát töltöttek el nyilvános beszédadatokkal.

Figyelték, hogy bizonyos szintet átlépve, ugyanazok a teljesítménybeli ugrások jellemzik-e, mint a természetesnyelv-feldolgozó MI-ket, és rájöttek, hogy a tízezer órányi audióanyagon gyakoroltatott, közepes méretű 400 millió paraméteres modell sokoldalúságban és robusztusságban is jelentősen javult trükkös tesztmondatoknál.

A tesztmondatok komplex lexikai, szintaktikai és paralingvisztikai elemeket tartalmaztak: összetett főneveket, érzelmeket, idegen szavakat, és a szöveg-beszéd rendszereket általában megzavaró ékezeteket. Bár a modell nem kezelte őket tökéletesen, hasonló MI-rendszerekkel összehasonlítva, kevesebbet hibázott hangsúlyban, kiejtésben, intonációban.

A mondatokat eleve úgy tervezték, hogy komoly buktatók, kihívások legyenek bennük elrejtve, és egyikük sem volt olyan, mint a gyakoroltatáshoz használtak. Az eredmény azt jelenti, hogy az MI emergens (a semmiből, váratlanul előbukkanó) készségekre tehetett valamikor szert.

A legnagyobb, 980 paraméteres változatot százezer órányi hanganyagon gyakoroltatták, és a 400 millió paraméteressel összevetve, hiába jóval nagyobb, semmiféle plusz adottságot nem figyeltek meg rajta.

A projekt ugyan kísérleti, de BASE TTS jól szemlélteti, hogy ezek a modellek, méretezés hatásaként, új sokoldalúsági küszöbértéket érhetnek el – intelligensebbek lesznek –, ami nagyon bíztató jel a beszélgető MI-fejlesztéseknek.

A kutatók folytatják munkájukat, hogy rájöjjenek: mi az optimális modellméret emergens képességekhez?

A modellt úgy tervezték, hogy könnyű és streamelhető legyen, az érzelmi és a prozódiai adatokat külön-külön, egymástól gondosan szétválasztva csomagolták belé. Így vált lehetővé a természetes nyelvinek tűnő beszélt audióanyag alacsony sávszélességű kapcsolatokon keresztüli továbbítása.

komment

mesterséges intelligencia Amazon chatbot nyelvtechnológiák beszédtechnológiák

Konvergál a mesterséges intelligencia és a blokklánc

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 07. - ferenck

A Deutsche Telekom bejelentette együttműködését az Egyesült Királyság-székhelyű Fetch.ai-jal. Az együttműködés célja a legfejlettebb mesterségesintelligencia- és blokklánc-megoldások promótálása. A Fetch.ai Alapítvány első nagyvállalati partnere a német gigacég.

A Bosch szintén benne van az együttműködésben, amelynek keretében nyílt MI- és blokklánc-platformot akarnak szélesebb körű felhasználásra kidolgozni. A telekomóriás leányvállalata, a Deutsche Telekom MMS hitelesítőként szintén szerephez jut. A decentralizált Fetch.ai hálózaton fog a blokkláncos tranzakciók biztonságában segédkezni.

A Fetch.ai technológiája erőforráskezelésre, tranzakciók kivitelezésére, adatfolyamok elemzésére MI-algoritmusai jóvoltából alkalmas autonóm szoftverágenseken alapul. Az ágensek számtalan valós alkalmazáshoz férnek hozzá olyan területeken – és területeken átívelve –, mint például a gépjármű-ipar, az ellátási lánc, az egészségügy és a digitális identitás.

Az ellátási lánc adatai alapján gyártási ütemterveket optimalizálnak, egészségügyi bejegyzéseket felhasználva, pácienseket kapcsolnak össze klinikai tesztekkel. A blokklánc külső manipulációval szembeni biztonsága jelentősen hozzájárul az adatok problémamentes továbbításához és az érzékeny adatokhoz való jogos hozzáféréshez.

A Deutsche Telekom vezetősége szerint a blokklánc, az MI és az IoT (Internet-of-Things, dolgok internete) konvergenciája komplett iparágak átalakulását hozza el, az átalakulás előhírnöke. Autonóm ágensek automatizálják az ipari szolgáltatásokat, és a blokkláncnak köszönhetően biztonságosan egyszerűsítenek le folyamatokat.

Az együttműködés bemutatja, hogy a blokklánc megbízható és transzparens adatokkal hogyan szabadíthatja fel az MI-ben lévő potenciált, míg az MI a blokkláncos tranzakciók biztonságos elemzésében segít. A technológiák együtt jelenthetik a felhasználók magánszférájának védelmére és a tartalmak felhasználói kontrolljára összpontosító, decentralizált Web3 internet alapjait.

komment

jövő internet mesterséges intelligencia dolgok internete blockchain

Kínai légitársaság járatain használtak először az utasok kiterjesztettvalóság-szemüveget

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 06. - ferenck

Hosszú repülőutakon általában elegünk van az előző ülés hátuljára helyezett apró képernyőkből. A probléma megoldódhat, mert a kínai Hainan Airlines és a Rokid Entertainment Kits összeállt, és parányi, csillogó-csíkos LCD helyett az utasok kiterjesztett valóság (Augmented Reality, AR) szemüveget használtak a február hetedikei HU7874 járaton.

A futurisztikus okosszemüveg jóvoltából óriási virtuális képernyőt élvezhettek filmeket, zenéket, sportadásokat stb. A technológiában persze nincs semmi új, viszont repülőgép utasai most használták először. A partnerség megváltoztathatja, 3D-re módosíthatja a repülés közbeni filmeket, játékokat, médiafogyasztást.

Többszáz kisméretű, beépített képernyő és szórakoztatórendszer frissítése, feljavígtása nagyon sok pénzbe és időbe kerülne, a Rokid viszont azonnali frissítést és jóval nagyobb tartalomkínálatot ajánl.

Az AR-csomaghoz a cég okosszemüvege és az előre sok 3D filmmel, játékkal stb. telepített Rokid Station tartozik. A filmek és más tartalmak internetkapcsolat nélkül nézhetők meg, használhatók. A Rokid Max (az AR-szemüveg) és a Rokid Station együtt a jövő tartalomfogyasztásának egyik nagy ígérete.

A Rokid Station változatos streaming-szolgáltatásokhoz kapcsolható Android televíziós eszköz. Videók játszhatók le, játékok és appok futtathatók rajta. Akkumulátora órákig képes működtetni az okosszemüveget.

Azzal, hogy a Hainan Airlines mindkét eszközzel ellátta az összes utast, magán filmélményt biztosított nekik, a Sencsen és Hszian közötti két és fél órás út is kellemesebben telt el, mintha a pici képernyőre vagy semmire sem meredtek volna.

Mivel a Rokid Mix dioptria-beállítást is tartalmaz, használata szemüveges személyek számára sem probléma. Kérdés, hogy a világ más légitársaságai mikor kezdik utasaikat szintén – zajcsökkentő, hatékonyságnövelő – AR-/VR-technológiákkal szórakoztatni.

komment

közlekedés kiterjesztett valóság Kína

Google: vigyázzunk a személyes adatainkra, ha a Geminit használjuk

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 05. - ferenck

A mesterséges intelligencia okostelefonos térhódítása már a ChatGPT színrelépése előtt megkezdődött, a generatív MI diadalútja viszont látványosan felgyorsította folyamatot. Már 2022 végén, 2023 elején egyértelmű volt, hogy a chatbotok és társaik okostelefonos integrációja visszafordíthatatlan. De miért is akarnánk visszafordítani?

Az idei androidos és iPhone-frissítéseket nem meglepő módon az MI fogja uralni. A legtöbb a Google-tól jön majd, viszont nem árt, ha odafigyelünk rájuk, mert nagyon megváltoztathatják készülékhasználatunkat.

A cég nemrég nevezte át ChatGPT-szerű chatbotját, a Bardot, és az új brand mellé emlékeztetőt is fűzött. Az emlékeztetés inkább figyelmeztetés, hogy a mamutvállalat milyen adatokat gyűjt miközben a mesterségesintelligencia-alkalmazását használjuk.

Bard most már Geminiként fut, és a magánadatok, a privacy védelmében a Google kimondta, hogy az MI-vel folytatott interakció során a következőket gyűjti össze: infókat tartózkodási helyünkről, felhasználási adatokat, és mindenféle visszajelzést tőlünk.

Humán kiértékelők elolvashatják ezeket, megjegyzéseket fűzhetnek hozzájuk, feldolgozhatják beszélgetéseinket. A nagyvállalat az anonimitást megőrizve, igyekszik megvédeni a privacy-t, azaz a beszélgetéseket szétválasztja a Google-fiókoktól még mielőtt a kiértékelő személyek hozzájuk férnének.

Az emlékeztető óva int bizalmas információ, bármely olyan adat megosztásától, amelyet nem szeretnénk, ha a kiértékelők olvasnának, vagy a Google később felhasználna. Az elemzésekkel termékeik, szolgáltatásaik, gépitanulás-technológiáik minőségén kívánnak folyamatosan javítani – hangsúlyozzák.

A Google figyelmeztetése azért (is) fontos, mert szinte vakon megbízunk a generatív MI chatbotokban. Ez azért érdekes, mert általában odafigyelünk, óvatosak vagyunk appok telepítésével, engedélyek megadásával, a böngésző kiválasztásával, a Facebookon, a Google-on és más platformokon megosztott adatainkkal, MI-chatbotokkal szemben azonban megfeledkezünk az egészséges óvatosságról. Úgy érezzük, mintha privát beszélgetést folytatnánk egy segítőkész új baráttal, és hirtelen mindent meg akarunk osztani vele.

A Google erre figyelmeztet, és emlékeztet: (egyelőre) nem új baráttal, hanem jelenleg még személytelen mesterséges intelligenciával kommunikálunk.

komment

privacy okostelefon mesterséges intelligencia Google chatbot

Mesterséges intelligencia és autonóm rendszerek a hadviselésben

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. március 04. - ferenck

Az Egyesült Királyság hadserege és a Védelemtudomány és Technológia Laboratórium (Dstl) nemrég Ausztrália és az Egyesült Államok fegyveres erőivel működött együtt. Az AUKUS partnerség keretében, mérföldkőnek számít, hogy a mesterséges intelligenciára és autonóm fegyverekre összpontosító tesztgyakorlatot végeztek.

A Robotikus Járművek Megbízható Művelete Vitatott Környezetekben (TORVICE) tesztgyakorlatra tavaly került sor. Elektronikus támadások, GPS-szakadás és más fenyegetések közben vizsgáltak robotikus járműveket és szenzorokat, hogy megállapítsák a jövő hadviselésében fontos szerepet játszó autonóm rendszerek ellenálló képességét.

A technológiák széleskörű katonai elterjedése előtt kritikus fontosságú megérteni, miként valósítható meg MI-rendszerek megbízható működése az elektronikus hadviselésben, cyberfenyegetések közben.

Amerikai és brit autonóm járművek felderítő küldetést végeztek, az ausztrálok rendszereiket zavaró harctéri elektronikus támadásokat szimuláltak. A teljesítményadatok segítenek megerősíteni a védelmet, a rendszerhibák és leállások elleni óvintézkedések meghatározását, illetve kideríteni, mennyire robusztusak ezek a rendszerek támadáskor.

A három seregben bevezetésre kerülő robotikus és automatikus technológiák átalakítják a hadviselést. A mostani munka a tavaly áprilisi első AUKUS autonómrendszerek-teszten alapul. A védelmi miniszterek decemberi találkozóján bejelentették, hogy a Rugalmas és Autonóm Mesterségesintelligencia-Technológiákat (RAAIT) idén integrálják a hadseregekbe.

Katonai vezetők szerint az MI és az autonómia ígéretét sikeresen megvalósítva, ezek a rendszerek abszolút megváltoztatják a területet, csökkentik a katonákra leselkedő veszélyeket, kockázatokat. Kulcsfeladatok (szenzorok működtetése, logisztika stb.) nagy térségben kivitelezhetők velük, parancsnokok is több opció közül válogathatnak.

Az együttműködéssel a területi fejlesztéseket kívánják felgyorsítani, a haderők közötti interoperabilitást növelni, maximalizálni szakértelmüket, fokozni az elrettentést.

komment

mesterséges intelligencia autonómia katonai

Szerelmespárt hozott össze a mesterséges intelligencia

Facebook Tumblr Tweet Pinterest Tetszik

0

2024. február 29. - ferenck

A nyelvi korlátokon átívelő szerelem hol sikeres, hol nem. Egy, mesterséges intelligencián keresztül kommunikáló amerikai-mexikói pár esetében viszont úgy tűnik, hibátlanul működik.

Közös barát közvetítésével, vakrandin ismerkedtek meg egymással. Az amerikai-mexikói határ két oldalán laknak, és négy hónapig a legváltozatosabb MI-eszközöket használták, hogy feloldják az angol és a spanyol közötti különbségeket.

Az első személyes találkozóra Mexicaliban került sor, Brenda Ochoa ott dolgozik. Ő és partnere, a 45 éves arizonai LeRoy Romero fordítóalkalmazásokat, például a Google Translate-et használták. Megosztoztak egy margarita pizzán, de a nyelvi különbségek miatt nem csevegtek, csacsogtak, nem fárasztották egymást felesleges információkkal, mint ahogy első randikon szoktak. Mégis tetszett mindkettőnek.

Következő appként, a Captions-t használták. Az alkalmazás munkában és magánéletben egyaránt jól működik. Videókat alkottak, szerkesztettek, természetesen feliratoztak, szabtak személyre vele. Szintén segített, hogy az app a szájmozgásokat is jól szinkronizálja, működik a fordítás.

A Captions masszív fordító MI-je egyedi alkalmazásként is elérhető, Lipdub a neve. A felhasználó természetes hangját utánozza, követi szájmozgását, miközben végzi a fordítást. Hasonló technológiák más kontextusban akár riasztók is lehetnek, Ochoa és Romero kapcsolatában viszont tényleg csodát tettek.

Mindössze négyóra autózásra laknak egymástól, havi egy alkalommal találkoznak személyesen Mexicaliban, ha pedig nincsenek együtt, különböző MI-fordítóalkalmazásokat használva beszélgetnek. Romero otthonosan mozog a technológia világában, kétirányú szinkronfordító fülhallgatója is van, amivel könnyebb a valósidejű beszédértés.

Másokkal nem használják ezeket a technológiákat, emellett Ochoa angolul, Romero pedig spanyolul tanul. El is jegyezték egymást, nyárra tervezik az esküvőt. Azt még nem tudják, hol fognak élni.

komment

for mesterséges intelligencia app nyelvtechnológiák

Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Valódi videókat generál a mesterséges intelligencia?

MI és wifi egymásra találása a Qualcomm legújabb chipjében

Új cyberbiztonsági keretek az USA-ban

Egyre népszerűbb a Google Go programnyelve

Fejlesztik és eddig kifejezetten ígéretes az Amazon nagy szöveget beszéddé alakító nyelvmodellje

Konvergál a mesterséges intelligencia és a blokklánc

Kínai légitársaság járatain használtak először az utasok kiterjesztettvalóság-szemüveget

Google: vigyázzunk a személyes adatainkra, ha a Geminit használjuk

Mesterséges intelligencia és autonóm rendszerek a hadviselésben

Szerelmespárt hozott össze a mesterséges intelligencia