Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


A ChatGPT most már lát, hall és beszél is

2023. október 10. - ferenck

Az OpenAI, egy weboldal szalvétára felskiccelt koncepcióját kóddá fordító anyaggal szemléltetve, márciusban vezette be a GPT-4-t, nagy nyelvmodellhez (large language model, LLM) viszont a Google használt először vizuális inputot úgy, hogy az output is kép legyen (image-to-image). Egy májusi…

Tovább

Vírusként terjednek a hangklónok

Mainstreammé vált az ingyenes mesterségesintelligencia-szolgáltatásokat nyújtó online platformokkal könnyebbé tett hangklónozás. Szövegek és képek után most már ezek az új hangok is elég meggyőzőek és hozzáférhetőek annyira, hogy mindenféle tartalomgeneráló hatékony eszközként használja őket. Az…

Tovább

Mesterséges hang a molesztálók ellen

A Massachusetts állambeli Modulate startup személyek hangját álcázó, inkognitóba rejtő megoldást kínál. Az ezúttal jó célokat szolgáló deepfake-technológia elsősorban a hangjukkal negatív előítéleteket kiváltó és verbális online visszaélésnek kitett transzneműeknek, de az online szexuális…

Tovább

Hang alapján kitalálja az MI, hogyan nézünk ki

Mennyire vagyunk képesek beszéde alapján következtetni egy személy kinézetére? A beszédgenerálás módjának közvetlen következménye, hogy a kettő, a beszéd és az arc között erős kapcsolat áll fenn. Hallgatás közben mentális modellt építünk az illetőről – kora, neme,…

Tovább

Megvédi magát az MI a beszédbe rejtett rosszindulatú üzenetektől

Több kutatócsoport próbálkozik a gépi beszédfelismerés és szövegértés biztonságosabbá tételével, hogy mesterséges intelligenciákat ne tévesszenek meg például az emberi fül számára jóindulatú, de rejtett, például egy eszköz virtuális asszisztensen keresztüli…

Tovább

Fülbe helyezhető kütyük figyelik az agytevékenységünket

Poppy Crum, a Stanford Egyetem idegtudósa és a Dolby Labor egyik vezető kutatója szerint fülünk egy USB port biológia megfelelője – egyrészt agyunkra „írja”, azaz továbbítja a fejhallgatón szóló zene hangjait, másrészt „olvas” is az agyból. Idővel fülünkbe helyezett,…

Tovább

Beszéddé kódolhatók az agyi jelek?

Beszéd közben agyunk jeleket küld szájunkra, nyelvünkre, gégénkre és állkapcsunkra, együttes tevékenységük eredménye az óhajtott hang. A San Franciscói Kaliforniai Egyetem (UCSF) kutatói öt agyműtéten átesett epilepsziás személy jelzéseit rögzítették, miközben 100…

Tovább

A telefonáló robot elhiteti velünk, hogy a testvérünk

A mai telefonhívások kb. harmada robothívás. Automatizált szerkezetek kezdeményezik, amelyeket úgy programoztak, hogy válasz esetén előzetesen felvett szöveget mondjanak el. Szakértők szerint az idegesítő hívások újabb fejlődési szinthez közelítenek. A következő lépés,…

Tovább

Korábban soha nem hallott hangokat ismer fel a Google új MI-je

Ha valaha részt vettünk konferenciahíváson, nagyon jól tudjuk, mennyire fontos, hogy hang alapján felismerjünk személyeket. Ha nem menne, akkor még azzal sem lennénk tisztában, hogy kinek válaszoljuk meg a kérdést, kinek számoljunk be legújabb munkánkról. Egy mesterséges…

Tovább
süti beállítások módosítása