Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Milyen gyógyszerek segítenek a depresszió kezelésében?

2022. február 01. - ferenck

Sokmillióan szenvednek a depressziótól, és több gyógyszert próbálnak ki, míg meg nem találják a valóban hatásost. Orvosaikkal közösen gyakran hónapokon keresztül kísérleteznek. A gépi tanulás és az általa készített pontos előrejelzések segíthetnek rajtuk, és így jóval kevesebbet kell majd találgatniuk.

Ez azért lehetséges mert a Texasi Egyetem Délnyugati Orvosi Központjának kutatása alapján a depresszióra specializált mesterséges intelligencia képes előrejelezni, hogy a páciensek hogyan reagálnak két antidepresszánsra.

depresszio_1.jpg

Az érintettek agyának szkennelését követően az agytevékenységben változatos mintázatok mutathatók ki. A különféle gyógyszerekre adott reakciókban szintén tapasztaltak eltéréseket. Az agyról készült szkennelés és az eredményes kezelésről szóló ismertetők alapján, a texasi kutatók által fejlesztett ideghálók megtanulják, hogyan párosítsanak betegeket szimptómáikat valószínűleg megszüntető gyógyszerekhez.

Több ideghálót tanítottak be a két gyógyszer és placebo hatására bekövetkező depressziószint-változások előrejelzésére. Az adatokat két klinikai tesztből szedték össze: az első 222 súlyos rendellenességekkel küzdő személyről szólt. Felük rendes gyógyszert (Zoloftot), másik felük placebot kapott. A második teszt 37 résztvevőjének szervezete nem reagált a Zoloftra, ezért esetükben más gyógyszerrel (Welbutrinnal) próbálkoztak.

depresszio0_1.jpg

Az adatsor 95 klinikai és demográfiai tulajdonságot tartalmazott: például az öngyilkosság kockázatát, a nyugtalanság mértékét, a bőrszínt, az életkort, valamint minden egyes beteg saját maga által megállapított depressziószintjét a nyolchetes kezelés elején, illetve végén.

A kezelés előtti fMRI szkennelés közben a páciensek számkitaláló játékban vettek részt. Ez a játék depresszió miatt módosult agyfunkciókat indít be. A kutatók speciális módszerrel életnagyságúra, azaz realisztikusra nagyították a szkeneket. A valódikat és a szintetikusakat kétszáz területre osztották, az agytevékenységet pedig ez alapján számszerűsítették, szkenenként hatszáz jeggyel.

Az első modell 48, a második 34 százalékot ért el, míg a mélytanulás (deep learning) nélküli technikákkal általában csak tizenöt százalék körüli eredményt szoktak elérni.

Mielőtt azonban a módszer klinikai gyakorlattá válna, a modelleknek jóval több antidepresszánst kell ismerniük. A kutatók most ebben az irányban folytatják munkájukat.

Chatbot hosszútávra?

A legkorszerűbb internetes beszélgető robotokat, azaz chatbotokat általában rövid párbeszédeken gyakoroltatják. Ezzel magyarázható, hogy hosszabb csevegések során gyakran mondanak a témával köszönőviszonyban sem lévő blődségeket.

A legelterjedtebb (transformer) architektúrán alapulók a csevegés maximum 1024 jellemzőjét (karakterek, szavak, szórészletek stb.) elemezve társalognak, dolgoznak ki válaszokat.

A Facebook korábban egy ideig architektúrát használt a legrelevánsabb korábbi állítások meghatározására. Csakhogy egy hosszú beszélgetésben a releváns állítások 1024-nél jóval több jellemzővel rendelkezhetnek.

chatbot_2.jpg

A beszélgető robotok teljesítményének javításáért, három kutató (Jing Xu, Arthur Szlam, Jason Weston) újfajta gyakorlást talált ki: a botnak a szövegkörnyezetet kell követnie. Menet közben készít a későbbiekben hasznos fogódzókként funkcionáló összefoglalókat, azok alapján generál válaszokat.

Az új chatbot már fent van a Facebookon.

Az információk összegzésével a modell több szövegkörnyezetet ismer meg, mint a legismertebb és legnyitottabb chatbotok (BlenderBot, Meena, és főként BART).

A kutatók ötezernél több beszélgetésből álló adatsoron gyakoroltatták a három transformerből álló rendszert: az egyik összefoglalt, a másik kiválasztotta az öt legrelevánsabb összefoglalót, a harmadik választ generált.

A felhasznált anyagban önkéntespárok beszélgettek. Minden egyes beszélgetés három-négy szakaszból állt, szakaszonként maximum tizennégy üzenettel, és akár egy hét is eltelhetett köztük.

A szakaszokat követően az önkéntesek később referenciaként szolgáló összegzéseket készítettek, és még a fordulatokat is összegezték vagy felcímkézték (hogy ezúttal nincs szükség összefoglalóra).

A modell jobban és pontosabban működött, mint a vele összehasonlított csúcskategóriás chatbotok, és talán képes lesz több témáról, a témák közötti váltások/ugrások ellenére is értelmesen beszélgetni.

Ki engedheti meg magának egy mesterséges intelligencia taníttatását?

Egy 2020-as tanulmányból kiderül, hogy egy 1,5 milliárd paraméteres MI-modell (mint az OpenAI GPT-2-je volt) Wikipédián és a Book corporán történő gyakoroltatása 1,6 millió dollár. Felmérték a Google 11 milliárd paraméteres Text-to-Text Transformerét (T5) is, és kiderült, hogy tízmillióba került a taníttatása.

A Google közben már egytrillió paraméteres modellt (Switch Transformer) gyakoroltat, a költségekről azonban (egyelőre) nem közöltek adatot.

training_ai0.jpg

Mivel a mesterséges intelligencia jelentősége a modellek tanulási költségével párhuzamosan nő, kisebb cégeknek egyre kevesebb az esélye a hatalmas versengésben. Ez nemcsak a gazdasági lehetőségeknek és a piacnak rossz, hanem az innovációt is lassítja.

Egyes vállalatok ezért teljesen logikusan, olcsóbban, kevesebb számítással szeretnék elérni ugyanazt vagy a még jobb teljesítményt.

trainig_ai.jpg

A munkahelyi chathez keresőeszközöket és más appokat fejlesztő Gleannek egyszerűen nincs elegendő pénze a termékei minőségét javító nagy nyelvi modellek trenírozására. Helyette kisebbekkel próbálkozik.

Az egészségügyi szolgáltató Optum kb. ötvenezer dollárt költ modellek számítási felhőben történő taníttatására. Speciális hardverekkel igyekszik felgyorsítani a folyamatot.

A gépilátás-platformot kínáló Matroid saját GPU-ját használja. Legnagyobb modelljeit is százezer dollár alatt képes begyakoroltatni.

A Mosaic ML startup a gyakorlás hatékonyságát növelő technikákon dolgozik. „Lottójegy” elméletük alapján egy ideghálónak csak kis része végzi el az összes és különösen a fontos munkát.

Nagyon nagy modellek gyakran azokban a feladatokban jók, amikor rengeteg és bonyolult az adat, és a piac csak egy győztest fogad el. Egyes alkalmazásokban, például macskák fényképeken történő felismerésekor a nagyobb modellekkel viszont vagy túl sok idő megy el, és így túl költségesek a feladathoz, vagy megkérdőjelezhető eredményeket érnek el. Ha a jövőben is így marad, még a gazdag piacvezető cégek sem őrizhetik meg sokáig a jelenlegi versenyelőnyüket.

Hogyan válhat globálissá Oroszország Ukrajna elleni cyberháborúja?

Moszkva több mint százezer katonát küldött az ukrán határ közelébe, és egyelőre egyetlen lövés nem dördült el, a cyberháborús műveletek viszont már megkezdődtek.

Hackerek több ukrán kormányzati oldal működését veszélyeztető támadást indítottak, amely ugyan látványos volt, felhívta magára a világ figyelmét, ám közben kevésbé látványosan, de hatékonyabban, pusztító malware-eket (WhisperGate) telepítettek ukrán kormányügynökségek honlapjaira. Nem tudni, ki a felelős, de Moszkva az elsőszámú gyanúsított.

russiancyberwar.jpg

Ukrajna a célpont, de szakértők figyelmeztetnek: a hackertámadások az egész világot érinthetik, az Európai Uniót, az Egyesült Államokat és másokat is fenyegethetnek. Egy cyberháború nem ismer határokat, gyorsan elszabadulhat, kirobbantói is elveszítik a kontrollt felette.

Az amerikaiak meg vannak győződve, hogy hamarosan elkezdődik az invázió, és a kritikus infrastruktúra működtetőinek gyors megelőző, védekező lépéseket javasolnak. Két 2017-es támadásra, a NotPetyára és a WannaCry-ra emlékeztetnek, mindkettő túlnőtte magát az eredeti célpontokon, gyorsan terjedt az interneten, tízmilliárd dolláros kárt okozva. A párhuzam egyértelmű: szintén feszültségekkel teli időben, NotPetyával az oroszok Ukrajnát célozták meg.

russiancyberwar0.jpg

Agresszív cybertámadásokat gyakran használnak tényleges fegyveres konfliktusok előtt, és ha az USA és szövetségesei még egyértelműbben kiállnak Ukrajna mellett, az eddigieknél is agresszívebb attakokra számíthatunk az orosz féltől. Ez elég valószínű, Joe Biden be is jelentette, hogy az USA válaszolhat az Ukrajna elleni online műveletekre.

Az elmúlt évtizedben Moszkva többször (2014, 2015, 2016 stb.) indított cybertámadást az ukránok ellen. Megtámadták az elektromos műveket, 2015-ben Kijev elsötétedett – ilyesmit senki sem tett még előttük. A magát zsarolóvírusnak álcázó NotPetya az eddigi csúcs, és rossz hír, hogy WhisperGate hasonló: ugyan zsarolóvírusnak adja ki magát, ám kulcsfontosságú, gépek működését leállító adatokat semmisít meg. Szerencsére nem annyira szofisztikált, és nem terjed olyan gyorsan, mint az elődje.

Moszkva természetesen minden tagad. Az amerikaiak nem bíznak bennük, és mások sem. Nem véletlenül, mert az orosz fél több választásba igyekezett beavatkozni, dezinformációs műveletekkel próbálja rongálni a nyugati szövetségesek közötti összetartást.

Az amerikaiak most nem attól tartanak, hogy közvetlenül támadnak ottani vagy EU-s célpontokra, hanem az Ukrajna elleni online agresszió elszabadulásától félnek.

Hogyan oldjuk meg homogén szoftverekkel egy heterogén világ problémáit?

A fizikai valóság egyedi részletekben gazdag, minden egyes helyszín, személy, tárgy más, mint a többi. Ezzel szemben, az absztrakciókra épülő szoftverek világát viszonylag egyforma programozói környezetek és felhasználó élmények jellemzik.

A mai mesterségesintelligencia-kutatás egyik abszolút szaktekintélye, Andrew Ng érdekes szemléletváltásra hívja fel a figyelmet: a gépi tanulás lehet a két világ közötti híd.

A szoftverek homogének. Amikor például egy keresőmotor- vagy okostelefon-fejlesztő frissíti a termékét, a felhasználók mindenhol ugyanazt kapják. Ez anyagilag még a tervezés és a gyártás magas fixköltségei ellenére is, az alacsony járulékos költségek miatt pedig különösen kifizetődő.

heterogenszoftver.jpg

A szoftverekkel ellentétben, a valóság heterogén – érvel Ng, majd példákat hoz fel: az egyik várost hegyek, a másikat síkság, a harmadikat tenger határolja. Az egyikben aszfaltutak, a másikban koszos földutak vannak. Az egyikben francia, a másikban japán a jelzőtáblák nyelve. Mivel nincsenek vagy nem is hozhatók létre platformok és szabványok, „egy méret nem felel meg mindenkinek”, sőt, gyakran csak nagyon keveseknek felel meg.

Többek között ezért nehéz önvezető autót tervezni. Ha minden város nagyjából ugyanazok a behatárolt specifikációk alapján épülne fel, könnyebb lenne, de nem ez a helyzet.

Az önvezető rendszereknek bármilyen szélességű utcát, konfigurációjú jelzőlámpákat és még egy csomó más változót kellene kezelniük, és ez még a legintelligensebb gépitanulás-rendszereknek is borzasztó nehéz feladat.

A szoftverfejlesztő cégek sikeresen elérték, hogy a felhasználók alkalmazkodjanak az „egy méret mindenkinek” jellegű termékekhez. Ng szerint pontosan a gépi tanulás segíthet a szoftvereknek, hogy képesek legyenek kezelni, interakciókat folytatni a sokszínű fizikai valósággal. Nem a városokat kell homogénné tenni, hanem a homogén világban történő navigálásban segítő tanulóalgoritmusokat kell fejleszteni.

Hosszú utat kell még bejárnunk – ismeri be Ng. Vállalata, a Landing AI ezen az úton jár, adatcentrikus mesterséges intelligenciájukkal a gépi tanulás különböző gyárak nagyon eltérő körülményei között is működik. Minden egyes gyárnak saját betanított modellel kell rendelkeznie, hogy az MI felismerje az ottani speciális körülményeket, és a gépi tanulás minden ilyen környezetben tényleg hasznos legyen.

„Használjuk arra, hogy a szoftvereket jobban adaptálja a valósághoz, s ne a valóságot korlátozzuk a szoftverhez való alkalmazkodásra” – összegez Ng.

Idegháló jelzi előre az új drogokat

A kanadai Brit Columbia Egyetem (UBC) kutatói egészen különleges – és ijesztő – mesterséges intelligenciát fejlesztettek. Az MI még a feltalálásukat megelőzően találja ki, hogy milyen designer drogok kerülnek az utcára. Tehát még nem is léteznek, de már tud róluk.

Munkájával elvileg a bűnüldözést segíti.

A szakemberek gépitanulás-algoritmust tápláltak egy „ismert pszichoaktív anyagokról” szóló adatbázisba. Rendeltetése, hogy az adatok alapján a vegyészek és a dealerek előtt kitalálja: mit fognak készíteni, majd mit fognak eladni. Mielőtt valósággá válna.

designer_drugs.jpg

A Steven Spielberg kultikus Különvéleményét idéző technológia fejlesztői egyértelművé tették: a rendőröket akarják segíteni a drogháborúban, és míg a film intő jel volt e megoldások veszélyeire, addig a kutatók semmiféle veszélyt nem látnak az ideghálójukban.

Spielberg 2002-es filmjében a high-tech megoldások az emberi elmében olvastak, így bűnözőket még a bűn elkövetése előtt tartoztathattak le. Az UBC ideghálójával hasonló „eredmények” érhetők el.

David Wishart az egyik fejlesztő elismeri a Különvélemény-párhuzamot, viszont arra hivatkozik, hogy a megfigyelő és más technikák hatására a filmbeli jövőben csökkent a bűnözés.

„Szoftverünk a bűnüldözőket és a közegészségügyi programokat segíti, hogy alapismereteik legyenek titkos vegyészekről, és hogy mi várható, minek kell utánanézniük” – magyarázza.

A gépi tanulásnak ez a típusa ugyan könnyen zsákutcának bizonyulhat, viszont egyes amerikai és európai rendőrségek – elsősorban a drogkereskedelem elleni harcban – használnak ha nem is ilyen, de hasonló technikákat.

Vegyük figyelembe, hogy a már Nixon által meghirdetett drogháború eddig totális kudarc, rengeteg mexikói, kolumbiai, amerikai stb. halottal. Az Egyesült Államokban soha nem fogyasztottak annyi drogot, Kolumbiában soha nem állítottak elő annyi kokaint, a mexikói kartellek soha nem tettek szert akkora bevételre, mint az elmúlt években. Ha ezekhez hozzáadjuk a még nemlétező drogok után kutató mesterséges intelligenciákat, nehezen képzelhető el, hogy az eredmények látványosan javulnának.      

Működésbe lépett Európa első ötezer qubites kvantumszámítógépe

Január tizenhetedikén, a németországi Jülichben, európai uniós és német hivatalos személyek jelenlétében beindították a világ egyik legegyedibb kvantumszámítógépét.

De mitől egyedi az új gép?

julich0.jpg

Attól, hogy a rendszert, technológiai lehetőségeinek növelése és ezáltal az élet változatos területeit érintő, hihetetlenül komplex problémák megoldása céljából, összekapcsolták egy szuperszámítógéppel.

A hivatalosan D-Wave Advantage annealer nevű gép a 2019-ben, német és más európai uniós kutatóknak kvantumkomputer-használatot biztosító Jülichi Egyesített Kvantumszámítási Infrastruktúra, a JUNIQ része.

julich.jpg

Mivel többdimenziós terek létrehozásával, sokféle adatpontban is képesek mintázatokat találni, a kvantumszámítógépek klasszikus komputerekkel megoldhatatlan problémákat is tudnak abszolválni. Építésük viszont hihetetlenül nehéz és komoly befektetést igényel. Ahhoz, hogy valóban hasznosak legyenek, nagynak kell lenniük, amelyhez évekre van szükség. Ezért is annyira lassú a technológia fejlődése.

Az új rendszer komoly lépés ebbe az irányba. Az ötezer kvantumbitnek köszönhetően, egymillió változó kezelésére alkalmas, és ez hihetetlenül magas szám.

Az eseményen részt vett Mariya Gabriel, az EU innovációért, kutatásért, oktatásért és az ifjúságért felelő biztosa, és elmondta, hogy „a kvantumszámítógépek nélkülözhetetlenek az Unió technológiai és gazdasági fejlődéséhez, az európai tudomány és ipar versenyképességéhez.”

Az esemény a kvantumalkalmazások gyakorlati fejlesztésének a kezdetét is jelenti. Tudósok a technológiával próbálnak majd megoldást találni változatos területek komplex problémáira. Az eredményekből Észak-Rakna-Vesztfália, Németország és az Unió ipari, közszolgálati és tudományos szektora egyaránt profitálhat.

Az új gép arra is ékes bizonyíték, hogy a kvantumszámítógépek nemcsak elméletekben és az akadémiai közegben létező valamik, hanem a való világban is alkalmazhatók, többek között olyan szerteágazó területeken, mint a közlekedés-optimalizálás, pénzügyi szolgáltatások, egészségügy, logisztika, gyártás és a beszállítói lánc hatékonyabbá tétele.

Mi lesz az arcfelismeréssel?

A Facebookot évek óta, több fronton támadják. Sokak szerint monopóliumra törekszik, szét kellene darabolni, visszaél a közvagyonnal, a közösségi oldalnak valójában közműként kellene működnie. Mások egyes technológiák miatt, megint mások pedig összesen mindezekért kárhoztatják Mark Zuckerberg vállalatát.

Az arcfelismerés hosszú ideje – nemcsak a Facebook ellen – az egyik legkeményebb támadási felület, alkalmazása ugyanis megkérdőjelezhető tevékenységeknek ad teret, és nem egyszer megsérti személyiségi jogainkat (privacy), lehetőséget ad illetékteleneknek arra, hogy beosonjanak az intim szféránkba.

fb.jpg

A cég sokáig ignorálta az arcfelismerés káros hatásairól szóló bizonyítékokat, de végül beadta a derekát, és leállította a technológia feltöltött videókon, fotókon és a múltbeli vizuális anyagokkal foglalkozó Memories platformon történő használatát. Állítólag az egymilliárdnál több egyedi arcfelismerő sablonnak szintén véget vet. Egyébként a technológia több Facebook-funkciót működtet, és a napi 1,8 milliárd felhasználó fele használja is.

A Facebook lépése nem egyedi, a nagyvállalat követte más óriások, mint például az Amazon, az IBM és a Microsoft hasonló intézkedéseit. A trend nem sok jóval kecsegtet a technológia tömegszintű marketinges felhasználásának jövőjét illetően.

fb0.jpg

Az arcfelismerő funkciók kikapcsolása egyébként nem feltétlenül jelenti azt, hogy a cég teljes egészében felhagy a technika alkalmazásával. A mesterséges intelligencia és a gépi tanulás fejlődése szempontjából nagyon fontos DeepFace-t például megtartja, sőt, természetesen továbbfejleszti. Az eszköz személyazonosság-hitelesítésnél, csalások megelőzésénél tesz komoly szolgálatokat, és ezért nagyon meggondolatlan, felelőtlen húzás lenne felhagyni vele.

Miközben a techóriásokat sok oldalról támadják, és megoldásaik mérsékeltebb használatát követelik, addig új szereplők, kisebb cégek próbálkoznak és nyomulnak az arcfelismerésben. Az így sokkal töredezettebbé váló piacon nehezebb követni a technológia használatát, a valós és a potenciális visszaéléseket.

A legcélszerűbb az átgondolt szabályozás, az összes érintett vállalat által elfogadott általános szabályok és szabványok betartása lenne.

Hogyan ismerjen fel térbeli koordinátákat egy robot?

Ha egy robot interakciókat akar folytatni a világgal, tudnia kell, hogy mit fogjon meg, milyen tárgyakat kerüljön el, milyen részeit mozgassa meg közben. Két Berkeley- és egy CMU (Carnegie Mellon Egyetem) kutató új módszert kínál arra, hogy gépek miként határozzák meg a számukra érdekes térbeli pontokat. Eddig is foglalkoztak a témakörrel, az újítással viszont jelentősen javítható ez az adottság.

A felügyelet nélküli Keypoint3D gyakorlás-módszerrel a modell képes térbeli koordináták, a környezet hasznos helyeivel megegyező kulcspontok, köztük saját teste egyes részeinek azonosítására.

A kutatók korábbi munkájukban virtuális közegben gyakoroltattak egy ágenst, hogy egyszerű kétdimenziós kameraképen alapuló kulcspontokat találjon meg, de amikor a kameraképen tárgyak egymásba mosódtak, vagy az egyik eltakarta a másikat, pocsékul teljesített.

terbeli_pontok.jpg

Hasonló megközelítéssel viszont kihasználható, ha több a kameranézet, hogy az objektumok lokalizálhatók legyenek a háromdimenziós térben. Az eredeti kameranézőpont kikövetkeztetett 3D-s kulcspontokkal történő újbóli előállítása sokat segíthet az ágensnek meghatározott objektumok pontos tér- és időbeli követésében.

A Keypoint3D-vel egy rendszer megtanulta az adott feladat elvégzéséhez szükséges harminckét kulcspont kiválasztását. Elhelyezkedésüket három kamera nézőpontja alapján kellett azonosítania.

Virtuális környezetben trenírozták és tesztelték. Az ágensnek egyszerű robotfeladatokat kellett abszolválnia: ajtót nyitni, becsukni egy dobozt stb.

Ezek mellett sálat kellett tennie egy modell nyaka köré, hogy megmutassa, mennyire tud kezelni rugalmas tárgyakat, illetve, testrészei mozgatásának képességeit bizonyítandó, négy lábon kellett mászkálnia.

Egy megerősítéses tanulás-modellt a kulcspont-detektáló modellel együtt gyakoroltatták, hogy ne legyen kétség a kulcspontok és a feladat összefüggéséről, magyarán, hogy a térbeli koordináták relevánsak ebben az esetben.

Eddig statikus objektumokat próbáltak 3D kulcspontok létrehozásával lokalizálni, a tér- és időbeli változásokat figyelemmel követő új modell – és az azzal működő robotok – viszont már dinamikus környezettel is tudnak interakciókat folytatni.

Mi várható az MI-alapú nyelvi modelleknél?

A világhírű GPT-3 mesterséges intelligencia, a fejlesztő OpenAI-val közösen dolgozó Microsoft jóvoltából immár könnyebben elérhető, mint volt korábban. Ez azonban több problémát is felvet.

Nem véletlen, hogy a redmondi nagyvállalat közölte: tervei szerint a nyelvi mesterségesintelligencia-modellre vonatkozó – a felhasználói jelzéseken alapuló – visszaélések elleni óvintézkedéseket tesz majd.

Szükség is lesz rájuk, mert az összes szövegen trenírozott MI-hez hasonlóan, a GPT-3 is képes elfogult, morálisan megkérdőjelezhető, a felhasználót teljesen összezavaró outputokat generálni. Kérdés, hogy a Microsoft a jövőben mennyire fog ragaszkodni mostani elveihez, betartja és betartatja-e a szigort, vagy lazít rajta.

openai0_1.jpg

Ne feledkezzünk el arról a tényről, hogy az OpenAI egy korábbi verziót, a GPT-2-t pont azért vonta ki a forgalomból, hogy rosszindulatú felhasználók ne élhessenek vissza vele.

A GPT-3 is ad okot aggodalomra.

Egy friss tanulmány alapján például sztereotípiákon alapuló szöveget generált az iszlám és az erőszak kapcsolatáról. Egy francia cégnél pedig orvosi chatbotként is tesztelték, és nem teljesített jól, például egy, öngyilkosságra készülő kamupáciensnek azt mondta, hogy szerinte a fatális lépés megtétele lenne a leghelyesebb döntés, úgy kellene tennie. Képzeljük el, ha „élesben” reagált volna így…

A technológia jövője továbbá azért is érdekes, mert a Microsoft és az OpenAI értelemszerűen nem monopolizálhatja a területet, és nagyon valószínű, hogy nem is fogják sokáig. Gyűlnek a riválisok.

Több kínai egyetem ugyanis összeállt, és közösen dolgoznak a hírek alapján a GPT-3-nál tízszer nagyobb Wu Dao modellen, de a Microsoft Szilícium-völgyi vetélytársai szintén hasonló babérokra törnek, és talán még a kínaiaknál is masszívabb rendszereket építenek.

Egyelőre annyi történt, hogy az EleutherAI egy sokkal kisebb nyílt forrású kísérlettel próbálja lemásolni és méretezhetővé tenni a GPT-3-at. Az AI21 Labs pedig szabad hozzáférést kínál a 178 milliárd paraméteres Jurassic-1 bétaváltozatához.

A verseny nyilván éleződni fog, amellyel az MI-fejlesztőközösség csak jól járhat. Nyilvánvalóan mi, felhasználók is.

süti beállítások módosítása