Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Jeff Bezos világűr-terve alapján billiók élnének hengeralakú űrállomásokban

2024. január 10. - ferenck

Az Amazon alapítója és a Blue Origin vezérigazgatója, Jeff Bezos szerint egy szép napon valamennyien a naprendszer távoli pontjain lebegő, hengeralakú masszív űrállomások belsejében élhetünk.

Ezeket az elképesztő embertömegnek otthont adó lakóhelyeket Gerard K. O’Neil (1927-1992) amerikai sci-fi író, fizikus és űraktivista vázolta fel először még az 1970-es években. Bezos pedig azt szeretné látni, ha billiónyi ember élne a naprendszer messzi részein.

bezos.jpg

„Ha billióan vagyunk, bármikor lesz közöttünk ezer Mozart és ezer Einstein” – nyilatkozta Lex Fridman podcasternek.

Az elképzelés kizárólag óriásméretű űrállomásokkal valósítható meg, mert a planetáris felületek túl kicsik Bezos szerint.

bezos0.jpg

A világűr birtokbavételét teljesen másképp képzeli, mint a saját bevallása szerint az emberiség multiplanetárissá alakításán is dolgozó, a Marson és más bolygókon városok alapítását felvető Elon Musk. A Föld jövője kijózanítóbb nála – bolygónk nyaralóközponttá válna: felpattanunk majd egy űrjárgányra, és ugyanúgy meglátogatjuk, mint ma a nemzeti parkokat.

A jövő emberei választhatnak: vagy egy „Amazon O’Neil” kolóniában élnek, vagy visszatérnek a Földre. Bezos egyébként a mesterséges intelligencia holnapját illetően is optimista, Muskról pedig azt mondta, hogy jó vezető, de nem ismeri eléggé.

Az űrállomásokon való élet a pesszimista forgatókönyv alapján is megvalósulhat – ha a klímaváltozás klímakatasztrófába megy át, ezek a telepek lehetnek az emberiség új lakóhelyei, menedékhelyei.

Colorado állam szabályozza a biztosítási szektor mesterségesintelligencia-használatát

Coloradoban érvénybe lépett a mesterséges intelligencia életbiztosításban való használatát szabályozó és az önbiztosítókra vonatkozó korlátozásokat bővítő első törvény. Más szövetségi államok az érvényben lévők szellemében tesznek lépéseket az élet- és az önbiztosítók szabályozására.

Az USA-ban a szövetségi államok a felelősek a biztosítási szektor szabályozásáért. A coloradói törvény korlátozza, hogy az életbiztosítók milyen típusú adatokat, és hogyan használhatnak fel. A 2021-ben elfogadott törvény 2023 novemberében lépett hatályba.

eletbiztositas.jpg

A „hagyományosnak” elkönyvelt adatok „tisztességesek.” Az egészségügyi, a család múltjára, foglalkozásra, bűnügyi múltra, vényköteles gyógyszerek használatára vonatkozó és a pénzügyi infók tartoznak ebbe a kategóriába.

A „nem hagyományos” adatokon, például hitelpontszámokon, közösségimédia-tevékenységen és vásárlási előzményeken alapuló modellekkel dolgozó biztosítóknak jelenteniük kell a használatukat. A jelentésnek tartalmaznia kell minden egyes modell leírását, rendeltetését, valamint hogy milyen adatokra épül. Tesztelniük kell a torzításokat (elfogultságokat), és ezeket az eredményeket is kötelező jelenteniük.

Kötelesek dokumentálni a modellfejlesztés irányelveit, jelentést kell csinálniuk az irányítási szerkezetük és kockázatkezelési kereteik éves felülvizsgálatáról.

Kaliforniában az összes biztosítónak értesítenie kell az illetékes hatóságot, ha az algoritmusok miatt az ügyfélnek többet kell fizetnie. Ezt követően dönthetnek, hogy az emelés jogos vagy diszkriminatív. Connecticut és New York összes biztosítóját utasították, hogy az MI használatát a diszkrimináció elleni törvényekhez igazítsák. Washington D. C. vizsgálatot indított arról, hogy az önbiztosítók adathasználata eredményezett-e egyes csoportokkal szembeni diszkriminációt.

Colorado állam 2023 elején megosztotta az életbiztosítás-szabályozás kezdeti tervezetét. Ez tiltotta a nemcsak bőrszín alapján diszkrimináló MI használatát, a modellekhez való engedély nélküli hozzáférést, kötelezővé tette a nem várt következményekkel kapcsolatos terv készítését, valamint a modellek külső szakértők általi auditálását.

A végső változat nem tartalmazza ezeket a pontokat.

A szabályozók attól tartanak, hogy az MI növelheti a marginalizált csoportokkal szembeni megkülönböztetést, a coloradói változat pedig például szolgálhat a későbbiek számára. A biztosítókra percunami várhat a diszkriminatív algoritmusok miatt. Megfelelő szabályozással viszont csökkenthetők a károk és az ügyfelek sérelmei.

Mit lát egy gépszem a sötétebb bőrű gyalogosokból?

Egyre több járműbe telepítenek önvezető képességeket, nagyvárosokban bővülnek a robottaxi-szolgáltatások. A változások következtében szinte naponta nő a gépilátás-algoritmusoktól függő emberi életek száma. Autógyártók viszont nem árulják el, milyen gyalogos-detektáló rendszereket használnak, és az önvezető autók által okozott balesetek számát sem közlik.

A rendszerek általában meglévő nyílt forrású modelleken alapulnak, és ezekkel a modellekkel kapcsolatban is biztosak lehetünk: ugyanazok a problémák merülnek fel velük kapcsolatban is, mint az összes többi más esetében.

gyalogosok.jpg

Kínai és brit kutatók széleskörben használt nyolc objektumdetektálót értékeltek ki a bőrszín, az életkor és a nem szerinti elfogultság szempontjából. Ha gyalogosokról van szó, ezek az elfogultságok ugyanis életről és halálról is dönthetnek. Megítélésükhöz a detektálásukat befolyásoló, karakterisztika szerint címkézett adatsorok kellenek gyalogosokról. Az emberek közötti fontos különbségek (bőrszín, kor, nem) különösen a fényviszonyok függvényében, komolyan befolyásolhatják a gépilátás-rendszerek teljesítményét.

A kutatók utcai jeleneteket ábrázoló négy adatsor nyolcezer fényképét gyűjtötték össze. Az összes fotót bőrszín (világos/sötét), életkor (gyerek/felnőtt) és nem (férfi/nő) szerinti annotált címkékkel látták el, majd négy általános rendeltetésű objektum-detektort és négy gyalogos-specifikus detektort teszteltek rajtuk.

Teljesítményüket az általuk észlelt bőrszín, kor és nem szerint, különféle világosság, kontraszt és időjárási feltételek mellett értékelték ki. Szignifikáns méltányossági problémák merültek fel.

Két modell sokkal rosszabbul ismert fel sötétebb bőrű személyeket, alacsony fényerő és kontraszt mellett pedig az összesnek problémát okozott a detektálásuk. Mindegyik rosszabbul teljesített gyerekekkel, mint felnőttekkel. A nemi különbségeket általában jól észlelték, éjszakai jelenetekben viszont nehezebben azonosították a nőket.

Az eredmények a korábbi kutatásokat igazolták: bizonyos személyeket nehezebben vesznek észre a gépilátás-modellek, mint másokat. Már egy 2019-es MIT (Massachusetts Institute of Technology) anyag például kimutatta, hogy nők és sötétebb bőrűek esetében rosszabbul működik az arcfelismerés.

A viselhető technológiákra, és nem az iPhone-ra összpontosít 2024-ben az Apple

Mark Gurman „Apple-szakértő” szerint 2024-ben, tizenöt év termékstratégiai iránnyal szakítva, nem az iPhone lesz a cég fejlesztéseinek fókuszpontjában, helyette a magunkon viselhető (wearable) technológiákra fognak összpontosítani.

A 2023 őszén bemutatott kevert valóság (VR+AR) headset, a Vision Pro új kategória, de nemcsak a portfólió bővítése, hanem új irány is.

apple_3.jpg

Szükségük is lesz újításokra, mert a szeptemberrel zárult 2023-as adóévben stagnáltak a pandémia után megugrott eladások, mindegyik nagyobb termék (iPhone, Mac, iPad, viselhetők) mutatói visszaestek, egyedül a szolgáltatásüzlet prosperált.

Az iPhone a cég legfontosabb termékeként, a bevételek több mint felének megtermelőjeként, persze megkapja idén is a szokásos ráncfelvarrást, fontos változásokra viszont ne számítsunk. Marad az iPhone 15 design, nő a Pro változat képernyőjének mérete, és új gomb lehet majd a videófelvételekhez.

apple0_1.jpg

A viselhetőtechnológia-vonalon a fülhallgatók (AirPods), az AirPods max fejhallgatók és az okosórák (Apple Watch) további fejlesztése során mindkét termékcsalád esetében komoly, minőségi – az eddigi legnagyobb – változásokra számíthatunk. A Vision Prot pedig elkezdik árusítani, bár nagyon komoly bevételre nem számítanak tőle.

Két új – negyedik generációs – nem Pro AirPods várható (a Pro frissítése 2025-ben lesz aktuális), megváltozott designnal. Szükség lesz rájuk, mert a harmadik generációt lényegében csak a magasabb ár különbözteti meg a másodiktól. A cég ezen a téren valóban nagy dobásra, a hallássegítő funkció bevezetésére is készül. A hallókészülék komoly hatással lehet majd a többmilliárd dolláros iparágra.

Az Apple Watch egyik modellje mindenképpen új külsőt kap, bővített egészségügyi funkciókkal (magas vérnyomás, alvási rendellenességek mérése). Az iPad szintén módosul: a Pro új köntöst, az Air nagyobb kijelzőt, a mini gyorsabb chipet kaphat.

Az Amazon is beszállt a chatbot-versenybe

Az Amazon december elején bejelentette mesterséges intelligenciával működő Q asszisztensét (ami természetesen a hasonló név ellenére értelemszerűen nem azonos az OpenAI Q* MI-jével). Az alkalmazottak dokumentumokat és vállalati rendszereket kérdezhetnek le vele.

Néhány nap múlva kiszivárgott belső dokumentumokból kiderült, hogy a modell hamis információkat is képes generálni, bizalmas infókat pedig ki tud szivárogtatni.

amazonchatbot0.jpg

Az egyelőre ingyenes előnézetként (preview) hozzáférhető Q privát dokumentumokat, adatbázisokat és kódokat elemezve válaszolja meg a kérdéseket, állít elő tartalmat, intézkedik. Az Amazon kétszintű szolgáltatást tervez vele: havi húsz dollárért alap chatbotot, huszonötért chatbotot és kódgenerálást, hibaelhárítást, biztonsági értékeléseket és humán asszisztenst az Amazon Webszolgáltatásokhoz (AWS). A nagyvállalat megígérte, hogy a Q-felhasználók adatain nem gyakoroltat gépitanulás-modelleket.

Három nappal a bejelentés után azonban alkalmazottak a Slack felhőalapú belső csapatkommunikációs platformon, valamint biztonsági csatornákon problémákról számoltak be.

amazonchatbot.jpg

A Q pontatlan ajánlásokat fogalmazott meg az Európában különösen, de a világ más részein is kényes jogi kérdésnek számító digitális szuverenitásról, azaz arról, hogy az adatokat az adott joghatóságon belül kell tárolni, vagy sem.

Az egyik alkalmazott elég súlyos problémára utaló sev2 biztonsági szintű riasztást adott le. Ilyenkor az érintett mérnököknek munkaidőn túl és hétvégén is dolgozniuk kell a hiba kijavításán.

Belső tesztek alapján a Q bizalmas információkat szivárogtatott ki az Amazontól: belső kedvezményprogramokat, kiadatlan funkciókat, AWS adatközpontok helyét stb.

Az Amazon szóvivői hipotetikusnak nevezték ezeket az eseteket, és tagadták, hogy a Q ilyen információkat szivárogtatott ki. Egyébként nem ők az egyetlen nagy MI-vállalat, amelynek a chatbotja privát infókat juttat el illetéktelenekhez. Google-kutatók nemrég számoltak be arról, hogy az OpenAI ChatGPT-jének a gyakorlóadatokban található személyes infók kiadására ösztönző promptokat adtak meg.

Az Amazon számára szerencsétlen, hogy egy ennyire új rendszer máris problémákkal küszködik. Nehezebb lesz így felvenni a versenyt a vetélytársakkal, például a ChatGPT-vel vagy a Microsoft Copilottal. A fejlesztőknek pedig kijózanító pofon lehet: ha gyorsan haladnak, pont a gyorsaság okozhat gondokat.

A nagy látásmodellek hatása a képfeldolgozásra

A nagy nyelvmodellek (large language models, LLM) megváltoztatták a szövegfeldolgozást. A nagy látásmodellekkel (large vision models, LVM) hasonló figyelhető meg: elkezdték megváltoztatni a képfeldolgozást.

A kettő között azonban van egy fontos különbség. Internetes szövegek eléggé hasonlítanak céges szövegekhez, így az előbbieken gyakoroltatott LLM-ek általában megértik a vállalati és a magándokumentumokat. Sok képalkalmazás viszont az internetes képekre egyáltalán nem hasonlító anyagokkal dolgozik. Ezekben az esetekben jobb, ha az alkalmazási területhez „igazított” témaspecifikus LVM-et használunk.

lvm.jpg

Az interneten, különösen az olyan oldalakon, mint az Instagram, rengeteg személyt, állatot, látványosságot és hétköznapi tárgyat ábrázoló kép található. Egy általános rendeltetésű LVM megtanulja felismerni a képek legfontosabb elemeit.

Sok iparág-specifikus alkalmazásnál a képek viszont nem vagy alig hasonlítanak a neten láthatókhoz. Sebészeti alkalmazásoknál például nagyteljesítményű mikroszkóppal felvett szövetminták képei kerülnek feldolgozásra. Ipari ellenőrzésnél egyetlen tárgy vagy tárgyrészlet képeivel dolgoznak. A képeket általában egyforma világítás mellett, ugyanazzal a kamerabeállítással készítik.

Néhány ilyen kép persze fellelhető online, azonban annyira kevés van belőlük, hogy az általános LVM-ek rosszul teljesítenek a legfontosabb jegyek felismerésében.

Speciális területre adaptált LVM-ek viszont sokkal jobban működnek az adott terület képeivel, jobban felismerik rajtuk a legfontosabb elemeket. Ezeket a modelleket kb. százezer címkézetlen területspecifikus képen elég gyakoroltatni, és máris megfelelő munkát végeznek. Persze minél több a kép, annál jobb az eredmény.

Ha előre gyakoroltatott LVM-et és felcímkézett kicsi adatsort együtt használunk felügyelet melletti tanulást igénylő feladatok megoldásához, a területspecifikus LVM-nek sokkal kevesebb felcímkézett adatra van szüksége általános LVM-hez hasonló teljesítmény eléréséhez. Tehát velük érdemes próbálkozni az internetes képektől nagyon különböző vizuális adatok feldolgozásakor.

Az LVM-ek persze még gyerekcipőben járnak, területspecifikus változataik többféleképpen gyakoroltathatók, szöveggel kombinálva pedig területspecifikus nagy multimodális modellek dolgozhatók ki.

Mit éreznénk, ha kar helyett polipcsápunk lenne?

A zsákmányát elkapó polip megfigyelése tapadókorongokkal kiegészített, ujjra felhúzható „kesztyűvel” irányítható puha robotcsáp fejlesztésére ösztönzött pekingi és szingapúri kutatókat.

Ügyességük és intelligenciájuk miatt a polipok régóta inspirálják a robotikát. Többszáz izommal rendelkeznek, annyi izmot és szabadságfokot képesek irányítani. A mozgás ilyen széles skálája és rugalmassága nagyon különbözik a hagyományos robotokétól.

polip.jpg

A kutatókat különösen a hajlításszerű mozgás érdekelte, ahogy a polip meglendíti a karját, és megragadja a zsákmányt. A mozdulat a kar tövénél kezdődik, és hullámként halad a csúcsig, körbeveszi a szerencsétlen halat vagy más élőlényt, tapadókorongokkal „ragad” rá, hogy a zsákmány ne menekülhessen, amikor a polip szájához kerül.

A polip karjai szokatlanok, szinte az agytól függetlenül működnek, nagyon kevés az agy és a kar közötti vezérlőjel. A kar idegrendszere úgy van elrendezve, hogy szekvenciálisan aktiválódjon, így pedig a feldolgozáshoz szükséges számítási tevékenység erősen korlátozott. Utánzásához a kutatóknak a hajlításszerű mozgást kellett matematikailag modellezni.

A robotcsáp puha szilikonból készült öt szegmensből áll, szobahőmérsékleten folyékony fém van beléjük ágyazva. Szabvány szilíciumchipekkel együtt a polip karjának idegrendszerét utánzó elektromos hálózatot alkotnak. A csáp hegyét tapadókkal és hőmérséklet-érzékelőkkel szerelték fel.

A rendszer önálló egységet alkot. Szenzorokkal felszerelt, nemcsak a kezelő ujjának mozgását, hanem a kéz és a kar dőlését is érzékelő, a mozgásokat a csáphoz továbbító, egyujjas kesztyűvel irányítható vezeték nélkül. A valódi polipkarhoz hasonlóan, az octobot (polip angolul octopus) célját elérve, eredeti hosszának másfélszeresére is kitágulhat.

A kutatók olyan szenzoros elemet akartak még a rendszerbe integrálni, amely lehetővé teszi, hogy a robot működtetője közvetlenül érzékelje a csáp hegyén lévő tapadókorongok összekapcsolódását. Ennek megfelelően a kesztyű belsejében viselője ujjához kapcsolódó három tapadókorong található. A robotcsáp tapadást „tolmácsolják”, hogy a kezelő fizikailag érezze, amikor a csáp elérte célját.

Octobot a teszteken elkapta a műanyagjáték-prédát; a robot levegőben és vízben egyaránt jól működött. A fejlesztéssel közelebb kerültünk a puha robotika egyik legfontosabb céljának, a polipok „beágyazott intelligenciájának” gépi megvalósításához.     

Gazdasági bizonytalanságok a Metaverzumban

Két éve, amikor a Facebook gőzerővel beleállt, és még a nevét is Metára változtatta, óriási hype alakult ki a Metaverzum körül, Zuckerberg a virtuális tereket és 3D internetet VR-rel és AR-rel közös nevezőre hozó univerzumban látta a jövőt, ahol a tanulástól kezdve a munkáig, konferenciáktól a szórakozásig, szinte mindenre nyílik majd alkalmunk, amire meg nem, azzal talán nem is érdemes foglalkoznunk.

A metaverzum a való világ és az internet találkozási pontja, ahol a kettő egybeolvad. Legalábbis elméletben, és a koncepció hívei és a minden technológiának fényes jövőt jósoló futurológusok szerint, közben viszont a digitális ikreken kívül nagyon kevés a tényleg működő alkalmazás, a metaverzum mai formájában eladhatatlan, a befektetők, köztük a Meta is, nem véletlenül menekülnek belőle.

metaverse_2.jpg

Először az egykori cyberpunk író, a legendás Neal Stephenson vetette fel a gondolatot 1992-es kultikus regényében, a Snow Crash-ben: a lényegében online világban otthona elhagyása nélkül járhatott bárki iskolába, dolgozni, játszhatott, koncerteket nézhetett, bevásárolhatott. A kétdimenziós szöveges-képes internet kelt életre benne a tükörvilágok, akár például a kilencvenes évek technooptimizmusára adott és az évtizedet 9/11-gyel együtt lezáró, kiábrándult válasz, a Mátrix mintájára is.

metaverse0_2.jpg

A Metaverzum tömeges, diszruptív változásokat elindító elterjedésének korlátai persze nemcsak és nem elsősorban elméletiek, hanem nagyon is gyakorlatiak, technológiaiak: nem teremtettük meg hozzá a feltételeket.

Az első határt néhány éve léptük át: a virtuálisvalóság-headsetek vizuálisan nagyon különböző világokba viszik el a felhasználót. Azóta elméletgyártók és technológusok egyaránt élhetővé, a halláson és a látáson kívül is „érzékszervi orgiává” kínálják tenni a Metaverzumot. De hiába vettük sikerrel az első akadályt, a többin még nem sikerült átjutnunk.

metaverse1.jpg

Több startup, például a vermonti OVR Technology igyekszik beleintegrálni a szaglást, a Tokiói Egyetemen 2021-ben ízeket utánzó, nyalható televíziót fejlesztettek, mások evőeszközre szerelt elektródákkal próbálják a savanyú, az édes, a sós és a keserű ízt digitálisan visszaadni. Ezek a próbálkozások azonban eddig legalábbis megmaradtak kuriózumnak, tömegek által használt fogyasztói termék egyhamar nem lesz belőlük.

Az összes érzék élethű szimulálása nélkül nincs Metaverzum, és az elképzelt formában aligha fog mostanában megvalósulni. Ráadásul a technológián kívül is túl sok a megválaszolandó, például szabályozási vagy tulajdonjogi kérdés: hogyan védhetők meg a gyerekek, mennyit is ér valójában egy virtuális ruha és így tovább. A legtöbb kérdésre nincs még válasz.           

Hogyan terjed a rák?

A Duke Egyetem biomedikális mérnökei továbbfejlesztették az egyéni ráksejtek teljes emberi testen belüli nagytávolságú mozgását szimuláló számítási modellt. Az „adaptív fizikai megközelítés” (APR) nevű megközelítés részletesen rögzíti a sejtek interakcióit és a sejtpályára gyakorolt hatásukat, felbecsülhetetlen értékű betekintést nyújtva a metasztatikus (áttétet okozó) ráksejtek „utazásaiba.”

A véráramunkban lévő ráksejteket befolyásolják a közeli vörösvérsejtek körüli mozgásuk és más sejtek közötti interakciók. Az összes vörösvérsejt szimulálása viszont lehetetlen, ezért a kutatóknak ki kellett találniuk valamit a számítási korlátok kezelésére.

rak.jpg

A rákos sejtek test erein keresztüli haladásának dinamikáját megfejteni változatlanul bonyolult és komplex kérdés, egyben kulcsfontosságú is a korai felismerés és a lehetséges kezelés szempontjából. Mivel élő személyekben nem lehet megfigyelni ezeket a folyamatokat, a ráksejtek dinamikájának szimulálásához fejlett számítási modellek szükségesek.

A Duke Egyetem kutatói ilyeneken dolgoznak. Méretezhető HARVEY modelljüket úgy tervezték, hogy a világ legfejlettebb szuperszámítógépein működjön.

Csakhogy a szuperszámítógépeknek is megvannak a korlátjaik. Egyetlen ráksejt pályájának kiszámításához a modelleknek rögzíteniük kell a környező vörösvérsejtekkel folytatott interakciókat. Az emberi testben pedig kb. 25 billió vörösvérsejt és öt liter vér van. Egy mai csúcs-szuperszámítógéppel csak az egyszázalékuk jeleníthető meg sejtméretű felbontásban, és még így is többszázezer vörösvérsejtet tartalmaz.

A problémát új megközelítéssel próbálták megoldani. Továbbfejlesztettek egy meglévő algoritmust, beletáplálták a vörösvérsejtek interakcióit, az APR-rel pedig az érintett sejt mozgásának követésére alkalmas keretet dolgoztak ki, mintha egy játékhajó áramlaton lefelé történő útját utánozták volna. A legegyszerűbb megközelítés a teljes vízi út szimulálása lenne elejétől a végéig. Ebben az esetben a számítási erőforrások nagy részét viszont, praktikusnak egyáltalán nem nevezhető módon, a hajótól távoli fizikai jelenségek rögzítésére használnák.

Sokkal hasznosabb, ha a hajóhoz közeli területet a lehető legpontosabban modellezik, míg a többit kisebb felbontásban. Jóval hatékonyabb és pontosabb szimuláció az eredmény.

A Duke Egyetem szimulációjával megváltozhat a rákkutatás. Jelenleg a modellező szoftvert újabb funkciókkal bővítik, és bizakodnak, hogy az APR hozzájárul a sejtszintű modellezés demokratizálásához, hogy az ezzel foglalkozók a világ legnagyobb szuperszámítógépeihez való hozzáférés nélkül is tudják tanulmányozni a rák dinamikáját.

2023 a nagy nyelvmodellek és a chatbotok éve volt

A ChatGPT-t 2022. november harmincadikán indította világhódító útjára az OpenAI. A nagy nyelvmodellek (large language models, LLM) azóta talán a fejlesztők által sem várt döbbenetes pályát futottak be.

Egy éve lényegében csak a ChatGPT állt a webes felhasználói interfészt használó széleskörű felhasználói réteg rendelkezésére, míg az LLM-ekkel dolgozni vágyó fejlesztők szinte csak az OpenAI modelljei közül válogathattak.

nagy_nyelvmodellek.jpg

Mára drasztikusan megváltozott a helyzet. Az érdeklődők számos nyílt forrású és zárt LLM-mel dolgozhatnak, chatelhetnek: még mindig a ChatGPT a legnépszerűbb, de ott van a Microsoft Bingje, a Google Bardja, vagy startupok termékei is, például az Anthropic Claude-ja vagy a perplexity.ai. A fejlesztők bőven szemezgethetnek az opciók közül: az Amazon Webszolgáltatások, az Azure, a Cohere, a Google Cloud, a Hugging Face, az OpenAI és mások API-jait (alkalmazásprogramozói felületeit) használhatják, és a választék csak bővülni fog.

Fejlesztőnek, átlagfelhasználónak egyaránt pozitívum, hogy a saját magunk által hosztolható, helyileg, például laptopunkon futtatható, nyílt forrású modellek meglepően jók, és egyre jobbak lesznek. Sok alkalmazáshoz egy megfelelően működő nyílt forrású modell, például a GPT4AII és az MLC akár az egy évvel ezelőtti ChatGPT 3.5-tel azonos szinten teljesít.

Helyileg futtatott modellek használata korábban a fejlesztők privilégiuma volt, mert bonyolult telepítési és konfigurálási folyamatokkal kellett megbirkózniuk. Jelenleg szerencsére más a helyzet, könnyebben kezelhetők, többen tudják használni őket.

LLM-ek közvetlenül a gépünkről vagy a számítási felhőből is futtathatók. Utóbbi akkor ajánlott, ha a kisebb, helyileg működtetett, nyílt forrású modell teljesítményénél többre van szükségünk, mondjuk, ha a GPT-4-gyel dolgozunk.

A biztonság ugyan rendkívül fontos, sok nagy szolgáltató megoldásai viszont több esetben „túlbiztosítottak”, a modellek bizonyos kérdésekre például nem hajlandók válaszolni. Ezzel szemben jópár nyílt forrású alternatíva nem ilyen agresszíven biztonságra hangolt, egyes alkalmazásokban célszerűbb is velük dolgozni.

Egy év leforgása alatt egyetlen tényleg használható modelltől több tucatig jutottunk el. 

süti beállítások módosítása