Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Hackertámadás érte a Microsoftot

2023. június 27. - ferenck

Június első hetében a Microsoft szinte összes szolgáltatása, köztük az Azure, az Outlook és a Teams is leállt, és közel tizenöt órába telt, míg sikerült mindent helyreállítani. A nagyvállalat jóval később, csak a múlt héten jelentette be, hogy cybertámadás, egész pontosan elosztott szolgálatmegtagadással járó (Distributed Denial-of-Service, DDoS) támadás állt a „globális kimaradás” mögött.

A támadók több virtuális magánszervert (Virtual Private Server, VPS), proxi kiszolgálókat, bérelt felhőinfrastruktúrát és DDoS-eszközöket használtak. A támadás ugyan körmönfont volt, felhasználói adatokhoz mégsem fértek hozzá, így nem is tudtak változtatni azokon – hangsúlyozza a Microsoft.

microsoft_hacking_2.jpg

A DDoS-támadás lényege, hogy a rendszer ismert gyenge tulajdonságai vagy valamilyen speciális protokoll tulajdonságai a célpont, a felhasználók pedig ne érjék el a nekik fontos infókat, gépet, hálózatot. A rendszer lelassul, elérhetetlen lesz, legrosszabb esetben leáll.

A nagyvállalat a technikai részleteket is megosztotta. A támadó Storm-1359 botnetek és más eszközök sokaságával támadta a cég szervereit, és idézett elő túlterhelést. Ezt például a világ változatos pontjain lévő IP-címekről küldött többmillió HTTP(S) lekéréssel érte el.

A Microsoft szerint Storm-1359 zavarkeltésre és a nyilvánosságra összpontosít. Az Azure-felhasználóknak tanácsokat is adtak, hogy a jövőben hogyan védekezzenek hasonló DDoS-támadásokkal szemben. A károkról és az anyagi következményekről nem árultak el részleteket.

Nem sokkal a támadás után a Névtelen Szudán hackercsoport vállalta magára a felelősséget. Később a Microsoft közölte, hogy ez valószínűleg így is van, tényleg ők állhatnak a háttérben.

A Névtelen Szudán 2023 elején tűnt fel, a szudáni politikába beavatkozó külföldi országok online rendszereit igyekszik támadni. Legalábbis ezt mondják, egyes internetbiztonsági szakértők szerint viszont a Kreml- és Putyin-barát Killnet hackercsoporttal állhatnak kapcsolatban, és az afrikai országra történő hivatkozással csak a figyelmet akarják elterelni.

Beépül a ChatGPT Mercedes-autókba

A Mercedes-Benz és a Microsoft múlt csütörtökön jelentette be, hogy partnerség keretében közösen tesztelik a ChatGPT használatát autókban. Így a technológia több mint 900 ezer jármű számára lesz elérhető az Egyesült Államokban, és az amerikai vezetők péntektől már használhatják is az opcionális bétaprogramot.

A Microsoft egyik szóvivője elmondta, hogy ez a ma már legendás MI-chatbot első implementációja járműben. A technológiát a Hey Mercedes hangasszisztensen keresztül használják, és a várakozások alapján jelentős mértékben növeli a rendszer képességeit.

mercedes_1.jpg

Az ügyfelek vagy a Mercedes me alkalmazáson, vagy közvetlenül a járműben, hangutasítással regisztrálhatnak. Annyit kell mondaniuk, hogy „helló Mercedes, csatlakozni akarok a bétaprogramhoz.”

Mivel a legtöbb hangasszisztens előzetesen definiált feladatokra és válaszokra korlátozott, a ChatGPT sokkal fejlettebb természetesnyelv-megértésével jócskán bővül a megválaszolandó témák száma – hangsúlyozza a Mercedes.

Más szektorokhoz hasonlóan, a ChatGPT használata az autóiparban is viták tárgya. Egyesek, például a General Motors (GM) szerint autonóm járművek már használnak mesterségesintelligencia-, gépitanulás-megoldásokat. Valóban így van, viszont a Mercedes-Microsoft partnerség a ChatGPT egyik első nagyon speciális alkalmazása. (A GM egyébként idén már vizsgálta a ChatGPT felhasználási eseteit a járműveiben.)

Eric Boyd, a Microsoft MI platform alelnöke többek között a hangutasítások és az interakció, a képességek, a kérdés-feleletek javuló minőségét várja az integrációtól.

A ChatGPT-vel hosszabb kommunikációk folytathatók, és nemcsak a beszélgetés kezdetén érti a szövegkörnyezetet. A vezetők bonyolult kérdéseket tehetnek fel neki, fordulatosak lehetnek a beszélgetések, az új hangasszisztenstől pedig releváns és részletes válaszokat kapnak – emeli ki Boyd.

A háromhónapos bétaprogram és a felhasználói visszajelzések alapján, a Mercedes dönteni fog a technológia további integrációjáról.

A játékfejlesztők is szeretik a generatív mesterséges intelligenciát

A generatív mesterséges intelligencia leegyszerűsítheti a videojátékok gyártását, és a stúdiók egyáltalán nem lesznek boldogtalanok, mert az MI-vel csökkennek a kiadások, hamarabb elkészülnek a munkák, hagyományos módszerekkel nehezen megvalósítható, nem praktikus kreatív kísérleteket is végezhetnek, például művészi stílusokkal, karakterekkel, párbeszédekkel stb. próbálkozhatnak eddig nem látott módokon.

Tekintettel az egyre csak növekvő hatalmas költségekre, a játékfejlesztés tényleg megérett a generatív MI integrálására. Az átalakulás viszont állások megszűnésével járhat, és csak bizakodhatunk, hogy új munkahelyeket is teremt a szektorban. A „nagyok” már alkalmazzák a technológiát, még látványosabb virtuális világokat építenek vele. Az igazi nyertesek azonban nem ők, hanem a sok kis stúdió lesz.

gaming_ai.jpg

Infokom technológia nagyvállalatok folyamatosan kínálnak új MI-modelleket, de közben maguk a játékgyártók is fejlesztenek mesterséges intelligenciával médiamegoldásokat.

Az Nvidia új rendszere lehetővé teszi, hogy játékosok közvetlenül társalogjanak játékon belüli karakterekkel. Az Avatar Cloud Engine (avatár felhőmotor, ACE) tajpeji bemutatóján a játékkarakter a játékmenetet tovább vivő információkkal válaszolt valósidőben a játékosnak. Az ACE értelmezte a játékost, generálta a karakter hangját és szövegét, és irányította az animációt.

gaming_ai0.jpg

A Scenario startup speciális felhasználói felülettel rendelkező, szövegből képet generáló modellt kínál fejlesztői eszközök finomhangolásához. Egy másik vállalat, a Didimo szövegből 3D modellt létrehozó rendszerével szerkeszthető, animációra kész, fejlesztőbarát formátumú karaktermodellek hozhatók létre.

A Blizzard Entertainment saját játékaiból származó eszközökhöz gyakoroltatott be képgenerátort. Fejlesztők karakterekhez és környezetekhez dolgozzák ki elképzeléseiket az új eszközzel. Egy másik nagyágyú, a Ubisoft dialógusgenerátort mutatott be. Írók játékkarakter-párbeszédeket alkothatnak a modellel – megadnak neki egy promptot, amire több változattal áll elő.

Techcégek és játékgyártók mellett maguk a játékosok is használják a generatív MI-t, alkalmasint kedvenc játékukat változtatják meg vele, például hangklónozással adnak szöveget hallgatag karakterek szájába.

Mélytanulással jobban, pontosabban észrevehetők, követhetők sejtek

Sejtek növekedését, osztódását hosszú idő alatt felvett képeket rövid időn belül lejátszó (time-lapse) mikroszkóptechnikával vizsgálják. A technika jól működik, viszont az így keletkezett óriási adatmennyiséget szinte lehetetlen manuálisan kezelni.

Mélytanulással (deep learning) szerencsére könnyebb megbirkózni gigantikus adathalmokkal. A Santa Cruzi Kaliforniai Egyetemen fejlesztett DeepSea (MélyTenger) egyike azon kevés modelleknek, amelyekkel sejtek szegmentálhatók, követhetők, osztódásuk pontosan megfigyelhető. (A gyakorló adatsor, a felhasználóbarát és nyílt forráskódú szoftver a DeepSea honlapján elérhető.)

sejt0.jpg

A time-lapse alapú mikroszkópokkal a kutatók egyes sejtek osztódását, különböző sejtekké válását – őssejtek speciális sejttípussá alakulását –, formájuk és méretük változását követve, biológiai jelenségeket mérve, juthatnak el új felfedezésekig. Miután a képeket összegyűjtötték, két fontos feladatot kell elvégezniük: a szegmentálást, azaz a sejtek határainak megállapítását és elválasztásukat a háttértől, valamint a sejtek kockáról kockára követését (ld. a két kép közti különbséget.)

A képek válogatása, kezelése tipikusan számítógépnek, és nem embernek való feladat. Ezért hasznos a szegmentálást kevesebb mint egy másodperc alatt elvégző, sejtek követésében 98 százalékos pontosságot elért DeepSea.

sejt_1.jpg

A sejtosztódás detektálása külön kihívást jelentett a fejlesztőknek, mégpedig azért, mert MI-alapú technikák, gépilátás-rendszerek ritkán szembesülnek egy objektum kettéválásával.

A 2D-UNET modellen alapuló, a gyorsaságot és a jó eredményeket viszont sokkal kevesebb paraméterrel elérő DeepSea általánosítható, azaz sok sejttípus vizsgálható vele. A legjobb „sejtfigyelő” modellekkel összehasonlították, és pontosságban, gyorsaságban egyaránt felülmúlta őket. Tüdő-, izom- ős- és egyéb sejteket tartalmazó adatsoron gyakoroltatták, a jövőben még több fajtával bővíthető a repertoár.

Már egy felfedezésre is jutottak vele: a többsejtű élet alapját jelentő, mindenféle más sejttípusra osztódó embrionális őssejtek, amelyekről ismert, hogy szokatlanul gyorsan osztódnak, úgy szabályozzák méretüket, hogy a kisebb sejtek hosszabb időt töltenek a növekedéssel, mielőtt a következő generációs sejteket létrehoznák. A kutatók egyelőre nem tudják, hogy miért van így, és azt sem, hogy pontosan hogyan történik.

A jövőben sejtek térbeli kapcsolatait, sejtjegyek 3D mintázatokká szerveződését, szerkezetek formálódását igyekeznek tanulmányozni, és a címkézett sejtképek hiányát is próbálják megoldani.

A TikTokon máig valótlanságok terjednek a koronavírusról

A TikTok egyedi funkcióit a Covid-19-cel kapcsolatos valótlanságok terjesztésére használták – derül ki Morgan Lundy, az Urbana-Champaign Illinois Egyetem PhD-hallgatójának kutatásából.

A szövegformátumú Twitterrel ellentétben, a TikTok megtévesztő információk észrevételét jelentős mértékben megnehezítő mikrovideó-formátumot használ. Lundy ezért alkalmazott kvalitatív eljárásokat a dezinformáció megjelenési módjának mélyebb megértéséhez.

tiktok_covid.jpg

A TikTokon nagyon gazdag médiakörnyezetben terjed az információ: hang, álló és mozgóképes anyagok, szövegek, testbeszéd, mémek, valamint mindezek kontextusa. Egyszerre hatnak egymásra, létrehozva a megosztásra szánt „jelentést” vagy információt/dezinformációt.

Lundy kettős megközelítést használt: egyrészt algoritmust gyakoroltatott, és hashtag mintavételekkel dolgozott, próbált adatokhoz jutni. másrészt várt kifejezések helyett a „közösségi nyelvet” vizsgálva próbált pontosabb, reprezentatívabb képet kapni a dezinformációról. A TikTok algoritmusok együttműködésen alapuló szűrésének hihetetlen reaktivitása külön kihívás az infodémia megfékezésében – vonta le az egyik legfontosabb következtetést a kutató.

Minél több dezinformációval kerülünk kapcsolatba, annál többet fogunk még látni, és ha csak néhány videót lájkolunk, utána jó eséllyel elmerülünk például az oltással kapcsolatos félretájékoztatásban, mert cunamiként zúdul ránk a félretájékoztatás – hangzik egy másik következtetés.

Kiderült, hogy a dezinformációellenes törekvéseket meghiúsítandó, az oltástagadók szándékosan kódolt nyelvet, hibásan írt szavakat használnak, felcserélik a hashtag-eket. A kutató megállapította, hogy a koronavírussal szkeptikus korábbi anyagok kedvenc témái – az oltóanyag mellékhatásainak parodizálása, az oltóanyag gyártása és jóváhagyása körüli aggodalmak, kormányokkal és vakcina-tartalmakkal kapcsolatos összeesküvés-elméletek, „a Covid-19 nem veszélyes” stb. – a közegészségügyi erőfeszítések ellenére, változatlanul népszerűek.

A kutatás azt is szépen szemlélteti, hogy a vakcinával kapcsolatos félretájékoztatás gyakran tipikus logikai tévedések formájában jelenik meg, azaz egyes információk igazak lehetnek, viszont hamis következtetéseket vonnak le belőlük.

Lundy bizakodik, hogy a dezinformáció TikTokon való terjedésének alapos feltárása segít az egészségügynek. Eddig pozitív visszajelzéseket kapott.

A japán MI-fejlesztők bármilyen gyakorlóadatot használhatnak

Korrekt-e mesterségesintelligencia-modellek tanításához nyilvánosan és törvényesen hozzáférhető adatokat használni? – teszik fel egyre többen és gyakrabban a kérdést.

Japán döntést hozott a témában, amelynek értelmében gépitanulás-mérnökök bármilyen talált, a szellemi jog által védett adatokkal dolgozhatnak. Akkor sem követnek el törvénytelenséget, ha a modellt kereskedelmi célokra használják, mert bármilyen legális célra használható.

szabad_adathasznalat.jpg

A törvény elvileg megtiltja az illegálisan beszerzett, szellemi joggal védett anyagok használatát. Sok adat esetében viszont lényegében nem lehet megállapítani, hogy honnan származnak, így ez a cikkely kvázi betarthatatlan.

A szellemi jogok tulajdonosai nem akadályozhatják meg munkáik „adatelemzésre”, benne MI-modellek gyakoroltatására történő használatát. Egyetlen kivétel van: ha a használat miatt aránytalan kár éri az illetőt.

A szellemi jogra vonatkozó törvényt 2018-ban módosították Japánban, a gépi tanulást célzó felhasználásnak már akkor is elég szabad teret engedtek.

Ellenzéki politikusok a törvény szigorítását javasolták. Képzőművészek és zenészek szintén a szigorítást támogatták, arra hivatkozva, hogy a megélhetésüket fenyegeti, ha az MI engedélyük nélkül gyakorol az alkotásaikon.

A japán döntés azért meglepő, mert a világban más tendenciák látszódnak érvényesülni.

Az Európai Unióban fejlesztők kutatási célra használhatnak jogvédett anyagokat. A még ebben az évben érvénybe lépő MI-törvény megköveteli a generatív mesterséges intelligencián dolgozóktól a gyakorlásra használt jogvédett munkák nyilvánosságra hozását.

Az Egyesült Királyságban szintén csak gyakorlásra használhatók jogvédett anyagok. Az USA szabályozása megengedőbb: „korrekt használat” esetén mindaddig engedély nélkül gyakoroltathatók MI-k jogvédett anyagokon, amíg nem sértik a jogtulajdonos érdekeit. A „korrekt használat” fogalmát viszont pontosan még nem definiálták.

A mesterséges intelligencia egyik valós hosszútávú veszélye

Az MI potenciális veszélyei, az emberiséget kipusztító gépek, a világvége az utóbbi hónapok közbeszédének slágertémája, de a kevésbé végromlás-szerű, viszont azzal ellentétben, aktuális és reális fenyegetést jelentő elfogultság, részrehajlás is sok, a végítéletnél magasabb szakmai szintű vita tárgya.

Andrew Ng, a gépi tanulás egyik legismertebb szaktekintélye az apokalipszisnél reálisabb és elképzelhetőbb hosszútávú veszélyre figyelmeztet. Nem szereti a hipotetikus forgatókönyveket, mert a reális problémákról vonják el a figyelmet, de mégis belemegy egybe, mégpedig azért, mert szinte senki nem foglalkozik az MI ezen aspektusával.

andrew_ng.jpg

Az MI minden bizonnyal olcsóbb lesz, jobban végzi el ugyanazt a feladatot, mint a humán munkaerő jelentős része, akik így többé már nem állítanak elő gazdasági értéket. A folyamat az emberi jogok csökkenéséhez vezethet.

Ma is megfigyelhető egyes országokban, hogy sokan kevéssel járulnak hozzá a gazdasághoz, és az alapvető emberi jogokban (szólásszabadság, oktatáshoz való jog, magánélet védelme, mentesség a hatósági zaklatásoktól) is alig van részük. Természetes erőforrásokban, például olajban dúskáló több állam kevésbé demokratikus, mint a kevesebb erőforrással rendelkezők, hasonló súlyú országok.

Képzeljük el, hogy az állam vezetője külföldi vállalatokkal termelteti ki a legfontosabb nyersanyagokat, értékesíti azokat, és a befolyó anyagiakból a hatalmát fenntartó erőszakszervezeteket működteti. A lakosság zöme szinte semmiféle gazdasági értéket nem generál, a vezetőnek pedig nem áll érdekében az oktatásukkal, biztonságukkal és a jogaikkal foglalkozni.

Ha az MI pár évtized alatt eljut arra a szintre, hogy a lakosság jelentős része miatta nem termel gazdasági értéket, a demokráciákban is csorbulhatnak az emberi jogok – különösen akkor, ha kevesen férnek hozzá az MI-hez, a technológiai hatalom szűk csoporton belül koncentrálódik.

A nagy nyelvmodellek munkára való hatását feltáró elemzésekből kiderül, hogy a ChatGPT miatt állásukat vesztő személyek gyorsan találnak másikat. Az MI viszont olyan gyorsan fejlődik, hogy ez nem lesz mindig így, mert az átképzés és az új munkahelyek teremtésének tempója nem tartja a lépést a technológiáéval.

Az átlagjövedelmek emelkedése hosszú ideje nem követi a munka termelékenységének növekedését. Ha az MI egy szűk elit kezében marad, a folyamat felgyorsul, és drámai helyzetet idézhet elő.

Tömegek tekintenek büszkén a munkájukra, mert látják az értelmét, és tudják: gazdasági értéket teremtenek vele. A felvázolt forgatókönyv megvalósulása esetén, ugyanezen személyek nagy része a termelésben már nem tölt be számottevő szerepet, és úgy érzik, nem fontosak többé.

Hogyan előzhetjük meg ezt?

Ng javaslata az MI-hez való hozzáférés demokratizálása. Két egymáshoz kapcsolódó mód van rá: a technológia árának csökkentése, valamint a lehető legtöbb embernek meg kell tanítani az MI használatát, meg kell érteniük, miről van szó. Ha megtörténik, nagyobb eséllyel állítanak elő értéket, és a technológia pozitívabb jövőbe vezet.

Hamisan vádol csalással diákokat az MI-csalásokat felderítő szoftver

A Davisi Kaliforniai Egyetem (UCD) egyik végzős hallgatóját a plágiumellenőrző Turnitin szoftver csalással gyanúsította. Az illetőnek magát kellett megvédenie, és bizonyítania, hogy nem használt mesterségesintelligencia-chatbotot dolgozata megírásához. Egyébként is stresszes állapotban még stresszesebbé vált, végső osztályzata gyengébb is lett a vártnál.

Később megtudta: nem volt egyedül, mert más diáktársairól is ugyanazt állította a szoftver, és a felsőoktatási intézmény elnézést sem kért tőlük. Bebizonyosodott az igazsága, a nyomozás viszont nyilvántartásban maradt, azaz egy szoftverhiba veszélyeztetheti további pályafutását.

ai_plagiarism.jpg

A történet rávilágít a Turnitin és hasonló programok hibáira. A valódi csalások számának növekedésével párhuzamosan egyre több diákot vádolnak meg igazságtalanul MI segítségével elkövetett plágiummal.

Egy huszonegy éves politológia-hallgató elmondta, hogy az alaptalan vádaskodás elveszi a motivációt, csomó idő megy el feleslegesen, miközben hasznosabb dolgokkal foglalkozhatna, például tanulna.

Az UCD egyik történelem-szakos hallgatóját, miután az MI-detektor GPT-Zero csalással gyanúsította, tanára megbuktatta. Az illető és apja sikeresen végigjárták a kacskaringós felülvizsgálati folyamatot, majd segítettek a hasonló cipőben járó végzős hallgatónak.

A probléma legfőbb oka, hogy ezek a programok nem teljesítenek elég jól abban, amire fejlesztették őket. Független teszteken rengeteg hibát vétenek, de még az OpenAI saját csalásdetektáló alkalmazásának is meggyűlt a baja az ember és az MI által generált szövegek megkülönböztetésében.

Később az UCD közölte, hogy a Turnitin bétaváltozatát használták, mert „korai hozzáférést” kaptak. A fejlesztőcég honlapján közölte, hogy a szoftver a teszteken 98 százalékos pontossággal teljesített, de sajnos előfordulnak hamis pozitívok is. Az OpenAI szintén a honlapján jelentette be, hogy az MI-detektor nem mindig pontos, majd hozzáfűzték: egy dokumentum mesterséges intelligenciával történő generálásának eldöntésekor, a hibás döntést elfogadó bírálóknak mást is kellene használniuk, nem lenne szabad, hogy ezeknek a szoftvereknek a véleménye legyen az egyetlen bizonyíték.          

3D számítógépes grafikával elkészítették Tutanhamon fáraó arcát

Új 3D modellező technikákkal nemzetközi kutatócsoport elkészítette a Krisztus előtt kb. 1342 és 1324 között élt Tutanhamon egyiptomi fáraó koponyájának és lágyszöveteinek a rekonstrukcióját. A rekonstrukció nyilvánosságra hozott adatok és az egyiptológiai irodalom miatt valósulhatott meg. 

Az egyik legismertebb egyiptomi uralkodó végső nyugvóhelye volt az első háborítatlan állapotban megtalált fáraósír. Nyolc-kilenc éves korától mintegy tíz évig uralkodott, az ország történetének egyik legmozgalmasabb, legeseménydúsabb időszakában került trónra.

tutanhamon.jpg

Eredetileg Tutanhatonnak, „Aton élő képmásának” hívták, feltételezett apja, a reformer Ehnaton uralkodásának tizenegyedik évében születhetett. Ehnaton számolta fel a politeizmust, és vezette be a Napisten/napkorong, Aton kultuszát, sokak szerint a monoteizmus egy korai formáját. Egyiptom összes hagyományos istenének imádatát betiltotta.

Az új vallás rövid ideig maradt meg, Tutanhamon utolsó éveire a politeizmust teljesen visszaállították, az uralkodó nevének megváltoztatása, az Aton helyetti Amon a régi istenekhez való visszatérést jelentette.

Tutanhamon pontos külsejéről nem maradt fenn bizonyíték, a rekonstrukcióval viszont többen megpróbálkoztak.

tutanhamon0.jpg

Az első 1983-ban Pat Gatliff törvényszéki művész munkája volt. A fáraó arcát az arról készített röntgenfelvételek alapján alkotott gipszkoponyát használva, rekonstruálta.

A másodikra 2005-ben került sor, ekkor három, egymással összehangolt csapat különböző alkotásait mutatta be az egyiptomi állam. Egy egyiptomi és egy francia csapat tisztában volt a fáraó identitásával, a harmadik, amerikai nem. Az egyiptomiak 3D számítógépes modellezést, a franciák az antropológiai szobrokat készítő Elisabeth Daynes szakértelmét használták, míg az amerikaiak törvényszéki szobrászra hagyatkoztak.

tutanhamon1.jpg

A szobrok az apró különbségek ellenére nagyon hasonlítottak egymásra, és Ehnaton első feleségére, Nofertitire is – nem ő, hanem a jelenlegi feltételezések szerint valószínűleg Ehnaton egyik lánytestvére volt Tutanhamon anyja.

A harmadik rekonstrukció 2022-es. Christian Corbet szobrász tomografikus szkenek alapján készítette el az arc, majd a kutatási eredmények, a szkenek és más adatok felhasználásával a koponya rekonstrukcióját, ezekből pedig úgynevezett 3D-s arc-megközelítést hoztak létre.

Megállapították, hogy a fiatal uralkodónak, valószínűleg genetikai okok miatt, szokatlanul nagyméretű agya volt.

Falcon: nyílt forrású nagy nyelvmodellt fejlesztettek Abu Dhabiban

A szabad kereskedelmi felhasználást engedélyező nyílt forrású licenceknek köszönhetően független fejlesztők, fejlesztőcsoportok is építhetnek akár a nagy techvállalatok termékeivel versenyképes rendszereket. Egy nemrég kiszivárgott Google-feljegyzés szerzője egyenesen a cég üzleti tevékenységét fenyegető jelenségként írt ezekről a nyílt forrású fejlesztésekről.

Az Egyesült Arab Emírségekben, Abu Dhabi Technológiai Innováció Intézetében (TII) pont ilyen, csúcsteljesítményű, nyílt forráskódú nagy nyelvmodellt (large language model, LLM) dolgoztak ki. A neve Falcon (Sólyom), és a szabad kereskedelmi alkalmazásokat engedélyező Apache 2.0 licenccel szerezhető be.

emirsegek.jpg

Eredetileg a TII tízszázalékos „engedélyezési díjat” kért minden olyan felhasználótól, akik egymillió dollárnál több bevételt generálnak a Sólyomra épülő kereskedelmi alkalmazásokkal. Aztán meggondolták magukat, ejtették a korlátozást, és a mostani licenc sokkal engedékenyebb.

A negyvenmilliárd paraméteres modellt arra tanították be, hogy egybillió tokenes szövegben előrejelezze a következő tokent. Architektúrája az OpenAI GPT-3-jához hasonló, néhány eltéréssel, például a kevesebb memóriaigényű algoritmusokat használ egyes következtetésekhez.

Az előzetesen transzformerekkel gyakoroltatott modell négy verziója szerezhető be: az általános rendeltetésű Falcon-40B, a chatre kitalált Falcon-40B-Instruct, a kompaktabb Falcon-7B és a Falcon-7B-Instruct.

A Sólyom komoly előnye, hogy a nyílt forráskódú nagy nyelvmodelleknél, versenytársainál, különösen a legfőbb rivális – Meta-fejlesztés – LLaMA-nál jobb teljesítményre képes, ráadásul a gyakoroltatás költségei alacsonyabbak, és így energiatakarékosabb is.

Az a tény, hogy Abu Dhabiban ilyen nagy nyelvmodellt fejlesztettek, egyértelműen jelzi a terület globálissá válását, hogy a mesterséges intelligenciában egyre több helyen, egyre több tehetség tűnik fel, az Egyesült Államokon és Kínán kívül más országok is felkerültek a generatív MI-világtérképre.

süti beállítások módosítása