Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Hogyan forradalmasítja a mesterséges intelligencia az éttermi ökoszisztémát?

2024. május 14. - ferenck

A mesterséges intelligencia gasztronómiai alkalmazásának a vendég és az étel csak egy része – a hatás a konyhától az irodáig, az egész ökoszisztémát érinti. Például nem kell többé találgatni, mert a precíz MI optimalizál, időt szabadít fel.

Képzeljük el: raktárkészlet-kezelő rendszerünk prediktív analitikát használva elemez múltbéli eladási adatokat, évszakonkénti szokásokat, helyi eseményeket, időjárás-mintákat, és mindezek alapján készít előrejelzéseket, amelyek érvényesítésével jelentősen csökkenthető a vendégek frusztrációja, ha mondjuk, nincs friss spárga.

ettermi_okoszisztema.jpg

A konyhában az MI lehet a „karmester.” Szenzorrendszer valósidőben monitorozza a főzési hőmérsékletet és a gépek teljesítményét, elkészítés előtt figyelmezteti a chefet a kajaminőséget érinthető problémákra. Receptadatbázisokkal összekapcsolt appok jelezhetik, mivel helyettesítsük a rendelkezésre nem álló összetevőket. Más eszközök rendelési minták és a konyhai folyamatok összefüggéseit elemezhetik, kimutatásaikkal például csökkenthető a várakozási időt.

Az MI személyek kezelését szintén optimalizálhatja. Foglalórendszerek prognosztizálják a csúcsidőt, asztalok elrendezését elemzik, segítik a személyzetet vendégek legpraktikusabb ültetésében. Érzelemelemző rendszer a közösségi médián figyeli a visszajelzéseket, trendeket derít fel, kiemeli a változtatásra szorult területeket, döntéshozásban segíti a menedzsmentet.

ettermi_okoszisztema0.jpg

A technológia nem helyettesíti, hanem segíti az embert, a gasztronómiában megvalósul a tényleges ember-gép együttműködés. Következmény: a főszakács szabadabban kísérletezhet, pincérek jobban koncentrálhatnak a vendégre, a vezetés proaktívan kezelheti a személyzet és a vendégek problémáit. Az MI ezúttal nem automatizál, hanem javítja az emberi teljesítményt. A közeljövő étterme ideális esetben a humán és a gépi oldalból is kihozza a legjobbat.

De hogyan optimalizáljuk a mesterséges intelligenciát?

Az MI integrációja nem versenyfutás, hanem gondos tervezéssel, stratégiai implementációval kezdődő út, folyamatos finomításokkal. Első lépésként értékeljük ki jelenlegi rendszereinket, hogy mennyi és milyen adatok gyűjtésére képesek. Csak a hiányosságok azonosítását követően érdemes fejlett MI-eszközökbe fektetni. Nem célszerű rögtön mindent lecserélni, megújítani, hanem fokozatosan, pilotprojekteken keresztül, például a gyakran feltett kérdéseket kezelő chatbottal győződjünk meg hiányokról, korrigálandó dolgokról.

Gondoljunk bele, hogy mit akarunk elérni az MI-vel, és a célokat pontosan megfogalmazva, könnyebb kiválasztani a kivitelezésben hatékony eszközöket (és persze az sem mindegy, hogy kitől vesszük meg azokat). A személyzet végezzen speciális tréningeket, ismerjék meg a technológiát, hogy lássák: az MI az innovációban segít, nem kell félniük állásuk elvesztésétől.

Bevezetése után folyamatosan ellenőrizzük, finomhangoljuk a technológiát, keressünk hozzá esettanulmányokat, és nem utolsósorban, alaposan gondoljuk át a költségeket.

A technológiát gamifikációval (játékosítással) összekapcsolva, izgalmas játékélményként élhetjük meg. Például pluszpontokat kapunk, ha az étlap összeállításakor kilépünk s komfortzónánkból. MI-vel működtetett hűségprogramok választásainkat elemezhetik, jutalmaikkal ízlésünk értékelése mellett a felfedezésre is ösztönözhetnek.

A gamifikáció azonban csak akkor működik, ha opcionális, és ha javítja, nem pedig megszakítja a kulináris élményt. Tágítania kell a vendég preferenciáit, meglepetéselemekkel kell változtatásra késztetnie.

 

Molekuláris gasztronómia mesterséges intelligenciával

A molekuláris gasztronómia vagy a chefek egy része által kísérleti konyhaművészetnek nevezett terület fizikai és kémiai folyamatok gyakorlati szakácstechnikákban történő alkalmazása. Az ételek elkészítését és élvezetét atomok, molekulák és keverékek szintjén, tudományos szemszögből közelíti meg. Alkalmazói egy összetevő molekuláris szerkezetét, tulajdonságait és átalakulásait veszik figyelembe élelmiszeripari termékek elő- és elkészítésénél. (Az elnevezést Kürti Miklós magyar fizikus és a francia Hervé This kémikus találta ki 1988-ban.)   

Amióta létezik molekuláris gasztronómia, mindig a kulináris innováció terepének bizonyult. A mesterséges intelligencia berobbanásával korábban soha nem tapasztalt mértékben foglalkoznak vele, mert enciklopédikus ismereteivel és pontosságával az MI a legjobb szakácssegéd. Az ízek birodalmában elmerült, gépi tanulással okosított algoritmusok a legkreatívabb szakácsok ötleteiben sem szereplő kombinációkkal, például serpenyőben sült Szent Jakab kagyló mangós coulis-szal (sűrű püré vagy mártás) meg hasonlókkal állhatnak elő. Egy részük nyilván nem működik, a többi viszont ismeretlen élményekkel kecsegtet.

molekularis_gasztro0.jpg

Az MI azonban nemcsak új ízek felfedezéséről, hanem meglévő technikák gép nélkül elképzelhetetlen szintre történő fejlesztéséről is szól: mártások tulajdonságait meghatározott hőmérsékleten, meghatározott ideig őrizhetjük meg, mikroszkopikus pontosságú textúra-zsonglőrködést kivitelezhetünk vele. Kiszámítja az ideális főzési időt, összetevő-arányt, és hogy milyen konkrét lépéseket tegyünk pontos kivitelezésükért.

molekularis_gasztro.jpg

Tudományos precizitásával hozzájárul, hogy chefek túllépjenek a megszokott textúrákon, tálaláson. A molekuláris gasztronómia bevett készlettárát, habokat, géleket és gömbösítést a lehetőségek határáig finomít. MI segítségével a fogások nemcsak ínycsiklandózóak, hanem a látvány is magukkal ragad. Egyesek szerint a molekuláris gasztronómia és a mesterséges intelligencia párosa megváltoztatja, tágabbá teszi az „étel”, „élelmiszer” jelentését.

Minden megrendeléssel, diétával, megkötéssel, menüleírással és képekkel folyamatosan online adatokat hagyunk magunk mögött, masszív adatgyűjtő rendszerben tárolva komoly gyakorlóterep MI-modelleknek. Lájkokon és dühös emojikon bőven túllépve, ismerik meg személyes ízlésünket, hogy mire vagyunk allergiásak stb.

Az adatok alapján az MI kulináris valóságunkhoz tökéletesen passzoló ételeket, ételsorokat javasolhat. A pont ránk kialakított kaják elvileg személyiségjogi (privacy) kérdéseket vethetnek fel. Felelős MI-rendszereknél azonban az adatbiztonság elsőbbséget élvez, a fogyasztói élmény növelése, és nem az infóinkkal való visszaélés a cél. Interakcióink visszacsatolási hurkokként (feedback loops) működnek: mi is adhatunk neki inputokat, finomhangolhatjuk az ajánlásait, az algoritmus pedig tanul visszajelzéseinkből.

Mesterséges intelligencia jelez előre tudományos felfedezéseket

A tudomány közösségi törekvés, személyek és munkájuk közötti összefüggések a közösség kollektív figyelmét tükröző gráfként ábrázolhatók. A kollektív figyelem jelzésként működik, ígéretes utakat vetít előre további kutatások számára, és a gépi tanulás is segíthet benne.

A Chicago Egyetem kutatói tudományos felfedezések előrejelzésére dolgoztak ki módszert. Gráfjuk kutatókat, vizsgálódásuk tárgyát és tudományos jellemzőket kapcsolja össze egymással. A megközelítést anyagtudományi adatokon értékelték ki.

tudomanyosfelfedezesek1.jpg

Kutatók érdeklődési körének átfedései olyan területeket jelezhetnek, ahol további kutatások eredményesek lehetnek. Ha például egy csoport A anyagot és P tulajdonságát, egy másik A és B anyagokat, egy harmadik B és C anyagokat vizsgálja, kiderülhet, hogy a C anyag P tulajdonságot mutat.

A kutatók próbálták előrejelezni, hogy egyes szervetlen anyagok mutatnak-e elektromos tulajdonságokat. Munkájuk alapját a 2000-ig publikált tudományos irodalom jelentette. Másfélmillió, százezer szervetlen vegyületet leíró tanulmányból kiszedték a szerzők nevét, a megemlített anyagokat és tulajdonságaikat.

Az adatokat gráf kidolgozására használták fel. A szerzők, az anyagok és a tulajdonságok képezték a csomópontokat. A csomópontokat az ugyanabban az anyagban való megjelenést jelző élek kötötték össze.

A kutatók véletlenszerűen „járták be” a gráfot; szerzők, anyagok és tulajdonságok sorozatait alakították ki belőlük, majd a szerzőket eltüntették, mert főként az anyagok és tulajdonságok közötti lehetséges kapcsolatok létrehozása érdekelte őket. Gépitanulás-modellt tanítottak be szó-beágyazások kiszámítására. Az anyagokat és tulajdonságokat szavakként, a sorozatokat dokumentumokként kezelte. A módszer minden anyaghoz és tulajdonsághoz beágyazást eredményezett.

Felfedezések előrejelzéséhez pontozták az anyagokat. A pontozás egyrészt az anyag és az adott tulajdonság beágyazása közti hasonlóságon, másrészt az anyagokat és a tulajdonságokat összekötő útvonal legkisebb élén alapult, majd a kettő pontszámát összeadták. A legmagasabb pontszámot elért ötven anyagról prognosztizálták, hogy rendelkeznek három tulajdonság valamelyikével.

A modellt 2001 és 2018 közötti anyagokon finomhangolták, és például a termoelektromosságban hetvenhat százalékos pontossággal jelzett előre tényleges felfedezéseket: százból hetvenhatot. A másik két tulajdonsággal is hasonló eredményt értek el. (Alternatív módszerrel negyvennyolc, random találgatással három százalék volt a sikeres előrejelzés.)

Az Amazon újragondolja a pénztáros nélküli boltokat

Az Amazon 2016-ban mutatta be először a Just Walk Out („csak menj ki”) koncepciót/szolgáltatást a Seattle-i Amazon Go kisboltban. A rendszert 2020-ban tovább bővítette (Amazon Fresh), 2020. és 2022 szeptembere között negyvennégy Fresh boltot nyitott az USA-ban, tizenkilencet az Egyesült Királyságban. Legtöbbjük a Just Walk Out alapján működött.

Az Amazon fizikai (nem virtuális) boltjai megszenvedték a Covid-19 világjárványt, így 2022 szeptembere és 2024 májusa között szélesebb körű költségcsökkentési stratégia jegyében, a nagyvállalat egyetlen új élelmiszerboltot sem nyitott.

amazon_10.jpg

Mivel a kiskereskedelem mindinkább az azonnali fogyasztói megelégedésre fókuszál, a „fogd meg és menj” (grab-and-go) vásárlás biztos sikernek tűnt. Az Amazon viszont úgy döntött, hogy (az Amazon Go és néhány kisebb brit Amazon Fresh kivételével) boltjai zömében kivezeti kínálatából a szolgáltatást. A rendszert licencbe adta más kiskereskedőknek, például a Hudson Markets-nek és más „külsős” boltokban is kívánja telepíteni. 

A lépés arra enged következtetni, hogy a megoldás mégsem passzol ezekhez a környezetekhez. A boltosok talán nem alkalmazkodtak könnyen hozzá, megszűntek a pénztárosokkal folytatott interakciók, a vásárlót a számla megnézése nélküli költekezésre serkentette.

A mesterséges intelligencián alapuló szolgáltatást okos vásárlókártyával (Dash Cart) igyekeznek kiváltani.

A Just Walk Out lehetővé tette, hogy belépve a boltba, a rendszernek megadjuk a fizetési módszert, levesszük a polcról a gépi látással és súlyérzékelőkkel követett termékeket, majd a pénztár kihagyásával egyszerűen kisétáljunk velük.

Az Amazon szerint a rendszer nem működik élelmiszerboltokban, ahol általában sok terméket vásárolunk, és mindaddig talán fogalmunk sincs költekezésünk mértékéről, amíg e-mailen meg nem kapjuk a számlát. A Dash Carttal helyben, valósidőben látjuk.

A rendszer ezernél több távmunkában dolgozó alkalmazotton alapult. Ők címkézték fel a gépi tanuláshoz használt videókat, és nézték át azokat az eseteket, amikor hiba csúszott a működésébe. Az Amazon nem tudta gyorsan elvégezni a szükséges változtatásokat, és 2022 közepén már hétszáz személy nézett át ezer vásárlást (húsz-ötven volt az eredeti cél). Azóta állítólag csökkent a szám.

A modellek trenírozásához kétezer technológiai szakember kellett, a gyakorláshoz és a futtatáshoz szükséges felhőszámítási erőforrások többszáz millió dollárba kerültek.

A kamerákat és a szenzorokat meglévő boltokban nehéz telepíteni, gyakran volt szükség masszív átalakításokra. Ráadásul a rendszer magas mennyezeteket igényelt, és nem biztos, hogy minden üzletben ilyenek voltak a plafonok.

Mennyire pontosan válaszolnak nagy nyelvmodellek professzionális szintű lekérdezésekre?

Sok pénzügyi szakember és jogász dokumentumok feldolgozásától kamatlábak előrejelzéséig, változatos célokra használ nagy nyelvmodell-alkalmazásokat. Ezekben az esetekben azonban kitüntetett fontosságú az output felügyelete, mert a tévedések súlyos következményekkel járhatnak.

A mesterséges intelligencia tipikus viszonyítási alapjait (benchmark) az általános ismeretek és a kognitív képességek kiértékelésére találták ki. Sok fejlesztő viszont jobban szeretné valódi üzleti környezetben mérni a modell teljesítményét – olyan esetekben, amikor a speciális ismeretek fontos szerepet játszhatnak.

benchmark.jpg

A független modelltesztelő szolgáltatás, a Vals.AI a nagy nyelvmodellek (LLM) jövedelemadóval, vállalati pénzügyekkel és szerződésjoggal kapcsolatos feladatok végrehajtásában mutatott teljesítményét rangsoroló viszonyítási alapokat dolgozott ki, egy, már meglévő jogi benchmark fenntartásával. A GPT-4 (OpenAI) és a Claude 3 Opus (Anthropic) különösen jól teljesített.

A Vals.AI ranglistái összehasonlítják több népszerű LLM pontosságát, költségeit, gyorsaságát. Az oldalon az eredmények elemzését is megtaláljuk, adatkészleteik viszont nem nyilvánosak.

benchmark0.jpg

A vállalat független szakértőkkel közösen dolgozott ki válasz-feleletes és nyílt kérdéses feladatokat az adott területeken.

A szerződésjog (ContractLaw) kérdései mellett a modelleket szerződések bizonyos feltételek mellett érvényes részeinek lekérdezésére, szerkesztésére, kivonatolására utasítják, majd el kell döntenie, melyik részletek felelnek meg a jogi normáknak.

A CorpFin vállalati pénzügyekre vonatkozó kérdésekre adott feleletek pontosságát teszteli. Nyilvános kereskedelmi hitel-megállapodást ad be a modellnek, majd olyan kérdéseket tesz fel neki, amelyek megválaszolásához előbb információkat kell kinyernie a dokumentumból, utána pedig az infók alapján kell érvelnie.

A TaxEval adózásra vonatkozó promptokon teszteli a modell pontosságát. A kérdések felével az adóköteles jövedelem kiszámítását és hasonló készségeket vizsgál, másik fele olyan ismeretekkel foglalkozik, mint különféle könyvelési módszerek adókra gyakorolt hatása, adók alkalmazása változatos eszköztípusokra.

A Vals.AI a jogi érvelést kiértékelő nyílt benchmark LegalBench-en nyújtott teljesítményüket is nyomon követi.

Április 11-én tizenöt modell közül a GPT-4 és a Claude 3 Opus teljesített legjobban. Előbbi a CorpFin és a TaxEval kategóriákban (64,8 és 54,5 százalékos pontossággal), utóbbi a másik kettőben (a GPT-4-t éppen csak megelőzve, 74 és 77,7 százalékos pontossággal) diadalmaskodott. Háromban a kisebb Claude 3 Sonnet lett a harmadik, míg LegalBench kategóriában a Google Gemini Pro 1.0-ja végzett a dobogó harmadik fokán.          

Többmilliárd Intel- és AMD-processzor van veszélyben

A San Diegoi Kaliforniai Egyetem és más amerikai felsőoktatási intézmények, valamint ipari vállalatok kutatóiból álló csoport két új támadásfajtát azonosított. Célpontjuk a csúcs-processzorokban található feltételes elágazás-előrejelzők. A támadásokkal többmilliárd használatban lévő processzor veszélyeztethető, bizalmas adatok kerülhetnek nyilvánosságra velük.

Az elágazás-előrejelző digitális áramkör a számítógép architektúrában; megpróbálja kitalálni, hogy egy ág (például egy „ha-akkor-más” szerkezet) milyen irányban halad, mielőtt végleg ismertté válna. Rendeltetése az utasítás-áramlás javítása,

hacking.jpg

Jelen esetben az útvonal-történeti regiszter (Path History Register, PHR) nevű elágazás-előrejelzőt támadják. Mivel a PHR az elágazás-rendet és az elágazás-címeket egyaránt nyilvántartja, több információ és nagyobb pontossággal van kitéve hackereknek.

A kutatók sikeresen rögzítettek több tízezer ágból álló sorozatokat pontos sorrendben, és a módszerrel titkos képeket szivárogtattak ki feldolgozás közben a széles körben ismert libjpeg képkönyvtárból.

Kivételesen pontos, Spectre-típusú (a modern processzorok spekulatív végrehajtását kihasználó) mérgezéses támadást is azonosítottak. A támadó számára lehetővé válik a téves ágelőrejelzések bonyolult mintázatainak áldozatkódon belüli kivitelezése. A manipuláció nem tervezett kódútvonalak végrehajtására késztetheti az így bizalmas adatait véletlenül felfedő áldozatot.

Míg a korábbi támadások egyetlen ágat vagy egy ág első példányát irányíthatták félre, és mindezt többször hajtották végre, hogy sikerüljön, addig az újhoz olyan pontos a kivitelezés, hogy akár egy ág többezer alkalommal használt, 732. példánya is félreirányítható.

Az Intelt és az AMD-t értesítették a biztonsági felfedezésekről, és a két vállalat dolgozik a probléma megoldásán.

Mesterséges intelligencia a gyártásban

Az utóbbi másfél évben a generatív mesterséges intelligencia vált a legfontosabb infokom technológiává. A felhasználók száma napról napra nő, köztük egyre több gyártócég is alkalmazza, vezetőik optimisták. Az MIT (Massachusetts Institute of Technology) friss felméréséből kiderült, hogy az MI-fejlesztésekkel kapcsolatos ambíciók erősebbek a gyártószektorban, mint a többi ágazatok zömében.

A teljesen automatizált intelligens gyár integráns részét látják benne, növeli a termék- és folyamat-innovációt, csökkenti a gyártási ciklus időtartamát és a széndioxid-kibocsátást, hatékonyabbá tesz eszközöket és folyamatokat, eredményesebb lesz tőle a karbantartás és a biztonság – állítja sok gyártó.

mi_gyartas2.jpg

A felmérés készítői azt vizsgálták, hogy gyártók hogyan profitálnak MI esettanulmányokból. A szektor mesterséges intelligenciával valamilyen szinten dolgozó háromszáz képviselője vett részt benne.

64 százalékuk kutatásokat vagy kísérleteket végez vele, 35 százalék már a gyártásban hasznosítja. Sokan kijelentették, hogy a következő két évben szignifikáns mértékben növelni igyekeznek MI-kiadásaikat. Akik még nem alkalmazzák a gyártásban, fokozatosan vezetik be.

mi_gyartas0.jpg

Az MI méretezésének (skálázásának) a tehetség, a készségek és az adatok hiánya a legfőbb hátráltatói. Minél közelebb kerül a cég a gyártáshoz, annál markánsabbak ezek a problémák. A nem megfelelő adatminőség és szervezés szintén megnehezíti sikeres felhasználási esetek kidolgozását.

mi_gyartas1.jpg

A legnagyobb cégek költik a legtöbbet, és az ő elvárásaik is a legmagasabbak. A mérnöki és tervezői területen a vezetők 58, gyári folyamatoknál 43 százaléka szerint a következő két évben cégük több mint 10 százalékkal növeli MI-költéseit.

Az MI miatti óhajtott nyereségek gyártási funkciókként változnak. A terméktervezés, a beszélgető MI és a tartalomkészítés a leggyakoribb felhasználási esetek, de a tudásmenedzsment és a minőség-ellenőrzés szintén fontosak.

mi_gyartas2_1.jpg

Ha nincsenek megfelelő adatalapok, akadozhat a méretezés. A nem adekvát adatminőséget a megkérdezettek 57, a gyenge adatintegrációt 56, a rossz irányítást 47 százaléka említette, és csak minden ötödik megkérdezett rendelkezik meglévő MI-modellekben való használatra kész gyártóeszközökkel. Minél nagyobb a gyártó, annál problémásabbak a nem megfelelő adatok.

A méretezéshez a töredezettséget is kezelni kell. A gyártók többsége szerint az adatarchitektúra, az infrastruktúra és a folyamatok modernizálása nélkül nem megy az MI-alkalmazás. Az adatrendszerek mérnökök, tervezők és a gyár közötti interoperabilitásának javítása szintén kulcsfontosságú.

Közeleg a szövegből zenét készítő mesterséges intelligencia áttörése?

A korábbi szövegből zenét (text-to-music) generáló eszközöket viszonylag kötetlen formájú instrumentális kompozíciókra, és kevésbé dalokra, szerkesztett versekre, kórusokra, vokálokra tervezték.

Az áprilisban kiadott Stable Audio 2 maximum háromperces hangszeres számokat generál, jól megkülönböztethető nyitánnyal, középső résszel és befejezéssel. A felhasználó feltölthet audio track-eket, és a modellel módosíthat rajtuk.

hanggeneratorok.jpg

A szövegből képeket gyártó egy évvel ezelőtti modellekhez hasonlóan, a mostani szöveg-zene generátoroknál is nehezen irányítható az output. Alig reagálnak alapvető terminológiákra (tempó, harmónia stb.), és általános stílusokat kérnek, mint például az utóbbi ötven évben igencsak sok változáson átment, alstílusokban bővelkedő pop.

Hiteles dalokat előállító modellek megjelenésével eljöhet az audió MI-k „Midjourney pillanata”: a felhasználók széles köre jön rá, hogy a modell promptokra személyes igényeinek, ízlésének megfelelő muzsikát tud előállítani.

hanggeneratorok0.jpg

Az Udio webalapú generátora bevásárlóközponti háttérzenétől heavy metalig változatos stílusokban alkot. A 2023 végétől szolgáltató Sumo hasonló, nemrég frissítették a kínálatát.

Mindkettő promptokból teljes zenekaros anyagokat, promptonként kettőt generál, dalszövegekkel, énekkel, hangszer-szólókkal. A felhasználó létrehozhat vele szövegeket, sajátját is feltöltheti, letöltheti, megoszthatja másokkal az outputot.

A lejátszás és a lájkok száma alapján ranglisták készülnek róluk.

Az Udio regisztrált felhasználói maximum havi 1200 dalt generálhatnak ingyen. A szöveges utasítás mellett meg kell adniuk a stílust is. A rendszer automatikusan leírásokkal helyettesíti művészek neveit, és a kimenetek gyakran egy az egyben úgy hangzanak, mintha a kért zenészek munkái lennének.

A modell 33 másodperces hangszegmenseket generál, amelyeket meghosszabbíthatunk, remixelhetünk, módosíthatunk. A cég semmit nem árult el a mögöttes technológiáról.

A Sumo felhasználói napi tíz dalt generálhatnak ingyen. Megadjuk a promptot, mire a rendszer maximum kétperces anyaggal áll elő. Külön utasításokban specifikálhatjuk a szöveget, stílust, címet. Valódi művészek nevét tartalmazó promptból Sumo nem generál zenét, és a technológiáról sincs infónk.

Bajban van a Stability AI

A Stable Diffusion szövegből képet generáló mesterségesintelligencia-modell mögötti, London-székhelyű Stability AI húsz alkalmazottat bocsátott el egy nappal azt követően, hogy bejelentették: bővítik a zászlóshajónak számító modellhez való hozzáférést. Mindez az alapító-vezérigazgató Emad Mostaque márciusi távozása utáni többhetes belső feszültség közben történt.

A húsz alkalmazott a vállalat munkaerejének kb. tíz százalékát jelenti, tehát jelentős létszámcsökkentésről beszélhetünk.

stability_ai.jpg

A két ideiglenes vezérigazgató Shan Shan Wong és Christian LaForte elmondta: az elbocsátási hullám a költségek csökkentését, a befektetők és partnerek támogatásának megerősítését, az innovatív termékek további megjelenéséhez vezető fejlesztéseket célzó stratégiai terv része volt.

Arról nem nyilatkoztak, mely részlegeket „karcsúsították.” A leépítés nem meglepő az elmúlt hónapok eseménylavinája után. Az egykori vezérigazgató önkéntes távozását ugyanis több ismert kutatóé előzte meg. Mostaque a vezetőtanácsban betöltött szerepéről is lemondott. A decentralizált MI területén szeretné folytatni kutatásait – nyilatkozta.

Pedig a cég az egyik legismertebb képgeneráló termék mögött áll, a generatív MI-forradalom kezdetétől jelen voltak, az alapmodelleket fejlesztő vállalatok közül viszont ők az elsők, akik csökkentik munkaerejük létszámát. A Stable Diffusion új verziója mellett, a Stable Diffusion 3-hoz való hozzáférési kört bővítették, és egyben bejelentették a szöveget zenévé alakító Stable Audio új változatát is.

Eközben jogi eljárások is várnak rájuk. Az OpenAI-hoz hasonlóan, ellenük is szerzői joggal védett anyagok modelljeik tanítására való felhasználása a vád. A Getty Images már tavaly beadta a keresetet, az ügy most jut bírósági szakaszba.   

Generatív mesterséges intelligencia és az avatárok

Az avatárokat eredetileg virtuális világbeli alteregóinknak tervezték, mára viszont a közösségi médiától a virtuális valóságon keresztül a populáris kultúráig, szinte mindenhol megjelentek.

K-pop zenekarok koncerteznek a tagok digitális hasonmásával, vagy már hasonmások sincsenek, csak teljesen virtuális, MI által generált lánycsapatok, mint a szintén dél-koreai MAVE.

avatarok.jpg

A Meta MI Híresség Avatárok gyűjteményének virtuális karakterei valódi celebeket utánoznak, a felhasználók úgy folytathatnak interakciókat kedvenc sztárjaikkal, mint influenszerekkel a valóságban.

Az avatárok térhódítása egyértelműen jelzi a technológia rugalmasságát, és leginkább azt, hogy életünk mennyire fontos szereplőivé váltak. A digitális interakciók napi rutinná alakulásával, az avatárok személyeknek és márkáknak is új önkifejezési módokat kínálnak, újszerűen kapcsolódhatnak másokhoz a folyamatosan változó online közegben.

avatarok0.jpg

És ez csak a jéghegy csúcsa, mert az „avatarizáció” transzformatív lehetőségeit a VR, az AR, a mélytanulás és az MI további fejlődésével fogják csak igazán kihasználni. Az állandó technológiai innovációkkal a realizmus és funkcionalitás soha nem látott szintjét elérve, egyre elenyészőbb lesz a valóság és a virtuális világ közti különbség.

Márkáknak nemcsak megfigyelni kell a közeget, hanem proaktívan fel kell lépniük marketing és technológia metszéspontján, hogy az ügyfél élménye még elementárisabb legyen. Az avatárok tökéletesek erre a szerepre. Digitális személyek megjeleníthetik az adott márka identitását, hagyományos maszkotokhoz vagy szóvivőkhöz hasonlóan, a brand jelképévé válhatnak. A Wendy’s és a KFC például különféle, a Fortnite és az Instagram felhasználóira rezonáló személyiséget találtak ki avatárjaiknak.

avatarok1.jpg

A nagy változást az MI jelenti: avatárok úgy taníthatók, hogy minél jobban megjelenítsék a cég legfontosabb értékeit. Ezzel nemcsak az interakcióik hitelesebbek, hanem a brand változatos platformokon való megjelenítése is konzisztens. Maga a cég kezeli az integritása megőrzésében hatékonyan segítő avatárokat, tehát nem függenek külső influenszerektől, más – „közvetítő” – vállalatoktól.

Az avatárok érintkezési pontok a fogyasztóval, erősítik benne a márka iránti elkötelezettséget. A Nike a Robloxon futó Nikeland-je exkluzív digitális termékeket kínál avatárokkal, a Coca-Cola kínai metaverzum-kampányának részeként a felhasználók saját Coca-Cola avatárokat készíthetnek, virtuális tereket fedezhetnek fel velük, ahol vásárolhatnak, játszhatnak, hírességekkel találkozhatnak.

Az avatárokban rejlő lehetőségek azonban túlmutatnak a rövid taktikai kampányokon. A fogyasztó márka iránti hűségének őrzőivé válnak, és a generatív MI-nek hála 24/7-ben képesek konzisztens tartalommal megtölteni az interakciókat, tanulnak is belőlük. Ajánlásaik személyesebbek lesznek, karakterüket mindinkább az adott felhasználó preferenciáihoz igazítják.

Átírják a felhasználói élményt, a brand digitális arcaként interaktív érintkezési pontként funkcionálnak.

A márkaélmény kiterjesztésének hatékony eszközeként megjelennek a fizikai világban is, innovatív módon lépnek interakcióba az ügyfelekkel. Az Ikea dolgozott már virtuális influenszerrel boltjaiban, más avatárok divatheteken tűnnek fel.

Az MI és az adatelemzés avatárokba integrálásával egyre több hasonlóra számíthatunk.

süti beállítások módosítása