Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Hogyan változtatja meg a mesterséges intelligencia az egészségügyet?

2024. május 16. - ferenck

Az egészségügy a mesterséges intelligencia egyik leglátványosabb és legnagyobb hatású alkalmazási területe. A képelemzés, radiológiai képek kiértékelése volt az első komoly áttörés, azóta az adminisztrációtól a gyógyszertervezésig ma már a gyógyítás számos szegmensében használják a technológiacsaládot.

MI nélkül nem lehetne automatizálni munkafolyamatokat. Az automatizációval leegyszerűsödik az adminisztráció, komoly terhet vesz le orvosok és ápolók válláról. MI-modell automatizálja a napi betegfelvételek kódolását, beszélgetéseket hasznos dokumentumokká alakít és így tovább.

mi_egeszsegugy0.jpg

A robotizáció is csak mesterséges intelligenciával megy, például léteznek és működnek már automatikus vérvételi eszközök. Először tartottak a páciensek negatív reakcióitól, az első tesztek azonban sikeresnek bizonyultak, megszűnt a félelem, pozitívan viszonyultak a technológiához.

Robotokat azonban nemcsak vérvételre használnak. Egy kínai gép fogbeültetésnél segédkezik. A Big Tech vállalatai humanoidokkal kísérleteznek: az Nvidia multimodális inputokkal gyakoroltatja őket, a Tesla Optimusa több funkcióra lehet alkalmas, az OpenAI és a Figure közös fejlesztésű kétlábú gépeit szintén bevethetik az egészségügyben.

mi_egeszsegugy.jpg

Szükség lesz rájuk, mert a kórházak és más intézmények személyzetének létszáma folyamatosan csökken. A robotokkal azonban több a feladat is: a befektetés mellett telepíteni, karban kell tartani, gyakoroltatni kell őket, és a tanuláshoz is plusztérre van szükségük.

Az MI a gyógyszeriparban, új gyógyszerek fejlesztésében szintén komoly szerepet fog játszani. A DeepMind AlphaFold algoritmusa kétszázmillió fehérje szerkezetét tárta fel egy év leforgása alatt. A fehérjék hajtogatási módja meghatározza, hogy mit tesznek, milyen más molekulákkal lépnek majd kapcsolatba.

A medicina egyik célja egyes molekulák blokkolása vagy stimulálása, ami a fehérjehajtogatás módszerének ismerete nélkül nem megy. Az utóbbi öt évtizedben, változatos technikákkal többszázezer fehérjeszerkezetet térképeztek fel.

Aztán jött a DeepMind AlphaFold modellje, és hatszázmilliónál több fehérjeszerkezet hajtogatásáról készített részletes előrejelzéseket. Sikere miatt az elvárások óriásiak, mert mesterséges intelligenciával gyorsabban, könnyebben és olcsóbban tesztelhetők ígéretes molekulakombinációk új gyógyszerekhez.

Robotika a jövő konyhájában

A mesterséges intelligencia mellett részben az MI fizikai megvalósításának is tekinthető technológia, a robotika szintén komoly hatással lesz a jövő gasztronómiájára, vendéglátására. A kettő tökéletesen kiegészíti egymást.

Robotok már ma is végeznek konyhai munkákat: fejlett karok pontosan vágnak apróra zöldségeket, burgereket rendeznek el, de bonyolultabb ételeknél is besegítenek. Ismétlődő feladatokban kiválóan, konzisztensen és fáradhatatlanul teljesítenek. Séfeket nem fognak helyettesíteni, nem az a rendeltetésük, viszont egyre fontosabb részfeladatokhoz ideálisak.

robot_konyha.jpg

Robotpincérrel Magyarországon is találkozhattunk már, leadhattuk neki a rendelést, asztalhoz vitte az ételt. Szenzorokat és MI-t használva tájékozódnak a zsúfolt térben, de túl a hatékonyságon, újdonságelemet és szórakoztatást is visznek a kulináris élménybe. Egyes robotok alapbeszélgetésre, zenelejátszásra szintén képesek.

Éttermi robotok ritkán működnek mesterséges intelligencia nélkül. Algoritmusok segítik őket a tapasztalatokból való tanulásban, útvonal-optimalizálásban, rendelések pontos feldolgozásában. Hamarosan gyakorolhatnak is, mozgásukat MI-rendszerek elemzik, és a nagyobb pontosság végett javasolják majd nekik, min és miként finomítsanak.

Azonban az ő esetükben se felejtsük el, hogy „csupán” eszközök szakértő profik kezében. Ők sem nyugdíjazzák a séfeket, pincéreket és a többi vendéglátóipari alkalmazottat. Okosan implementálva, a személyzet helyett elvégzik az ismétlődő és unalmas feladatokat, míg a humán munkaerő a kreatívabbakra fókuszálhat, amelyekben hangsúlyos a robotok által kivitelezhetetlen problémamegoldás.

A robotika éttermi alkalmazása izgalmas élményekkel kecsegtet, viszont a teljesen ember nélküli, csak robotokból álló vendéglátóipari egységek több problémát vetnek fel, mint amennyit orvosolnak. Nem mosolyognak az étel szervírozásakor, tapasztalt sommelierként sem tudnak tanácsot adni, nincs bennük empátia.

Hogyan forradalmasítja a mesterséges intelligencia az éttermi ökoszisztémát?

A mesterséges intelligencia gasztronómiai alkalmazásának a vendég és az étel csak egy része – a hatás a konyhától az irodáig, az egész ökoszisztémát érinti. Például nem kell többé találgatni, mert a precíz MI optimalizál, időt szabadít fel.

Képzeljük el: raktárkészlet-kezelő rendszerünk prediktív analitikát használva elemez múltbéli eladási adatokat, évszakonkénti szokásokat, helyi eseményeket, időjárás-mintákat, és mindezek alapján készít előrejelzéseket, amelyek érvényesítésével jelentősen csökkenthető a vendégek frusztrációja, ha mondjuk, nincs friss spárga.

ettermi_okoszisztema.jpg

A konyhában az MI lehet a „karmester.” Szenzorrendszer valósidőben monitorozza a főzési hőmérsékletet és a gépek teljesítményét, elkészítés előtt figyelmezteti a chefet a kajaminőséget érinthető problémákra. Receptadatbázisokkal összekapcsolt appok jelezhetik, mivel helyettesítsük a rendelkezésre nem álló összetevőket. Más eszközök rendelési minták és a konyhai folyamatok összefüggéseit elemezhetik, kimutatásaikkal például csökkenthető a várakozási időt.

Az MI személyek kezelését szintén optimalizálhatja. Foglalórendszerek prognosztizálják a csúcsidőt, asztalok elrendezését elemzik, segítik a személyzetet vendégek legpraktikusabb ültetésében. Érzelemelemző rendszer a közösségi médián figyeli a visszajelzéseket, trendeket derít fel, kiemeli a változtatásra szorult területeket, döntéshozásban segíti a menedzsmentet.

ettermi_okoszisztema0.jpg

A technológia nem helyettesíti, hanem segíti az embert, a gasztronómiában megvalósul a tényleges ember-gép együttműködés. Következmény: a főszakács szabadabban kísérletezhet, pincérek jobban koncentrálhatnak a vendégre, a vezetés proaktívan kezelheti a személyzet és a vendégek problémáit. Az MI ezúttal nem automatizál, hanem javítja az emberi teljesítményt. A közeljövő étterme ideális esetben a humán és a gépi oldalból is kihozza a legjobbat.

De hogyan optimalizáljuk a mesterséges intelligenciát?

Az MI integrációja nem versenyfutás, hanem gondos tervezéssel, stratégiai implementációval kezdődő út, folyamatos finomításokkal. Első lépésként értékeljük ki jelenlegi rendszereinket, hogy mennyi és milyen adatok gyűjtésére képesek. Csak a hiányosságok azonosítását követően érdemes fejlett MI-eszközökbe fektetni. Nem célszerű rögtön mindent lecserélni, megújítani, hanem fokozatosan, pilotprojekteken keresztül, például a gyakran feltett kérdéseket kezelő chatbottal győződjünk meg hiányokról, korrigálandó dolgokról.

Gondoljunk bele, hogy mit akarunk elérni az MI-vel, és a célokat pontosan megfogalmazva, könnyebb kiválasztani a kivitelezésben hatékony eszközöket (és persze az sem mindegy, hogy kitől vesszük meg azokat). A személyzet végezzen speciális tréningeket, ismerjék meg a technológiát, hogy lássák: az MI az innovációban segít, nem kell félniük állásuk elvesztésétől.

Bevezetése után folyamatosan ellenőrizzük, finomhangoljuk a technológiát, keressünk hozzá esettanulmányokat, és nem utolsósorban, alaposan gondoljuk át a költségeket.

A technológiát gamifikációval (játékosítással) összekapcsolva, izgalmas játékélményként élhetjük meg. Például pluszpontokat kapunk, ha az étlap összeállításakor kilépünk s komfortzónánkból. MI-vel működtetett hűségprogramok választásainkat elemezhetik, jutalmaikkal ízlésünk értékelése mellett a felfedezésre is ösztönözhetnek.

A gamifikáció azonban csak akkor működik, ha opcionális, és ha javítja, nem pedig megszakítja a kulináris élményt. Tágítania kell a vendég preferenciáit, meglepetéselemekkel kell változtatásra késztetnie.

 

Molekuláris gasztronómia mesterséges intelligenciával

A molekuláris gasztronómia vagy a chefek egy része által kísérleti konyhaművészetnek nevezett terület fizikai és kémiai folyamatok gyakorlati szakácstechnikákban történő alkalmazása. Az ételek elkészítését és élvezetét atomok, molekulák és keverékek szintjén, tudományos szemszögből közelíti meg. Alkalmazói egy összetevő molekuláris szerkezetét, tulajdonságait és átalakulásait veszik figyelembe élelmiszeripari termékek elő- és elkészítésénél. (Az elnevezést Kürti Miklós magyar fizikus és a francia Hervé This kémikus találta ki 1988-ban.)   

Amióta létezik molekuláris gasztronómia, mindig a kulináris innováció terepének bizonyult. A mesterséges intelligencia berobbanásával korábban soha nem tapasztalt mértékben foglalkoznak vele, mert enciklopédikus ismereteivel és pontosságával az MI a legjobb szakácssegéd. Az ízek birodalmában elmerült, gépi tanulással okosított algoritmusok a legkreatívabb szakácsok ötleteiben sem szereplő kombinációkkal, például serpenyőben sült Szent Jakab kagyló mangós coulis-szal (sűrű püré vagy mártás) meg hasonlókkal állhatnak elő. Egy részük nyilván nem működik, a többi viszont ismeretlen élményekkel kecsegtet.

molekularis_gasztro0.jpg

Az MI azonban nemcsak új ízek felfedezéséről, hanem meglévő technikák gép nélkül elképzelhetetlen szintre történő fejlesztéséről is szól: mártások tulajdonságait meghatározott hőmérsékleten, meghatározott ideig őrizhetjük meg, mikroszkopikus pontosságú textúra-zsonglőrködést kivitelezhetünk vele. Kiszámítja az ideális főzési időt, összetevő-arányt, és hogy milyen konkrét lépéseket tegyünk pontos kivitelezésükért.

molekularis_gasztro.jpg

Tudományos precizitásával hozzájárul, hogy chefek túllépjenek a megszokott textúrákon, tálaláson. A molekuláris gasztronómia bevett készlettárát, habokat, géleket és gömbösítést a lehetőségek határáig finomít. MI segítségével a fogások nemcsak ínycsiklandózóak, hanem a látvány is magukkal ragad. Egyesek szerint a molekuláris gasztronómia és a mesterséges intelligencia párosa megváltoztatja, tágabbá teszi az „étel”, „élelmiszer” jelentését.

Minden megrendeléssel, diétával, megkötéssel, menüleírással és képekkel folyamatosan online adatokat hagyunk magunk mögött, masszív adatgyűjtő rendszerben tárolva komoly gyakorlóterep MI-modelleknek. Lájkokon és dühös emojikon bőven túllépve, ismerik meg személyes ízlésünket, hogy mire vagyunk allergiásak stb.

Az adatok alapján az MI kulináris valóságunkhoz tökéletesen passzoló ételeket, ételsorokat javasolhat. A pont ránk kialakított kaják elvileg személyiségjogi (privacy) kérdéseket vethetnek fel. Felelős MI-rendszereknél azonban az adatbiztonság elsőbbséget élvez, a fogyasztói élmény növelése, és nem az infóinkkal való visszaélés a cél. Interakcióink visszacsatolási hurkokként (feedback loops) működnek: mi is adhatunk neki inputokat, finomhangolhatjuk az ajánlásait, az algoritmus pedig tanul visszajelzéseinkből.

Mesterséges intelligencia jelez előre tudományos felfedezéseket

A tudomány közösségi törekvés, személyek és munkájuk közötti összefüggések a közösség kollektív figyelmét tükröző gráfként ábrázolhatók. A kollektív figyelem jelzésként működik, ígéretes utakat vetít előre további kutatások számára, és a gépi tanulás is segíthet benne.

A Chicago Egyetem kutatói tudományos felfedezések előrejelzésére dolgoztak ki módszert. Gráfjuk kutatókat, vizsgálódásuk tárgyát és tudományos jellemzőket kapcsolja össze egymással. A megközelítést anyagtudományi adatokon értékelték ki.

tudomanyosfelfedezesek1.jpg

Kutatók érdeklődési körének átfedései olyan területeket jelezhetnek, ahol további kutatások eredményesek lehetnek. Ha például egy csoport A anyagot és P tulajdonságát, egy másik A és B anyagokat, egy harmadik B és C anyagokat vizsgálja, kiderülhet, hogy a C anyag P tulajdonságot mutat.

A kutatók próbálták előrejelezni, hogy egyes szervetlen anyagok mutatnak-e elektromos tulajdonságokat. Munkájuk alapját a 2000-ig publikált tudományos irodalom jelentette. Másfélmillió, százezer szervetlen vegyületet leíró tanulmányból kiszedték a szerzők nevét, a megemlített anyagokat és tulajdonságaikat.

Az adatokat gráf kidolgozására használták fel. A szerzők, az anyagok és a tulajdonságok képezték a csomópontokat. A csomópontokat az ugyanabban az anyagban való megjelenést jelző élek kötötték össze.

A kutatók véletlenszerűen „járták be” a gráfot; szerzők, anyagok és tulajdonságok sorozatait alakították ki belőlük, majd a szerzőket eltüntették, mert főként az anyagok és tulajdonságok közötti lehetséges kapcsolatok létrehozása érdekelte őket. Gépitanulás-modellt tanítottak be szó-beágyazások kiszámítására. Az anyagokat és tulajdonságokat szavakként, a sorozatokat dokumentumokként kezelte. A módszer minden anyaghoz és tulajdonsághoz beágyazást eredményezett.

Felfedezések előrejelzéséhez pontozták az anyagokat. A pontozás egyrészt az anyag és az adott tulajdonság beágyazása közti hasonlóságon, másrészt az anyagokat és a tulajdonságokat összekötő útvonal legkisebb élén alapult, majd a kettő pontszámát összeadták. A legmagasabb pontszámot elért ötven anyagról prognosztizálták, hogy rendelkeznek három tulajdonság valamelyikével.

A modellt 2001 és 2018 közötti anyagokon finomhangolták, és például a termoelektromosságban hetvenhat százalékos pontossággal jelzett előre tényleges felfedezéseket: százból hetvenhatot. A másik két tulajdonsággal is hasonló eredményt értek el. (Alternatív módszerrel negyvennyolc, random találgatással három százalék volt a sikeres előrejelzés.)

Az Amazon újragondolja a pénztáros nélküli boltokat

Az Amazon 2016-ban mutatta be először a Just Walk Out („csak menj ki”) koncepciót/szolgáltatást a Seattle-i Amazon Go kisboltban. A rendszert 2020-ban tovább bővítette (Amazon Fresh), 2020. és 2022 szeptembere között negyvennégy Fresh boltot nyitott az USA-ban, tizenkilencet az Egyesült Királyságban. Legtöbbjük a Just Walk Out alapján működött.

Az Amazon fizikai (nem virtuális) boltjai megszenvedték a Covid-19 világjárványt, így 2022 szeptembere és 2024 májusa között szélesebb körű költségcsökkentési stratégia jegyében, a nagyvállalat egyetlen új élelmiszerboltot sem nyitott.

amazon_10.jpg

Mivel a kiskereskedelem mindinkább az azonnali fogyasztói megelégedésre fókuszál, a „fogd meg és menj” (grab-and-go) vásárlás biztos sikernek tűnt. Az Amazon viszont úgy döntött, hogy (az Amazon Go és néhány kisebb brit Amazon Fresh kivételével) boltjai zömében kivezeti kínálatából a szolgáltatást. A rendszert licencbe adta más kiskereskedőknek, például a Hudson Markets-nek és más „külsős” boltokban is kívánja telepíteni. 

A lépés arra enged következtetni, hogy a megoldás mégsem passzol ezekhez a környezetekhez. A boltosok talán nem alkalmazkodtak könnyen hozzá, megszűntek a pénztárosokkal folytatott interakciók, a vásárlót a számla megnézése nélküli költekezésre serkentette.

A mesterséges intelligencián alapuló szolgáltatást okos vásárlókártyával (Dash Cart) igyekeznek kiváltani.

A Just Walk Out lehetővé tette, hogy belépve a boltba, a rendszernek megadjuk a fizetési módszert, levesszük a polcról a gépi látással és súlyérzékelőkkel követett termékeket, majd a pénztár kihagyásával egyszerűen kisétáljunk velük.

Az Amazon szerint a rendszer nem működik élelmiszerboltokban, ahol általában sok terméket vásárolunk, és mindaddig talán fogalmunk sincs költekezésünk mértékéről, amíg e-mailen meg nem kapjuk a számlát. A Dash Carttal helyben, valósidőben látjuk.

A rendszer ezernél több távmunkában dolgozó alkalmazotton alapult. Ők címkézték fel a gépi tanuláshoz használt videókat, és nézték át azokat az eseteket, amikor hiba csúszott a működésébe. Az Amazon nem tudta gyorsan elvégezni a szükséges változtatásokat, és 2022 közepén már hétszáz személy nézett át ezer vásárlást (húsz-ötven volt az eredeti cél). Azóta állítólag csökkent a szám.

A modellek trenírozásához kétezer technológiai szakember kellett, a gyakorláshoz és a futtatáshoz szükséges felhőszámítási erőforrások többszáz millió dollárba kerültek.

A kamerákat és a szenzorokat meglévő boltokban nehéz telepíteni, gyakran volt szükség masszív átalakításokra. Ráadásul a rendszer magas mennyezeteket igényelt, és nem biztos, hogy minden üzletben ilyenek voltak a plafonok.

Mennyire pontosan válaszolnak nagy nyelvmodellek professzionális szintű lekérdezésekre?

Sok pénzügyi szakember és jogász dokumentumok feldolgozásától kamatlábak előrejelzéséig, változatos célokra használ nagy nyelvmodell-alkalmazásokat. Ezekben az esetekben azonban kitüntetett fontosságú az output felügyelete, mert a tévedések súlyos következményekkel járhatnak.

A mesterséges intelligencia tipikus viszonyítási alapjait (benchmark) az általános ismeretek és a kognitív képességek kiértékelésére találták ki. Sok fejlesztő viszont jobban szeretné valódi üzleti környezetben mérni a modell teljesítményét – olyan esetekben, amikor a speciális ismeretek fontos szerepet játszhatnak.

benchmark.jpg

A független modelltesztelő szolgáltatás, a Vals.AI a nagy nyelvmodellek (LLM) jövedelemadóval, vállalati pénzügyekkel és szerződésjoggal kapcsolatos feladatok végrehajtásában mutatott teljesítményét rangsoroló viszonyítási alapokat dolgozott ki, egy, már meglévő jogi benchmark fenntartásával. A GPT-4 (OpenAI) és a Claude 3 Opus (Anthropic) különösen jól teljesített.

A Vals.AI ranglistái összehasonlítják több népszerű LLM pontosságát, költségeit, gyorsaságát. Az oldalon az eredmények elemzését is megtaláljuk, adatkészleteik viszont nem nyilvánosak.

benchmark0.jpg

A vállalat független szakértőkkel közösen dolgozott ki válasz-feleletes és nyílt kérdéses feladatokat az adott területeken.

A szerződésjog (ContractLaw) kérdései mellett a modelleket szerződések bizonyos feltételek mellett érvényes részeinek lekérdezésére, szerkesztésére, kivonatolására utasítják, majd el kell döntenie, melyik részletek felelnek meg a jogi normáknak.

A CorpFin vállalati pénzügyekre vonatkozó kérdésekre adott feleletek pontosságát teszteli. Nyilvános kereskedelmi hitel-megállapodást ad be a modellnek, majd olyan kérdéseket tesz fel neki, amelyek megválaszolásához előbb információkat kell kinyernie a dokumentumból, utána pedig az infók alapján kell érvelnie.

A TaxEval adózásra vonatkozó promptokon teszteli a modell pontosságát. A kérdések felével az adóköteles jövedelem kiszámítását és hasonló készségeket vizsgál, másik fele olyan ismeretekkel foglalkozik, mint különféle könyvelési módszerek adókra gyakorolt hatása, adók alkalmazása változatos eszköztípusokra.

A Vals.AI a jogi érvelést kiértékelő nyílt benchmark LegalBench-en nyújtott teljesítményüket is nyomon követi.

Április 11-én tizenöt modell közül a GPT-4 és a Claude 3 Opus teljesített legjobban. Előbbi a CorpFin és a TaxEval kategóriákban (64,8 és 54,5 százalékos pontossággal), utóbbi a másik kettőben (a GPT-4-t éppen csak megelőzve, 74 és 77,7 százalékos pontossággal) diadalmaskodott. Háromban a kisebb Claude 3 Sonnet lett a harmadik, míg LegalBench kategóriában a Google Gemini Pro 1.0-ja végzett a dobogó harmadik fokán.          

Többmilliárd Intel- és AMD-processzor van veszélyben

A San Diegoi Kaliforniai Egyetem és más amerikai felsőoktatási intézmények, valamint ipari vállalatok kutatóiból álló csoport két új támadásfajtát azonosított. Célpontjuk a csúcs-processzorokban található feltételes elágazás-előrejelzők. A támadásokkal többmilliárd használatban lévő processzor veszélyeztethető, bizalmas adatok kerülhetnek nyilvánosságra velük.

Az elágazás-előrejelző digitális áramkör a számítógép architektúrában; megpróbálja kitalálni, hogy egy ág (például egy „ha-akkor-más” szerkezet) milyen irányban halad, mielőtt végleg ismertté válna. Rendeltetése az utasítás-áramlás javítása,

hacking.jpg

Jelen esetben az útvonal-történeti regiszter (Path History Register, PHR) nevű elágazás-előrejelzőt támadják. Mivel a PHR az elágazás-rendet és az elágazás-címeket egyaránt nyilvántartja, több információ és nagyobb pontossággal van kitéve hackereknek.

A kutatók sikeresen rögzítettek több tízezer ágból álló sorozatokat pontos sorrendben, és a módszerrel titkos képeket szivárogtattak ki feldolgozás közben a széles körben ismert libjpeg képkönyvtárból.

Kivételesen pontos, Spectre-típusú (a modern processzorok spekulatív végrehajtását kihasználó) mérgezéses támadást is azonosítottak. A támadó számára lehetővé válik a téves ágelőrejelzések bonyolult mintázatainak áldozatkódon belüli kivitelezése. A manipuláció nem tervezett kódútvonalak végrehajtására késztetheti az így bizalmas adatait véletlenül felfedő áldozatot.

Míg a korábbi támadások egyetlen ágat vagy egy ág első példányát irányíthatták félre, és mindezt többször hajtották végre, hogy sikerüljön, addig az újhoz olyan pontos a kivitelezés, hogy akár egy ág többezer alkalommal használt, 732. példánya is félreirányítható.

Az Intelt és az AMD-t értesítették a biztonsági felfedezésekről, és a két vállalat dolgozik a probléma megoldásán.

Mesterséges intelligencia a gyártásban

Az utóbbi másfél évben a generatív mesterséges intelligencia vált a legfontosabb infokom technológiává. A felhasználók száma napról napra nő, köztük egyre több gyártócég is alkalmazza, vezetőik optimisták. Az MIT (Massachusetts Institute of Technology) friss felméréséből kiderült, hogy az MI-fejlesztésekkel kapcsolatos ambíciók erősebbek a gyártószektorban, mint a többi ágazatok zömében.

A teljesen automatizált intelligens gyár integráns részét látják benne, növeli a termék- és folyamat-innovációt, csökkenti a gyártási ciklus időtartamát és a széndioxid-kibocsátást, hatékonyabbá tesz eszközöket és folyamatokat, eredményesebb lesz tőle a karbantartás és a biztonság – állítja sok gyártó.

mi_gyartas2.jpg

A felmérés készítői azt vizsgálták, hogy gyártók hogyan profitálnak MI esettanulmányokból. A szektor mesterséges intelligenciával valamilyen szinten dolgozó háromszáz képviselője vett részt benne.

64 százalékuk kutatásokat vagy kísérleteket végez vele, 35 százalék már a gyártásban hasznosítja. Sokan kijelentették, hogy a következő két évben szignifikáns mértékben növelni igyekeznek MI-kiadásaikat. Akik még nem alkalmazzák a gyártásban, fokozatosan vezetik be.

mi_gyartas0.jpg

Az MI méretezésének (skálázásának) a tehetség, a készségek és az adatok hiánya a legfőbb hátráltatói. Minél közelebb kerül a cég a gyártáshoz, annál markánsabbak ezek a problémák. A nem megfelelő adatminőség és szervezés szintén megnehezíti sikeres felhasználási esetek kidolgozását.

mi_gyartas1.jpg

A legnagyobb cégek költik a legtöbbet, és az ő elvárásaik is a legmagasabbak. A mérnöki és tervezői területen a vezetők 58, gyári folyamatoknál 43 százaléka szerint a következő két évben cégük több mint 10 százalékkal növeli MI-költéseit.

Az MI miatti óhajtott nyereségek gyártási funkciókként változnak. A terméktervezés, a beszélgető MI és a tartalomkészítés a leggyakoribb felhasználási esetek, de a tudásmenedzsment és a minőség-ellenőrzés szintén fontosak.

mi_gyartas2_1.jpg

Ha nincsenek megfelelő adatalapok, akadozhat a méretezés. A nem adekvát adatminőséget a megkérdezettek 57, a gyenge adatintegrációt 56, a rossz irányítást 47 százaléka említette, és csak minden ötödik megkérdezett rendelkezik meglévő MI-modellekben való használatra kész gyártóeszközökkel. Minél nagyobb a gyártó, annál problémásabbak a nem megfelelő adatok.

A méretezéshez a töredezettséget is kezelni kell. A gyártók többsége szerint az adatarchitektúra, az infrastruktúra és a folyamatok modernizálása nélkül nem megy az MI-alkalmazás. Az adatrendszerek mérnökök, tervezők és a gyár közötti interoperabilitásának javítása szintén kulcsfontosságú.

Közeleg a szövegből zenét készítő mesterséges intelligencia áttörése?

A korábbi szövegből zenét (text-to-music) generáló eszközöket viszonylag kötetlen formájú instrumentális kompozíciókra, és kevésbé dalokra, szerkesztett versekre, kórusokra, vokálokra tervezték.

Az áprilisban kiadott Stable Audio 2 maximum háromperces hangszeres számokat generál, jól megkülönböztethető nyitánnyal, középső résszel és befejezéssel. A felhasználó feltölthet audio track-eket, és a modellel módosíthat rajtuk.

hanggeneratorok.jpg

A szövegből képeket gyártó egy évvel ezelőtti modellekhez hasonlóan, a mostani szöveg-zene generátoroknál is nehezen irányítható az output. Alig reagálnak alapvető terminológiákra (tempó, harmónia stb.), és általános stílusokat kérnek, mint például az utóbbi ötven évben igencsak sok változáson átment, alstílusokban bővelkedő pop.

Hiteles dalokat előállító modellek megjelenésével eljöhet az audió MI-k „Midjourney pillanata”: a felhasználók széles köre jön rá, hogy a modell promptokra személyes igényeinek, ízlésének megfelelő muzsikát tud előállítani.

hanggeneratorok0.jpg

Az Udio webalapú generátora bevásárlóközponti háttérzenétől heavy metalig változatos stílusokban alkot. A 2023 végétől szolgáltató Sumo hasonló, nemrég frissítették a kínálatát.

Mindkettő promptokból teljes zenekaros anyagokat, promptonként kettőt generál, dalszövegekkel, énekkel, hangszer-szólókkal. A felhasználó létrehozhat vele szövegeket, sajátját is feltöltheti, letöltheti, megoszthatja másokkal az outputot.

A lejátszás és a lájkok száma alapján ranglisták készülnek róluk.

Az Udio regisztrált felhasználói maximum havi 1200 dalt generálhatnak ingyen. A szöveges utasítás mellett meg kell adniuk a stílust is. A rendszer automatikusan leírásokkal helyettesíti művészek neveit, és a kimenetek gyakran egy az egyben úgy hangzanak, mintha a kért zenészek munkái lennének.

A modell 33 másodperces hangszegmenseket generál, amelyeket meghosszabbíthatunk, remixelhetünk, módosíthatunk. A cég semmit nem árult el a mögöttes technológiáról.

A Sumo felhasználói napi tíz dalt generálhatnak ingyen. Megadjuk a promptot, mire a rendszer maximum kétperces anyaggal áll elő. Külön utasításokban specifikálhatjuk a szöveget, stílust, címet. Valódi művészek nevét tartalmazó promptból Sumo nem generál zenét, és a technológiáról sincs infónk.

süti beállítások módosítása