Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

2022. május 06. - ferenck

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak.

A GLIDE modell a szöveges inputra reagálva alkot és szerkeszt képeket. Gyakorlás közben a generatív modell „zajos” képekkel dolgozik, és megtanulja eltávolítani a zajt. Következtetésnél szintén tiszta zajjal kezdi, majd képet generál.

dale.jpg

Korábbi tanulmányokból tudjuk, hogy ha osztály-címkét adunk egy képhez, a diffúziós modell az osztály alapján generál új képeket. GLIDE transzformerrel és konvolúciós ideghálóval (ADM) dolgozik. DALL.E-hez hasonlóan, az interneten gyűjtött 250 millió kép-szövegpáron gyakorolt, viszont DALL.E-vel ellentétben, a fejlesztők minden egyes képet inkrementálisan egészítettek ki zajjal, hogy darabonként százötven, egyre „zajosabb” képet hozzon létre.

A transzformer gyakorlás közben tanulta meg, hogy az input szöveget megjelenítse. A megjelenítésekből és a zajos példából kiindulva, ADM menet közben, sajátította el, hogyan definiálja a sorozat mindenkori megelőző képéhez adott zajt.

dale0.jpg

Következtetéskor GLIDE százötvenszer határozta meg és távolította el a zajt, és mindig képet alkotott. Következő lépésben a kutatók növelték a szöveg szerepét. A modell megint a zajjal kezdte, először ignorálta a szöveges reprezentációt, másodszor már nem. Felmérte a két zaj közötti különbséget, az eredményt eltávolítandó zaj generálására használta fel. A szöveges leírásoknak megfelelő képek szerkesztését a képek egyes részeinek zajjal történő helyettesítésével kezdték, amin a rendszer több iterációban hajtott végre módosításokat, a kép többi részét viszont intakt hagyta.

GLIDE teljesítménye ezer összehasonlítás 91 százaléka alapján fotorealisztikusabb lett, mint DALE.E-é. Ezek a képek az esetek 83 százalékában jobban hasonlítanak a szöveges inputhoz. GLIDE élethű outputjai viszont a következtetési idő rovására mennek. Tizenöt másodpercig, sokkal tovább tart, mint a generatív ellenséges hálózatok (GAN) szöveg-kép generátorainál. Azoknak a másodperc töredékét veszi igénybe egy ilyen művelet. A közeljövőben valószínűleg GLIDE felgyorsítása lesz az egyik legfontosabb fejlesztési szempont.

Az újítás azért fontos, mert a generatív modelleket nehéz intuitív módon vezérelni. A természetes nyelven keresztül történő közvetlen képgenerálással viszont új lehetőségek nyílnak meg.

Hogyan írjon jobb szövegeket egy idegháló?

Egy új megközelítés sokat segíthet szövegeket generáló mesterséges intelligenciáknak, hogy ne az oly gyakran jellemző nonszensz baromságokat hozzanak létre.

Az AI21 Labs Jurassic-X természetesnyelv-feldolgozó rendszere az ideghálók és a szabályalapú programok kombinációja. Nagyméretű nyelvi modellt alkot naprakész tényeket szolgáltató, matematikai problémákat megoldó, speciális inputokat is feldolgozó modulokkal.

textgeneratorai.jpg

A rendszer a különféle programokat tartalmazó Moduláris Következtetés, Ismeret és Nyelv (MRKL) szoftverinfrastruktúrán alapul. Az általános nyelvi feladatokat előzetesen gyakoroltatott, méretes transzformer modell végzi. Egy kalkulátor és a hálózati adatbázisokat, például a Wikipédiát lekérdező programok között egy speciális modul, router közvetít.

Maga a router is begyakoroltatott transzformer, az inputot úgy módosítja mindig, hogy passzoljon egy meghatározott modulhoz. Például újrafogalmazhat szöveget, hogy az megfeleljen a nyelvi sablonnak.

A kalkulátor használatához a router megtanult véletlenszerűen generált, angol nyelvű matematikai kifejezések alapján műveleteket végezni.

Nyitott témájú kérdés esetén, módosított szövegrészlet-visszakereső találja meg a legrelevánsabb Wikipédia-szócikkeket, majd egy „újra-rangsoroló” kutat köztük a megfelelő szövegrészek után, amelyeket inputként küld a rendszerbe, és a rendszer válaszol rájuk.

A Jurassic-1 egyes feladatokhoz, például „természetes kérdésekhez” történő finomhangolásával speciálisan gyakoroltatott, kétrétegű transzformer módosítja a nyelvi modell reprezentációját, és a módosított anyag a router közreműködésével jut vissza az outputot generáló rendszerhez.

A fejlesztés azért fontos, mert a jelenlegi mesterséges ideghálók több feladatot majdnem emberi szinten teljesítenek, a következtetésben viszont nagyon gyengék, képesek tényeket kitalálni, és újabb információt nem tudnak további gyakorlás nélkül kezelni. A szabályalapú modellek a jelentéseket és a tényeket is kezelik, viszont a szabályok által nem lefedett helyzetekben pocsékul teljesítenek. Az általános nyelvi modell és a speciális rutinok egyedi feladatok megoldását célzó kombinációja a való világhoz jobban kapcsolódó outputokkal kecsegtet.

MI-startupokba fektetnek az MI-startupok

A mesterséges intelligencia változatlanul „forró topik” a startup-világban. Annyira az, hogy a kezdő vállalatok sokkal többet akarnak belőle. Ezt támasztja alá az a tény, hogy soha nem fektettek még be akkora összegeket mesterségesintelligencia-fejlesztésekbe, mint most. A 2021-es 93 milliárd dollár több mint a duplája a 2019-es 42 milliárdnak.

A befektetők azonban válogatósabbak lettek, nagyon meggondolják, mibe teszik a pénzüket. Az eredmény: világviszonylatban, a 2018-as 1200-ról 2020-ra 746-ra esett az újonnan alapított MI-cégek száma. 

ai_startups.jpg

A kockázatitőke-befektetők által támogatott új mesterségesintelligencia-startupok más startupokat felvásárolva, igyekeznek bővíteni szolgáltatásaikat, javítani piaci pozícióikat. Ezek a befektetések majdnem mind stratégiai jellegűek, a hosszútávú értékteremtést célozzák.

2021-ben nyolcmilliárd dollárt költöttek akvizíciókra, ami drasztikus növekedés a 2020-as 942 és a 2019-es 82 millióhoz képest. A piacelemző 451 Research adatai alapján a 2019-es 48 akvizíciót 2021-ben 72 követte.

A cégfelvásárlásokkal a startupok még jobban felhívják magukra a befektetők figyelmét. Ez azért nagyon fontos, mert az utóbbi időben kockázati tőkések kevesebb pénzt költenek el ilyen céllal. A CB Insight szerint januártól márciusig tizenkilenc százalékkal esett vissza a teljes befektetés, míg a speciális rendeltetésű akvizíciós vállalatok bevezető ajánlattételei és a pénzgyűjtés negyvenöt százalékkal csökkent.

Az MI startupok a sok tehetséges, fiatal mérnökkel aranybányái a technikai lehetőségeiket bővíteni igyekvő vállalatok számára. Globális hiány van MI-mérnökökből.

Az akvizíciós hullám komoly hatással van a startupok pénzügyi részlegére. A kezdeteknél tartó cégek befektetési bankárokat és vállalatfejlesztés-specialistákat igyekeznek alkalmazni. Ezek a szakemberek pontosan a más startupokat felvásárló startupok megsegítésére specializálódtak, komoly segítséget jelentenek akvizícióknál.  

Génszerkesztéssel a környezetvédelemért

A genetikai kód tervezését forradalmasító módszer, a CRISPR génszerkesztő egyik feltalálója Jennifer Doudna (2. kép) szerint a technikával az emberiség legnagyobb problémái közül néhányra, például az éghajlatváltozásra is találhatunk megoldást.

Az MIT Technology Review-nak adott interjúban elmondta, hogy a CRISPR segíthet mikrobiális közösségeket a vízben és a talajban lévő szénhez való hozzáférésben.

crispr.jpg

A futurisztikus gondolat, ha megvalósul, nagyon komoly hatással lehet a jövőben, de még (a 2020-as Nobel-díjas) Doudna szerint is sok idő telhet el addig.

„Sokan foglalkoznak a CRISPR klinikai, orvosi felhasználásával. Ugyanakkor azt gondolom, hogy a következő évtizedben, amikor a technológia globális, illetve a hétköznapjainkra gyakorolt hatásán gondolkozunk, eszünkbe jutnak majd a mezőgazdasági alkalmazások, sőt, potenciálisan, az éghajlatváltozásra is komolyabb hatással lehet” – nyilatkozta.

crispr0.jpg

Az ötlet: növények olyan szintű „feljavítása”, hogy legalább néhány évig környezetükből felszívják a széndioxidot. Egyesek már kísérleteznek is gyökérrendszerek felerősítésével, és a széndioxid tárolásáért felelős védőburok fejlesztésével. Ugyanezek az eljárások élőlényeknek is segíthetnek több széndioxidot tárolni.

A CRISPR azonban nemcsak a több széndioxid tárolásában segíthet növényeken, hanem lehetővé is teheti számukra, hogy jobban ellenálljanak az egyre fenyegetőbb, a jövőre előbb-utóbb komoly diszruptív hatást kifejtő éghajlatváltozásnak.

A Kaliforniai Berkeley Egyetem kutatói például a rizs genetikáján akarnak módosítani, hogy a földkerekség egyik legfontosabb kalóriaforrása jobban ellenálljon a szárazságnak. A kutatásban a Doudna által alapított Innovatív Genomika Intézet is részt vesz. Egyelőre azonban nagyon korai szakaszban járnak. Először meg kell érteniük, hogy a különböző alkotóelemek hogyan kapcsolódnak egymáshoz.

A CRISPR eddig is bizonyította sokoldalúságát, és a tudósokat ugyan főként az orvosi alkalmazások lelkesítik, a globális élelmiszerláncra és az éghajlatváltozásra gyakorolt hatása viszont minden másnál fontosabb lehet.

Milyen következményekkel járhat, hogy Elon Musk felvásárolta a Twittert?

Az infokom világ egyik szenzációja, hogy Elon Musk múlt héten csilliárdokért felvásárolta a népszerű közösségimédia-oldalt, a Twittert. A felvásárlásban a szabad véleménynyilvánítás megőrzése is motiválta. Az évek során a vállalat bevett gyakorlatává vált ugyanis egyes tweetek promótálása, mások eltemetése. De hogyan akar ezen változtatni Musk?

A létező legegyszerűbb módon, a cég rangsoroló algoritmusának (ranking algorithm, lásd 2. ábra) nyilvánossá tételével. Egy ilyen algoritmus, például a Google-é vagy a Facebooké féltve őrzött kincs. Ezek a programok döntik el, hogy adott esetben milyen tweetek kerülnek a felhasználó hírfolyamába. A közösségimédia-vállalatok titokban tartják, utolsóként tennék közkinccsé.

Musk törekvése felkavarhatja az állóvizet. Andrew Ng, a gépitanulás-kutatás egyik legelismertebb képviselője néhány hete osztotta meg a témára vonatkozó gondolatait hírlevelében.

musk_twitter.jpg

Mi indokolja a rangsoroló algoritmusok titokban tartását? – teszi fel a kérdést, majd sorolja is az érveket.

Elsőként, így nehezebbé válik a csalók és a levélszemétküldők (spammers) tevékenysége, nehezebben manipulálják a program outputjait. Persze a védekezésnek léteznek más módjai is, de az algoritmus titokban tartása tényleg korlátozza a csalást. Más szempontból, nyílt forrású szoftverek is lehetnek nagyon biztonságosak, mert komplett közösségek lesik a hibákat, és tömik be a réseket. Ugyanakkor más egy hagyományos szoftvert megvédeni hackerektől, és más egy rangsoroló algoritmust megóvni a statisztikák manipulálásától. A támadók, ha rendelkeznek az algoritmus offline másolatával, és folyamatosan kísérleteznek, várhatóan jobban promótált üzenetformátumokat dolgoznak ki.

Másrészt, ha azt akarjuk, hogy minél többen értésék az algoritmus működését, akkor az azt működtető adatokat is nyilvánossá kell tenni, mert a rendszer viselkedése mindkettőtől függ. A Twitter adatainak nyilvánossá tétele nem praktikus, és nemcsak az adatsor monumentális mérete miatt, hanem mert a felhasználók érdekeit és jogait is sérti.

musk_twitter0.jpg

Harmadrészt, az algoritmus viselkedése, a gépi tanulás „fekete doboz” jellege miatt akkor is nehezen elemezhető, ha a kód és az adatok elérhetők.

Negyedrészt, a szabadalmaztatott algoritmusok versenyelőnnyel rendelkeznek. A Twitter rengeteg időt és anyagiakat fektetett az algoritmus fejlesztésébe, és a program a cég egyik védjegye, ez is megkülönbözteti a versenytársaktól. Ha nyilvános lesz, a riválisok versenyelőnyhöz jutnak.

A titokban tartás melletti érvek után Ng felsorolja az ellenérveket is, összesen kettőt.

Egyrészt, kutatók és a szélesebb szakmai közösség jobban megismerik az algoritmust, jobban figyelnek a problémákra és a szolgáltató semlegességére. Az ilyen típusú megfigyelés nyomás alatt tartja, és a termék állandó tökéletesítésére ösztönzi a céget, és ha jónak bizonyul, nagyobb a társadalmi elfogadottsága, többen bíznak meg benne.

Mivel ezek az algoritmusok milliók, milliárdok életét, demokratikus választások végeredményét befolyásolják, az állampolgárokat és a kormányokat megilleti az a jog, hogy többet tudjanak róluk.

Az online szabad véleménynyilvánításnak persze csak egy része a rangsoroló algoritmus, és Musk kicsit naivnak is tűnik, ráadásul a megengedőbb közösségi médiumokat elönti a gyűlöletbeszéd, sok a csalás, a levélszemét, süllyed a színvonal. A Twittert viszont az üzleti teljesítménye miatt érte rengeteg bírálat, ez tette lehetővé Musk színrelépését is.

Ng szerint bonyolult a kérdés, viszont hajlik az algoritmus legalább részleges közkinccsé tételére.

Emberarcú eladóbotok, LinkedIn profillal

Marketingesek mesterséges intelligencia által generált arcképekkel felturbózott, kamu közösségimédia-személyeket használnak termékeik szélesebb körű, költségvetésüket viszont nem növelő értékesítésére – állapította meg a Stanford Internet Observatory két kutatója, miután a LinkedInt tanulmányozva ezernél több, valószínűleg generatív ellenséges ideghálókkal (GAN) készített kamuprofilt fedeztek fel.

Cégek független marketingeseket vesznek fel üzleti körük bővítésére. Ezek a marketingesek közösségi médiafelületeken küldik el üzeneteiket a potenciális ügyfeleknek, csakhogy kamuprofilokat használnak ajánlatuk elküldéséhez. A válaszokat pedig az eredeti cég sales-részlegéhez továbbítják.

kamuprofilok.jpg

Nem nehéz ilyen profilokat találni. A LIA (LinkedIn Lead Generation Assistant) például online avatárokhoz való hozzáférést értékesít, amelyek aztán LinkedIn profilokat keresgélnek, hogy havi háromszáz dollárért találjanak elkötelezett ügyfeleket. Egy másik cég, a Renova Digital lehetővé teszi, hogy ügyfelei havi 1300 dollárért két avatárt használjanak. A felsorolás természetesen folytatható.

A két kutató figyelmeztetésére a LinkedIn törölte a közösségi szabályait megsértő profilokat: 2021 első félévében összesen tizenötmillió kamuprofilt távolított bel. Szinte az összest vagy a regisztrációnál, vagy gyanús viselkedést tanúsítva, automatikusan blokkolta.

kamuprofilok0.jpg

A stanfordi kutatók közkinccsé tettek pár tippet, hogy hogyan ismerhetők fel kamu LinkedIn-profilok.

Például a képek túl jól vannak elrendezve, a szemek mindig horizontálisan, a mértani középpontban találhatók, aszszimmetrikusak a fülbevalók, furcsán állnak a hajszálak. Ezeken a profilokon általában hosszasan sorolják fel a munkahelyeket, a betöltött pozícióról viszont jóval kevesebb az információ. Az alkalmazók között sok a nagyvállalat, például az Amazon, a Salesforce stb. A kamu oktatástörténetekben több a pontatlanság, logikátlanság, például egyesek olyan iskolákban nyertek el fokozatokat, amelyek nem adnak diplomát az adott fokozatból.

Mi mindebből a tanulság? Az, hogy a közösségi média korában vállalatok sokkal több potenciális fogyasztóhoz juthatnak el, mint amennyit a sales-részlegük elérhet. Ezért van szükségük innovatív mesterségesintelligencia-megoldásokra. Csakhogy a kockázat is nagy, mert ha kiderül a turpisság, bőven oda a potenciális nyereség. Hiába trendi a technológia, az átverés attól még átverés marad.

Emberarcú bowling-labdák

A különösen az Egyesült Államokban népszerű, sőt, kultikus, versenyzőknek komoly bevételeket generáló bowling egy bábusport, a teke rokona, egyes felosztások szerint a „tekecsalád” tagja.

Kívülállók számára mind egyforma, pedig vannak köztük bőven különbségek. Az aszfaltpályás tekézés „a” tekesport, a föld- vagy agyagpályán is játszott az itthon legnépszerűbb, a kugli, aztán volt még a mára elhalt, üdülőhelyeken űzött lengőteke, és az amerikaiak örömére, persze van a bowling is.

A végcél közös bennük: mindegyikben tíz bábut kell feldönteni az elgurított labdával.

openai_4.jpg

A bowling népszerűségét jelzi, hogy rengeteg a róla készült animáció és szintén számítógépes technológiával létrehozott bizarr mém. Az egyiket a lassan már legendásnak nevezhető, pedig csak pár éve alapított OpenAI szöveget képpé alakító (text-to-image generator) DALL-E2 rendszere hozta létre.

Adam Goldberg marketingmenedzser arra kényszerítette a mesterséges ideghálót, hogy csináljon képeket a pályán végig-gördülő „vibráló, mosolygó és nevető golyókról.” A végeredmény mindenkinek elnyerte a tetszését, a Twitter-re is kiposztolták.

A golyók tényleg mosolyt csalnak az arcunkra, megnevettetnek.

DALL-E2 munkái nem most kerültek fel először OpenAI-alkalmazottak Twitter-ére, viszont ezek a legszórakoztatóbbak.

Egy másik OpenAI tweeten Aravind Srinivas kutató ránézésre kézzel festett képet osztott meg. Természetesen ezúttal is az idegháló volt az alkotó, a kép „új nyelv megtanulására kísérletet tevő” robotot ábrázol. Aditya Ramesh, az előd DALL-E és a mostani DALL-E2 társfejlesztője elmondta: fejlett ideghálója még hatásosabb képeket tud majd generálni.

Az OpenAI évek óta lázban tartja és befolyásolja a szakmai közvéleményt. Csodás és szörnyűséges munkákat egyaránt jegyez, az utolsó frissítés viszont telitalálat. A bowling golyók egyébként azt is bizonyítják, hogy ez az MI már nemcsak a tartalomra, hanem a stílusra és az egyensúlyra is figyel.

Mit lát az MI az orosz-ukrán háborúból?

Ukrajna orosz inváziója a világtörténelem egyik legadatgazdagabb fegyveres konfliktusa. Rengeteg fénykép, videó, műholdas és más légifelvétel készül róla, nagyon sok a közösségimédia-anyag. Az információ-cunamiban való tájékozódásban, komplexebb kép kialakításában sokat segítenek a  mesterségesintelligencia-technikák.

Sokféle adattípust elemeznek MI-vel. A PrimerAI például természetesnyelv-modellt gyakoroltatott be az orosz argó és a katonai szleng felismerésére, és a rendszer el is csípett, majd átírt online küldött, egyáltalán nem titkosított rádióüzeneteket. A Berkeley Egyetem kutatói gépilátás-modelljeikkel azonosítanak sérült épületeket.

azonositas.jpg

Megölt, foglyul ejtett, kitelepített vagy háborús bűnt elkövető személyeket arcfelismeréssel igyekeznek azonosítani. Az online képek alanyok beleegyezése nélküli felhasználása miatt sokat kritizált Clearview AI startup az ukrán kormány számára tette elérhetővé technológiáját, de a kormánnyal kapcsolatban nem álló kutatók is hasonló eszközökkel igyekeznek elemezni a háborús képeket.

A Clearview AI kétszáz fiókot nyitott öt ukrán ügynökségnél, a hivatalos szervek eddig ötezernél több kereséshez használták az appot. A rendőrség a New York Times-nak elmondta, hogy halott orosz katonákat fotójuknak az Odnoklassniki közösségimédia-oldalra feltöltött képekkel való egyeztetésével igyekeznek azonosítani. Hadifoglyok és az Ukrajnában nem katonai munkát végzők azonosítására szintén használják a technológiát.

A Bellingcat holland oknyomozó csoport az orosz FaceClone appot gyakoroltatta a VKontakte közösségimédia-oldalon. Ukrán otthonokat kifosztó orosz katonák személyazonosságára derített fényt az eltulajdonított javak postázása közben. A Bellingcat korábban, a Tactical Systems katonaikiképző-céggel együttműködve, a Microsoft arcfelismerő technikájával cáfolta meg azokat a híreszteléseket, hogy egy elfogott orosz pilótát 2017-ben Putyin elnökkel közösen fényképeztek le.

Egy percig se legyenek kétségeink, hogy az orosz erők és szimpatizánsaik is ugyanezeket a technológiákat, vagy talán jobbakat is alkalmaznak ezekre a célokra, csak ők a Facebookot, Twittert, TikTokot stb. fürkészik. Putyin Oroszországában (különösen most) nem szokás a technikai újítások világgá kürtölése.

Az arcfelismerés hibás outputot is eredményezhet, ráadásul háborús időkben nagyobb a kapkodás, erősebb a rendszerekre nehezedő nyomás, könnyen előfordulhat kémek, bűnözők, halottak téves azonosítása. A háborús bűnösöket MI nélkül viszont még nehezebb lenne bíróság elé állítani.

Mesterséges intelligencia a radiológiában

Röntgenképek olvasata meglehetősen szubjektív, több tényezőtől függ, hogy a radiológus mit vesz észre rajtuk, hogyan értékeli őket. Értelemszerűen, minél fáradtabb, annál könnyebben hibázhat.

Az Európai Unió most hagyott jóvá egy, a radiológusok munkáját segítő mesterségesintelligencia-rendszert, amely felismeri a mellkasról készült, rendellenességmentes röntgenképeket.

A litván Oxipit startup által fejlesztett ChestLink az európai hatóságok részéről orvosi használatra elsőként elfogadott, tehát az egészségügyi és biztonsági előírásoknak megfelelő, autonóm gépilátás-rendszer. Az engedéllyel lehetővé vált a ChestLink rendszernek a huszonhét tagállamban, valamint Liechtensteinben, Norvégiában, Svájcban és Törökországban történő telepítése.

radiologia.jpg

A rendszer az Oxpit korábbi termékét, a ChestEye-t használja, hetvenöt rendellenesség, például az endéma és a tuberkulózis jeleit kutatja. Ha egyet sem talál, orvosi tájékoztatót generál. Máskülönben radiológusnak továbbítja a képet, hogy a szakember nézze át.

Mielőtt telepítik egy klinikán, a cég röntgenvizsgálatokat végez, hogy megállapítsa a rendszer által nagy valószínűséggel felismert rendellenesség-mentes képek arányát. Telepítés után az Oxpit kiértékeli ChestLink hatékonyságát, és csak utána hagyják autonóm módban működni.

Egy éven keresztül több klinikán tesztelték, és a tesztekhez ötszázezer képet használtak. Az autonóm működtetésre a tervek alapján jövőre kerül sor. Az Oxpit bízik, hogy az FDA-től, az Egyesült Államok Élelmiszer- és Gyógyszerhatóságától is zöld fényt kapnak.

Az egészséges mellkast ábrázoló röntgenképek azonosításával és a róluk készült beszámolókkal, a rendszer sokat segít a radiológusoknak, mert a szakembereknek így már tényleg csak a fokozottabb figyelmet igénylő képekre kell összpontosítaniuk.

A radiológusok – különösen csapatmunkában – egyelőre a legjobb mesterségesintelligencia-rendszereknél is jobban diagnosztizálnak, az MI kevésbé ellentmondásos, problémamentes képek felismerésére történő gyakoroltatása viszont nagyon jó megközelítésnek tűnik.

Vegyi fegyvereket tervez a mesterséges intelligencia

A mesteréges intelligencia összességében pozitív hatással lesz a társadalomra, egyes árnyoldalairól viszont nem feledkezhetünk meg. Például meglepően könnyű jószándékú gépitanulás-algoritmusokat átállítani a rossz oldalra.

Fabio Urbina és kollégái a Collaborations Pharmaceuticalsnál pont ezt tették: az első lépésben hasznos vegyületek tervezéséhez, illetve a mérgezők elkerüléséhez felhasználható gyógyszer-felfedező/fejlesztő modellt dolgoztak ki. A következő lépésben viszont a feje tetejére állították a rendszert, újratrenírozták a modellt, hogy ezúttal mérgeket generáljon. Hat óra leforgása alatt negyvenezer toxint hozott létre, amelyek közül néhány a kezdő adatsorban nem szereplő, tényleges vegyiháború-ágens.

A szerzők nem részletezték az architektúrát, az adatsort és a módszertant sem, mert nem akarták felbátorítani a rosszfiúkat. Egyes következtetések mégis levonhatók a közzétett adatokból.

vegyifegyver.jpg

A cég generatív modellje a MegaSyn, a kutatók egy LSTM-et (Long short-term memory, a mélytanulásban használt neurálisháló-architektúra) gyakoroltattak be vegyületek létrehozásához. Vegyi szerkezetek és alszerkezetek gigantikus tárházát használva, szabványosított szövegformátummal dolgoztak.

Ezt követően az LSTM-et úgy gyakoroltatták tovább, hogy a gyilkos idegméreg VX-hez hasonló vegyületeket hozzon létre. Finomhangolás közben a modell több korábbi állapotát lementették, amelyek nagyon változatos vegyi anyagokat generáltak, míg a későbbiek a finomhangolás-sorral majdnem azonosakat dolgoztak ki.

Ezekkel a finomhangolt modellekkel többezer, toxikusságuk és az emberi szervezetre gyakorolt hatásuk alapján rangsorolt vegyületet készítettek. A MegaSyn sorrendkialakító funkciója bünteti a toxikusságot, de jutalmazza a nagyobb biológiai hatást. Emiatt a szerzők kevésbé törődtek a toxikussággal, inkább a legnagyobb hatású, leggyilkosabb vegyületekre összpontosítottak helyette.

Később, az általuk generált legkárosabb tíz százalék alapján, az összes modellt finomhangolták, hogy még gyilkosabb anyagokkal álljanak elő.

A kutatók bebizonyították, hogy ipari modell felhasználható vegyi fegyverek előállításához. Elképzelhető, hogy nemcsak gyógyszerfejlesztésre kitalált modellekkel is megtehető ugyanez.

süti beállítások módosítása