Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Algoritmusok az új ingatlanügynökök

2022. május 10. - ferenck

Az algoritmusok által beárazott házeladások az amerikai ingatlanpiac kicsi, de növekvő szegmense. Az iBuyers néven ismert, az adás-vételhez algoritmikus árazómodelleket használó vállalatok vásárolták meg 2021-ben az értékesített otthonok egy százalékát az országban. Az ingatlanadatokkal foglalkozó Core Logic szerint 2019-hez képest megduplázódott a szám.

A közelben lévő hasonló ingatlanok értéke alapján árazó klasszikus ingatlanügynökökkel szemben, az iBuyers különféle tényezők (országos ingatlanhirdetések, jelzáloghitelek, helyi vállalkozások, emberi értékelések) figyelembe vétele után árazó modelleket használ. 

ai_estate.jpg   

2017 és 2021 eleje között az összes iBuyers vásárlás 95 százalékát az első négy legértékesebb ingatlan tette ki. Más ingatlanügynökségeknél, például az Opendoornál ugyanez 56, a Zillownál 24, az Offerpad-nél 18, a Redfinnél 2 százalék. A Zillow a pandémia alatt felszámolta saját iBuying részlegét, ami zavart okozott a lakások árazásában, és a vállalat algoritmusát is összezavarta.

Ugyanebben az időintervallumban, az iBuyers vásárlások 75 százaléka öt szövetségi államban történt: Arizonában, Texasban, Floridában, Georgiában és Észak-Karolinában. Mivel öregebb vagy nem tipikus ingatlanok árbecslésénél a modellek komoly problémákkal szembesülnek, inkább városokra, és főként újabb, viszonylag egyforma házakra összpontosítanak.

aiestate0.jpg

Az Opendoor vezetősége elmondta, hogy modelljük nehezebben beárazható helyeken, többek között kapuval elzárt vagy „korhatáros” (például nyugdíjasoknak fenntartott) közösségi házakkal is elboldogul. Városokban, például San Franciscoban változatosabb ingatlanokat, öregebb házakat, multiplexeket és társasházakat egyaránt kínálnak eladásra.

Az iBuyers részvényei húsz százalékát inkább intézményi befektetőknek, például bankoknak és magántőkealapoknak értékesíti, mint magánszemélyeknek és családoknak. Ezek a befektetők gyakran bérbe adható ingatlanként adják tovább a házakat.

Az automatizált árazással a piacok kétségtelenül hatékonyabbá válnak, viszont nem várt következményei is lehetnek. Az iBuyers például hiába áramvonalasítja az adás-vételt, az sokszor az adott ingatlannak a bérbeadandó lakások piacára kerülésével végződik. Ez a trend pedig nagyon nem tesz jót a megfizethető árú ingatlant kereső személyeknek, családoknak.

A Twitter és a nyílt szabványok

A Twitter körül zajló események, az Elon Musk általi felvásárlás több kérdést vet fel a közösségi médiumokkal és általában az internettel kapcsolatban.

Sokan máris a szólásszabadságot ünneplik, mások viszont féltik a platform jövőjét. Vajon a Twitter alapszabályai Musk elképzelései szerint változnak meg, és akkor rossz esetben még az is elképzelhető, hogy a közösségi médiumot az eddiginél sokkal nagyobb mértékben elárasztják a trollok, orrvérzésig zaklatnak majd személyeket, terjed a gyűlöletbeszéd és a dezinformáció?

Mindkét lehetőség valóra válhat, kérdés, hogy a nyílt szabványok javítanak-e a közösségi médiumon.

openstandards.jpg

Andrew Ng mesterségesintelligencia-kutató az e-mailt hozza fel példaként. Az SMTP nyílt protokoll biztosítja a cégeknek a szolgáltatásnyújtást, és azt is, hogy bárki bárkivel bármiről kommunikáljon, és ehhez teljesen mindegy, ki a szolgáltató.

Hasonló nyílt szabvány megerősítheti a közösségi médiát. A platformok sok mindenben azonosak: posztolhatunk, lájkolhatunk, kommentelhetünk, megoszthatunk tartalmakat. Miért ne lehetne megoldani, hogy az alapfunkciók az összesen keresztül működjenek, beleértve az újakat is? A felhasználók így akkor is kommunikálhatnának egymással, ha az egyikül fiókja például a Facebookon, a másiké a LinkedIn-en van. Ugyanúgy, mint ahogy a gmailes, outlookos, yahoos stb. e-mailfiókok között is van forgalom, megy a kommunikáció.

A közösségi média nyílt szabványai jó ideje viták tárgya. Egyesek szerint csak „központi kapuőr” tud eredményesen moderálni, és megakadályozni a toxikus légkör kialakulását. Ng szerint ez tévedés, és megint az e-mail a példája: a levélszemét-szűrők nagy mértékben kigyomlálják a káros tartalmakat. A felhasználó maga dönt, hogy kire bízza a kapuőr szerepet, de úgy is dönthet, hogy senkire. A nyílt protokoll mindenesetre megakadályozza, hogy bármelyik cég monopolizálja az elektronikus levelezést.

A nyílt szabványok csomó innovációval gazdagították az infokommunikációt. Ugyan lassan fejlődnek, de ha egy technológia eléggé érett, megakadályozzák, hogy egy-egy vállalat a saját hasznára és a többiek kárára változtassa meg a szabályokat. Bármelyik fejlesztő rákapcsolódhat az ökoszisztémára, a legjobb implementációk csúcsra futtathatók, míg a zárt platformok nehezítik appok megosztását stb.

Ng másik példája maga a web. A HTTP protokollt használva, a fejlesztők bárhonnan bármilyen honlapot megcsinálhatnak. Az innovációs hullám évtizedek óta tart, és ugyan rengeteg az adathalász és más káros tevékenység, a böngészők lehetővé teszik, hogy webes kapuőrökre bízzuk magunkat. Ez segít az ökoszisztéma „egészségének” fenntartásában.

Egyelőre nehéznek tűnik közösségi médiára kidolgozni nyílt szabványt. Mit szólnának hozzá például a Facebook-típusú „fallal őrzött kertek?” De meglátjuk, mi lesz a Twitterrel.

Egyre jobb képeket csinál szöveges leírás alapján az OpenAI MI-je

Az OpenAI DALL.E rendszere szöveges leírásokból készít képeket. Legújabb frissítése sokat javított rajta, lényegében az alapoktól kezdve újraírták az egészet. A leírások megjelenítéséhez a korábbi CLIP képosztályozót, képgeneráláshoz egy nemrég ismertetett módszert használnak.

A GLIDE modell a szöveges inputra reagálva alkot és szerkeszt képeket. Gyakorlás közben a generatív modell „zajos” képekkel dolgozik, és megtanulja eltávolítani a zajt. Következtetésnél szintén tiszta zajjal kezdi, majd képet generál.

dale.jpg

Korábbi tanulmányokból tudjuk, hogy ha osztály-címkét adunk egy képhez, a diffúziós modell az osztály alapján generál új képeket. GLIDE transzformerrel és konvolúciós ideghálóval (ADM) dolgozik. DALL.E-hez hasonlóan, az interneten gyűjtött 250 millió kép-szövegpáron gyakorolt, viszont DALL.E-vel ellentétben, a fejlesztők minden egyes képet inkrementálisan egészítettek ki zajjal, hogy darabonként százötven, egyre „zajosabb” képet hozzon létre.

A transzformer gyakorlás közben tanulta meg, hogy az input szöveget megjelenítse. A megjelenítésekből és a zajos példából kiindulva, ADM menet közben, sajátította el, hogyan definiálja a sorozat mindenkori megelőző képéhez adott zajt.

dale0.jpg

Következtetéskor GLIDE százötvenszer határozta meg és távolította el a zajt, és mindig képet alkotott. Következő lépésben a kutatók növelték a szöveg szerepét. A modell megint a zajjal kezdte, először ignorálta a szöveges reprezentációt, másodszor már nem. Felmérte a két zaj közötti különbséget, az eredményt eltávolítandó zaj generálására használta fel. A szöveges leírásoknak megfelelő képek szerkesztését a képek egyes részeinek zajjal történő helyettesítésével kezdték, amin a rendszer több iterációban hajtott végre módosításokat, a kép többi részét viszont intakt hagyta.

GLIDE teljesítménye ezer összehasonlítás 91 százaléka alapján fotorealisztikusabb lett, mint DALE.E-é. Ezek a képek az esetek 83 százalékában jobban hasonlítanak a szöveges inputhoz. GLIDE élethű outputjai viszont a következtetési idő rovására mennek. Tizenöt másodpercig, sokkal tovább tart, mint a generatív ellenséges hálózatok (GAN) szöveg-kép generátorainál. Azoknak a másodperc töredékét veszi igénybe egy ilyen művelet. A közeljövőben valószínűleg GLIDE felgyorsítása lesz az egyik legfontosabb fejlesztési szempont.

Az újítás azért fontos, mert a generatív modelleket nehéz intuitív módon vezérelni. A természetes nyelven keresztül történő közvetlen képgenerálással viszont új lehetőségek nyílnak meg.

Hogyan írjon jobb szövegeket egy idegháló?

Egy új megközelítés sokat segíthet szövegeket generáló mesterséges intelligenciáknak, hogy ne az oly gyakran jellemző nonszensz baromságokat hozzanak létre.

Az AI21 Labs Jurassic-X természetesnyelv-feldolgozó rendszere az ideghálók és a szabályalapú programok kombinációja. Nagyméretű nyelvi modellt alkot naprakész tényeket szolgáltató, matematikai problémákat megoldó, speciális inputokat is feldolgozó modulokkal.

textgeneratorai.jpg

A rendszer a különféle programokat tartalmazó Moduláris Következtetés, Ismeret és Nyelv (MRKL) szoftverinfrastruktúrán alapul. Az általános nyelvi feladatokat előzetesen gyakoroltatott, méretes transzformer modell végzi. Egy kalkulátor és a hálózati adatbázisokat, például a Wikipédiát lekérdező programok között egy speciális modul, router közvetít.

Maga a router is begyakoroltatott transzformer, az inputot úgy módosítja mindig, hogy passzoljon egy meghatározott modulhoz. Például újrafogalmazhat szöveget, hogy az megfeleljen a nyelvi sablonnak.

A kalkulátor használatához a router megtanult véletlenszerűen generált, angol nyelvű matematikai kifejezések alapján műveleteket végezni.

Nyitott témájú kérdés esetén, módosított szövegrészlet-visszakereső találja meg a legrelevánsabb Wikipédia-szócikkeket, majd egy „újra-rangsoroló” kutat köztük a megfelelő szövegrészek után, amelyeket inputként küld a rendszerbe, és a rendszer válaszol rájuk.

A Jurassic-1 egyes feladatokhoz, például „természetes kérdésekhez” történő finomhangolásával speciálisan gyakoroltatott, kétrétegű transzformer módosítja a nyelvi modell reprezentációját, és a módosított anyag a router közreműködésével jut vissza az outputot generáló rendszerhez.

A fejlesztés azért fontos, mert a jelenlegi mesterséges ideghálók több feladatot majdnem emberi szinten teljesítenek, a következtetésben viszont nagyon gyengék, képesek tényeket kitalálni, és újabb információt nem tudnak további gyakorlás nélkül kezelni. A szabályalapú modellek a jelentéseket és a tényeket is kezelik, viszont a szabályok által nem lefedett helyzetekben pocsékul teljesítenek. Az általános nyelvi modell és a speciális rutinok egyedi feladatok megoldását célzó kombinációja a való világhoz jobban kapcsolódó outputokkal kecsegtet.

MI-startupokba fektetnek az MI-startupok

A mesterséges intelligencia változatlanul „forró topik” a startup-világban. Annyira az, hogy a kezdő vállalatok sokkal többet akarnak belőle. Ezt támasztja alá az a tény, hogy soha nem fektettek még be akkora összegeket mesterségesintelligencia-fejlesztésekbe, mint most. A 2021-es 93 milliárd dollár több mint a duplája a 2019-es 42 milliárdnak.

A befektetők azonban válogatósabbak lettek, nagyon meggondolják, mibe teszik a pénzüket. Az eredmény: világviszonylatban, a 2018-as 1200-ról 2020-ra 746-ra esett az újonnan alapított MI-cégek száma. 

ai_startups.jpg

A kockázatitőke-befektetők által támogatott új mesterségesintelligencia-startupok más startupokat felvásárolva, igyekeznek bővíteni szolgáltatásaikat, javítani piaci pozícióikat. Ezek a befektetések majdnem mind stratégiai jellegűek, a hosszútávú értékteremtést célozzák.

2021-ben nyolcmilliárd dollárt költöttek akvizíciókra, ami drasztikus növekedés a 2020-as 942 és a 2019-es 82 millióhoz képest. A piacelemző 451 Research adatai alapján a 2019-es 48 akvizíciót 2021-ben 72 követte.

A cégfelvásárlásokkal a startupok még jobban felhívják magukra a befektetők figyelmét. Ez azért nagyon fontos, mert az utóbbi időben kockázati tőkések kevesebb pénzt költenek el ilyen céllal. A CB Insight szerint januártól márciusig tizenkilenc százalékkal esett vissza a teljes befektetés, míg a speciális rendeltetésű akvizíciós vállalatok bevezető ajánlattételei és a pénzgyűjtés negyvenöt százalékkal csökkent.

Az MI startupok a sok tehetséges, fiatal mérnökkel aranybányái a technikai lehetőségeiket bővíteni igyekvő vállalatok számára. Globális hiány van MI-mérnökökből.

Az akvizíciós hullám komoly hatással van a startupok pénzügyi részlegére. A kezdeteknél tartó cégek befektetési bankárokat és vállalatfejlesztés-specialistákat igyekeznek alkalmazni. Ezek a szakemberek pontosan a más startupokat felvásárló startupok megsegítésére specializálódtak, komoly segítséget jelentenek akvizícióknál.  

Génszerkesztéssel a környezetvédelemért

A genetikai kód tervezését forradalmasító módszer, a CRISPR génszerkesztő egyik feltalálója Jennifer Doudna (2. kép) szerint a technikával az emberiség legnagyobb problémái közül néhányra, például az éghajlatváltozásra is találhatunk megoldást.

Az MIT Technology Review-nak adott interjúban elmondta, hogy a CRISPR segíthet mikrobiális közösségeket a vízben és a talajban lévő szénhez való hozzáférésben.

crispr.jpg

A futurisztikus gondolat, ha megvalósul, nagyon komoly hatással lehet a jövőben, de még (a 2020-as Nobel-díjas) Doudna szerint is sok idő telhet el addig.

„Sokan foglalkoznak a CRISPR klinikai, orvosi felhasználásával. Ugyanakkor azt gondolom, hogy a következő évtizedben, amikor a technológia globális, illetve a hétköznapjainkra gyakorolt hatásán gondolkozunk, eszünkbe jutnak majd a mezőgazdasági alkalmazások, sőt, potenciálisan, az éghajlatváltozásra is komolyabb hatással lehet” – nyilatkozta.

crispr0.jpg

Az ötlet: növények olyan szintű „feljavítása”, hogy legalább néhány évig környezetükből felszívják a széndioxidot. Egyesek már kísérleteznek is gyökérrendszerek felerősítésével, és a széndioxid tárolásáért felelős védőburok fejlesztésével. Ugyanezek az eljárások élőlényeknek is segíthetnek több széndioxidot tárolni.

A CRISPR azonban nemcsak a több széndioxid tárolásában segíthet növényeken, hanem lehetővé is teheti számukra, hogy jobban ellenálljanak az egyre fenyegetőbb, a jövőre előbb-utóbb komoly diszruptív hatást kifejtő éghajlatváltozásnak.

A Kaliforniai Berkeley Egyetem kutatói például a rizs genetikáján akarnak módosítani, hogy a földkerekség egyik legfontosabb kalóriaforrása jobban ellenálljon a szárazságnak. A kutatásban a Doudna által alapított Innovatív Genomika Intézet is részt vesz. Egyelőre azonban nagyon korai szakaszban járnak. Először meg kell érteniük, hogy a különböző alkotóelemek hogyan kapcsolódnak egymáshoz.

A CRISPR eddig is bizonyította sokoldalúságát, és a tudósokat ugyan főként az orvosi alkalmazások lelkesítik, a globális élelmiszerláncra és az éghajlatváltozásra gyakorolt hatása viszont minden másnál fontosabb lehet.

Milyen következményekkel járhat, hogy Elon Musk felvásárolta a Twittert?

Az infokom világ egyik szenzációja, hogy Elon Musk múlt héten csilliárdokért felvásárolta a népszerű közösségimédia-oldalt, a Twittert. A felvásárlásban a szabad véleménynyilvánítás megőrzése is motiválta. Az évek során a vállalat bevett gyakorlatává vált ugyanis egyes tweetek promótálása, mások eltemetése. De hogyan akar ezen változtatni Musk?

A létező legegyszerűbb módon, a cég rangsoroló algoritmusának (ranking algorithm, lásd 2. ábra) nyilvánossá tételével. Egy ilyen algoritmus, például a Google-é vagy a Facebooké féltve őrzött kincs. Ezek a programok döntik el, hogy adott esetben milyen tweetek kerülnek a felhasználó hírfolyamába. A közösségimédia-vállalatok titokban tartják, utolsóként tennék közkinccsé.

Musk törekvése felkavarhatja az állóvizet. Andrew Ng, a gépitanulás-kutatás egyik legelismertebb képviselője néhány hete osztotta meg a témára vonatkozó gondolatait hírlevelében.

musk_twitter.jpg

Mi indokolja a rangsoroló algoritmusok titokban tartását? – teszi fel a kérdést, majd sorolja is az érveket.

Elsőként, így nehezebbé válik a csalók és a levélszemétküldők (spammers) tevékenysége, nehezebben manipulálják a program outputjait. Persze a védekezésnek léteznek más módjai is, de az algoritmus titokban tartása tényleg korlátozza a csalást. Más szempontból, nyílt forrású szoftverek is lehetnek nagyon biztonságosak, mert komplett közösségek lesik a hibákat, és tömik be a réseket. Ugyanakkor más egy hagyományos szoftvert megvédeni hackerektől, és más egy rangsoroló algoritmust megóvni a statisztikák manipulálásától. A támadók, ha rendelkeznek az algoritmus offline másolatával, és folyamatosan kísérleteznek, várhatóan jobban promótált üzenetformátumokat dolgoznak ki.

Másrészt, ha azt akarjuk, hogy minél többen értésék az algoritmus működését, akkor az azt működtető adatokat is nyilvánossá kell tenni, mert a rendszer viselkedése mindkettőtől függ. A Twitter adatainak nyilvánossá tétele nem praktikus, és nemcsak az adatsor monumentális mérete miatt, hanem mert a felhasználók érdekeit és jogait is sérti.

musk_twitter0.jpg

Harmadrészt, az algoritmus viselkedése, a gépi tanulás „fekete doboz” jellege miatt akkor is nehezen elemezhető, ha a kód és az adatok elérhetők.

Negyedrészt, a szabadalmaztatott algoritmusok versenyelőnnyel rendelkeznek. A Twitter rengeteg időt és anyagiakat fektetett az algoritmus fejlesztésébe, és a program a cég egyik védjegye, ez is megkülönbözteti a versenytársaktól. Ha nyilvános lesz, a riválisok versenyelőnyhöz jutnak.

A titokban tartás melletti érvek után Ng felsorolja az ellenérveket is, összesen kettőt.

Egyrészt, kutatók és a szélesebb szakmai közösség jobban megismerik az algoritmust, jobban figyelnek a problémákra és a szolgáltató semlegességére. Az ilyen típusú megfigyelés nyomás alatt tartja, és a termék állandó tökéletesítésére ösztönzi a céget, és ha jónak bizonyul, nagyobb a társadalmi elfogadottsága, többen bíznak meg benne.

Mivel ezek az algoritmusok milliók, milliárdok életét, demokratikus választások végeredményét befolyásolják, az állampolgárokat és a kormányokat megilleti az a jog, hogy többet tudjanak róluk.

Az online szabad véleménynyilvánításnak persze csak egy része a rangsoroló algoritmus, és Musk kicsit naivnak is tűnik, ráadásul a megengedőbb közösségi médiumokat elönti a gyűlöletbeszéd, sok a csalás, a levélszemét, süllyed a színvonal. A Twittert viszont az üzleti teljesítménye miatt érte rengeteg bírálat, ez tette lehetővé Musk színrelépését is.

Ng szerint bonyolult a kérdés, viszont hajlik az algoritmus legalább részleges közkinccsé tételére.

Emberarcú eladóbotok, LinkedIn profillal

Marketingesek mesterséges intelligencia által generált arcképekkel felturbózott, kamu közösségimédia-személyeket használnak termékeik szélesebb körű, költségvetésüket viszont nem növelő értékesítésére – állapította meg a Stanford Internet Observatory két kutatója, miután a LinkedInt tanulmányozva ezernél több, valószínűleg generatív ellenséges ideghálókkal (GAN) készített kamuprofilt fedeztek fel.

Cégek független marketingeseket vesznek fel üzleti körük bővítésére. Ezek a marketingesek közösségi médiafelületeken küldik el üzeneteiket a potenciális ügyfeleknek, csakhogy kamuprofilokat használnak ajánlatuk elküldéséhez. A válaszokat pedig az eredeti cég sales-részlegéhez továbbítják.

kamuprofilok.jpg

Nem nehéz ilyen profilokat találni. A LIA (LinkedIn Lead Generation Assistant) például online avatárokhoz való hozzáférést értékesít, amelyek aztán LinkedIn profilokat keresgélnek, hogy havi háromszáz dollárért találjanak elkötelezett ügyfeleket. Egy másik cég, a Renova Digital lehetővé teszi, hogy ügyfelei havi 1300 dollárért két avatárt használjanak. A felsorolás természetesen folytatható.

A két kutató figyelmeztetésére a LinkedIn törölte a közösségi szabályait megsértő profilokat: 2021 első félévében összesen tizenötmillió kamuprofilt távolított bel. Szinte az összest vagy a regisztrációnál, vagy gyanús viselkedést tanúsítva, automatikusan blokkolta.

kamuprofilok0.jpg

A stanfordi kutatók közkinccsé tettek pár tippet, hogy hogyan ismerhetők fel kamu LinkedIn-profilok.

Például a képek túl jól vannak elrendezve, a szemek mindig horizontálisan, a mértani középpontban találhatók, aszszimmetrikusak a fülbevalók, furcsán állnak a hajszálak. Ezeken a profilokon általában hosszasan sorolják fel a munkahelyeket, a betöltött pozícióról viszont jóval kevesebb az információ. Az alkalmazók között sok a nagyvállalat, például az Amazon, a Salesforce stb. A kamu oktatástörténetekben több a pontatlanság, logikátlanság, például egyesek olyan iskolákban nyertek el fokozatokat, amelyek nem adnak diplomát az adott fokozatból.

Mi mindebből a tanulság? Az, hogy a közösségi média korában vállalatok sokkal több potenciális fogyasztóhoz juthatnak el, mint amennyit a sales-részlegük elérhet. Ezért van szükségük innovatív mesterségesintelligencia-megoldásokra. Csakhogy a kockázat is nagy, mert ha kiderül a turpisság, bőven oda a potenciális nyereség. Hiába trendi a technológia, az átverés attól még átverés marad.

Emberarcú bowling-labdák

A különösen az Egyesült Államokban népszerű, sőt, kultikus, versenyzőknek komoly bevételeket generáló bowling egy bábusport, a teke rokona, egyes felosztások szerint a „tekecsalád” tagja.

Kívülállók számára mind egyforma, pedig vannak köztük bőven különbségek. Az aszfaltpályás tekézés „a” tekesport, a föld- vagy agyagpályán is játszott az itthon legnépszerűbb, a kugli, aztán volt még a mára elhalt, üdülőhelyeken űzött lengőteke, és az amerikaiak örömére, persze van a bowling is.

A végcél közös bennük: mindegyikben tíz bábut kell feldönteni az elgurított labdával.

openai_4.jpg

A bowling népszerűségét jelzi, hogy rengeteg a róla készült animáció és szintén számítógépes technológiával létrehozott bizarr mém. Az egyiket a lassan már legendásnak nevezhető, pedig csak pár éve alapított OpenAI szöveget képpé alakító (text-to-image generator) DALL-E2 rendszere hozta létre.

Adam Goldberg marketingmenedzser arra kényszerítette a mesterséges ideghálót, hogy csináljon képeket a pályán végig-gördülő „vibráló, mosolygó és nevető golyókról.” A végeredmény mindenkinek elnyerte a tetszését, a Twitter-re is kiposztolták.

A golyók tényleg mosolyt csalnak az arcunkra, megnevettetnek.

DALL-E2 munkái nem most kerültek fel először OpenAI-alkalmazottak Twitter-ére, viszont ezek a legszórakoztatóbbak.

Egy másik OpenAI tweeten Aravind Srinivas kutató ránézésre kézzel festett képet osztott meg. Természetesen ezúttal is az idegháló volt az alkotó, a kép „új nyelv megtanulására kísérletet tevő” robotot ábrázol. Aditya Ramesh, az előd DALL-E és a mostani DALL-E2 társfejlesztője elmondta: fejlett ideghálója még hatásosabb képeket tud majd generálni.

Az OpenAI évek óta lázban tartja és befolyásolja a szakmai közvéleményt. Csodás és szörnyűséges munkákat egyaránt jegyez, az utolsó frissítés viszont telitalálat. A bowling golyók egyébként azt is bizonyítják, hogy ez az MI már nemcsak a tartalomra, hanem a stílusra és az egyensúlyra is figyel.

Mit lát az MI az orosz-ukrán háborúból?

Ukrajna orosz inváziója a világtörténelem egyik legadatgazdagabb fegyveres konfliktusa. Rengeteg fénykép, videó, műholdas és más légifelvétel készül róla, nagyon sok a közösségimédia-anyag. Az információ-cunamiban való tájékozódásban, komplexebb kép kialakításában sokat segítenek a  mesterségesintelligencia-technikák.

Sokféle adattípust elemeznek MI-vel. A PrimerAI például természetesnyelv-modellt gyakoroltatott be az orosz argó és a katonai szleng felismerésére, és a rendszer el is csípett, majd átírt online küldött, egyáltalán nem titkosított rádióüzeneteket. A Berkeley Egyetem kutatói gépilátás-modelljeikkel azonosítanak sérült épületeket.

azonositas.jpg

Megölt, foglyul ejtett, kitelepített vagy háborús bűnt elkövető személyeket arcfelismeréssel igyekeznek azonosítani. Az online képek alanyok beleegyezése nélküli felhasználása miatt sokat kritizált Clearview AI startup az ukrán kormány számára tette elérhetővé technológiáját, de a kormánnyal kapcsolatban nem álló kutatók is hasonló eszközökkel igyekeznek elemezni a háborús képeket.

A Clearview AI kétszáz fiókot nyitott öt ukrán ügynökségnél, a hivatalos szervek eddig ötezernél több kereséshez használták az appot. A rendőrség a New York Times-nak elmondta, hogy halott orosz katonákat fotójuknak az Odnoklassniki közösségimédia-oldalra feltöltött képekkel való egyeztetésével igyekeznek azonosítani. Hadifoglyok és az Ukrajnában nem katonai munkát végzők azonosítására szintén használják a technológiát.

A Bellingcat holland oknyomozó csoport az orosz FaceClone appot gyakoroltatta a VKontakte közösségimédia-oldalon. Ukrán otthonokat kifosztó orosz katonák személyazonosságára derített fényt az eltulajdonított javak postázása közben. A Bellingcat korábban, a Tactical Systems katonaikiképző-céggel együttműködve, a Microsoft arcfelismerő technikájával cáfolta meg azokat a híreszteléseket, hogy egy elfogott orosz pilótát 2017-ben Putyin elnökkel közösen fényképeztek le.

Egy percig se legyenek kétségeink, hogy az orosz erők és szimpatizánsaik is ugyanezeket a technológiákat, vagy talán jobbakat is alkalmaznak ezekre a célokra, csak ők a Facebookot, Twittert, TikTokot stb. fürkészik. Putyin Oroszországában (különösen most) nem szokás a technikai újítások világgá kürtölése.

Az arcfelismerés hibás outputot is eredményezhet, ráadásul háborús időkben nagyobb a kapkodás, erősebb a rendszerekre nehezedő nyomás, könnyen előfordulhat kémek, bűnözők, halottak téves azonosítása. A háborús bűnösöket MI nélkül viszont még nehezebb lenne bíróság elé állítani.

süti beállítások módosítása