Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Csendes robothal gyűjt infókat az óceán élővilágáról

2023. július 05. - ferenck

A túlhalászás, a környezetszennyezés, az éghajlatváltozás egyaránt súlyos veszély a bolygó területének hetven százalékát jelentő óceánok számára, amelyek ökoszisztémáiról a mai napig kevés információ áll rendelkezésre, ráadásul nagyon nehéz a biológiai sokszínűségről szóló, elegendő mennyiségű jó adathoz jutni.

A mostani kutatásokhoz általában az élővilágot zavaró és nem „érzékeny” környezetre kitalált ember nélküli, propelleralapú vízi járművek végzik az adatgyűjtést, amelyek kárt okozhatnak a korallokban, elriaszthatják a halakat stb.

robothal0.jpg

Az élővilág számára viszont életbevágó az óceánkutatás. Az óceánok szabályozzák a vizeket, az éghajlatot, a hőmérsékletet, mindenféle földi életet, az emberét is. Több mint nyolcvan százalékuk felderítetlen, biodiverzitásuk a bolygó „jólétének” kritikus tényezője.

Az ETH Zürich kutatói eldöntötték, hogy új módszerrel próbálnak pontosabb információhoz jutni az óceánokról. Belle nevű robothalat fejlesztettek, amely víz alatt úszik, a környezet megzavarása nélkül filmez, gyűjt mintákat az ottani élővilágról.

robothal1.jpg

A kutatók elmondták, hogy pont úgy akarják megörökíteni az ökoszisztémákat, ahogy azok viselkednek. Ezért fejlesztettek halként viselkedő, a többi élőlény által halként befogadott robothalat. Két dolgot kellett megvalósítani hozzá: mozogjon úgy, mint egy hal, és legyen csendes. Dolgozzon úgy, mint egy kém, kémlelje a vízi világ titkait.

robothal.jpg

A közel egy méter hosszú Belle fejében van az elektronika és a kamera, ez az egyetlen tényleg vízhatlan „testrésze.” A hasában vannak a motorok, az akkumulátor és a környezeti DNS-mintavételt biztosító szűrő és pumpák. Az összegyűjtött részecskékből, köztük lárvákból és algákból szedik ki a DNS-t, az alapján tudják meghatározni, hogy az óceán melyik részén milyen élőlények találhatók.

A robothal szilikonból készült végében lévő két üreg vízzel telik meg, és ürítődik ki. Belső pumpák szabályozzák, segítve a közel tízkilós Belle mozgását. Mivel rádiófrekvenciákra nem kapcsolódik, kétórányi adatgyűjtés után a felszínre úszik, és GPS-jeleket küld a kutatóknak, hogy merre keressék. Ők ürítik ki a szűrőket, és töltik fel, vagy cserélik ki az akkumulátort.

A fejlesztők bizakodnak, hogy robotjukkal a vízi élővilág számára biztonságosabb lesz az óceánkutatás.

Mesterséges intelligenciával írnak szövegeket a Mechanikus Török dolgozói

Hacsak nem kisebb MI-modellt tanítunk meg egy nagyobb utánzására, a géppel generált adatokon történő gyakorlás, úgy tűnik, befolyásolja a modell teljesítményét. Nehéz elképzelni, hogy kizárólag ChatGPT outputokon tanult nyelvmodellek felülmúlják magát a ChatGPT-t. Viszont ha humán adatokkal gyakorol, jobban teljesíthet nála.

Mindez azt jelenti, hogy az átláthatóság hiánya, azaz, ha nem tudjuk, melyik adat származik embertől, és melyik géptől, komoly kihívás MI-fejlesztők számára.

turk.jpg

Az Amazon 2005-ben indított Mechanikus Törökje fontos szerepet játszik a gépi tanulás fejlődésében, a szakterület sok ismert adatsora, például az ImageNet közösségi ötletbörze (crowdsourcing) eredménye.

Mivel meg vannak győződve arról, hogy a munkát emberek végzik, gépitanulás-fejlesztők gyakran használják gyakorlóadatok gyűjtésére és annotálására a Mechanikus Törököt és más hasonló szolgáltatásokat. Viszont ha a közösségi ötletbörzések jelentős része mesterséges intelligenciával dolgozik, megkérdőjeleződik az adatok minősége, és a rajtuk gyakoroltatott modell hitelessége. Friss kutatásokból kiderült, hogy a gyakorlósorban lévő MI által generált tartalom növekedésével fordított arányban, a modell teljesítménye gyengül.

turk0.jpg

A svájci EPFL (École Polytechnique Fédérale de Lausanne) kutatói kimutatták, hogy a Mechanikus Török alkalmazottai közül több írásos anyagán észlelhető a ChatGPT „kézjegye.”

44-en nagyjából száz szóban foglalták össze orvosi kutatások absztraktjait. A ChatGPT nyomait keresve, a kutatók két módszert használtak az elemzéshez.

Az elsőhöz a Hugging Face e5-base modelljét az emberek által korábban írt és a ChatGPT-t használók által generált összefoglalók megkülönböztetéséhez finomhangolták. A másodikkal nyomon követték a Mechanikus Török dolgozóinak billentyűleütéseit. Az egyező billentyűleütések és beadványok bizonyították: a szöveg ember munkája, míg a másolásra és beillesztésre utalók az ellenkezőjét, vagy legalábbis azt, hogy egyes részeket az MI generálta.

44 személy 46 írásos összefoglalóját elemezve kiderült, hogy 21-nél 50, 15-nél pedig 98 százalék vagy nagyobb volt az esély a ChatGPT szerzőségére. Másolást és beillesztést 41-hez használtak.

Az eredmény elgondolkoztató, a minta viszont túl kicsi, ráadásul az összegzés emberek számára kifejezetten munka-intenzív feladat, amit nyelvmodell is képes elvégezni. Más közösségi ötletbörze-tevékenységeket jóval nehezebb automatizálni.

A mesterséges intelligencia szabályozásának nehézségei

A mesterséges intelligencia gyors fejlődésével, a ChatGPT és a szöveges utasításokból képet létrehozó modellek, a generatív MI elterjedésével lassan már mindenki szabályozni akarja a területet. Az Európai Unió a kockázatokat csökkentő és a személyiségi jogokat védő törvényt dolgozott ki, az Egyesült Államokban pár hónapon belül várható a szabályozás.

Andrew Ng, világhírű gépitanulás-szakértő heti hírlevelében ezt a témát járja körül. Szabályozáspárti, viszont kétségei vannak: segítenek-e, hatékonyak lesznek-e az új törvények? Jelen pillanatban nagyon kevés döntéshozó rendelkezik elegendő ismerettel, érti eléggé a terület lehetséges előnyeit és kárait ahhoz, hogy működő törvényeket hozzon az MI-ről.

ai_regulation.jpg

„A kevés tudásnál csak egyetlen dolog veszélyesebb: ha anélkül tudunk keveset, hogy, értenénk, mennyire keveset tudunk” – figyelmeztet lényegre törően Ng.

Örül, hogy a szabályozók többet akarnak tudni az MI-ről, viszont veszélyes helyzetet teremthet, ha miután sokat beszélgettek kutatókkal és üzleti szereplőkkel, azt hiszik: elég jól ismerik már a területet. Ezzel szemben az igazság az, hogy a földkerekségen csak néhány személy rendelkezik például a következő kérdések megválaszolásához szükséges információkkal: hogyan befolyásolják az MI-vel kidolgozott fizetős hirdetések több országban a választásokat? Hozzájárul-e bármelyik közösségimédia-vállalat népirtáshoz vagy hasonló szörnyű eseményekhez? Milyen típusú MI által generált tartalmak készülnek, és hogyan befolyásolják az embereket?

A válaszokhoz jobban kellene ismerni az MI-fejlesztő vállalatokat. Tőzsdén jegyzett cégeknek sok országban részletes tájékoztatatást kell adniuk pénzügyi helyzetükről. A követelményeket tolakodónak vagy terhesnek találhatják ugyan, de az ezeken az információkon alapuló átláthatóság miatt nagyobb a pénzügyi rendszerekbe fektetett bizalom. Hasonlóra kellene törekedni az MI-fejlesztő vállalatokkal is: tevékenységüket részletesen ismertessék az illetékes állami hatóságokkal.

Nagy cégeknek esetleg elemezniük kell, vagy független szervezetek elemzik nekik, hogy mennyi különféle színezetű (fontos társadalmi kérdésekben pro vagy kontra álláspontot képviselő) tartalmat juttatnak el fogyasztóik különféle (lakhely, demográfia stb. szerinti) alcsoportjaihoz. Az eredmények összesítésével, a személyiségi jogok tiszteletben tartásával oldható meg a feladat. Ilyen típusú információkkal a szabályozók láthatnák a technológia és a valóvilág eseményei közötti összefüggéseket, nélkülük viszont képtelenek megfelelő szabályozást kidolgozni.

Az MI gazdagabbá teszi a világot, a kormányok pedig fontos szerepet játszanak az előnyök maximalizálásában és a hátrányok minimalizálásában. De amíg nem változik az átláthatóság, addig a törvényhozóknak nehéz felismerniük a technológia bármilyen irányú hatását. Nehéz lesz lobbistákat megakadályozni a törvényalkotás versenytársakat korlátozó befolyásolásában, saját érdekeik társadalmi érdekekkel szembeni érvényesítésében – összegez Ng. Bizakodik, hogy mindnyájan segíthetnek a szabályozóknak, hogy konstruktív szerepet játsszanak az MI fejlődésében.

Megmondja az MI, hogy mit lát az agy?

Két japán kutató, a szöveges utasításokból, promptokból képeket létrehozó egyik legismertebb modellt, a Stable Diffusiont használó módszert dolgozott ki tesztalanyok agya által látott képek rekonstruálására.

Azaz, arra keresték a választ, hogy mit lát az agy, amikor ránéz egy képre. Az alanyok agyát éppen ezért pont akkor szkennelték le, amikor tekintetük a képekre meredt.

agy_mit_lat.jpg

Gyakorlás közben, a szöveget képpé alakító MI „zajos” képpel és szöveges leírással kezd. Egy modell beágyazza a leírást, egy diffúziós modell pedig megtanulja, hogy a beágyazással egymást követő lépésekben eltávolítsa a képben lévő zajt.

Így történik maga a képgenerálás folyamata is: a rendszer tiszta zajjal és a leírással indít, majd a szövegnek megfelelően, iteratív módon távolítja el a zajt ahhoz, hogy elkészüljön a kép. Úgynevezett látens diffúziós modellekkel kevesebb számítással végezhető el az egész folyamat.

A Stable Diffusion más látens diffúziós szövegből képet generáló modellekhez hasonlóan, különböző beágyazásokat használ kapcsolódó képekhez és szöveges leírásokhoz.

Az emberi agy a szembe érkező inputot feldolgozó területe az input szenzorikus és szemantikus aspektusait kezelő részekre osztható. Funkcionális mágneses rezonanciás képalkotással (fMRI) végzett szkeneknél, ezek a területek külön-külön beágyazhatók a szokásos kép- és szöveg-beágyazásokhoz. A kutatás alanyaival ilyen szkeneket végeztek.

Ezeket a beágyazásokat használva, kiderült, hogy a Stable Diffusion létre tudja hozni az adott személy által agyszkennelés közben látott képet.

A kutatók megállapították: munkájuk annyira eltér a hasonló korábbiaktól, hogy nincs értelme kvantitatív összehasonlításnak. Minőségi szempontból, a témákhoz generált képek nagyjából ugyanazokat a jeleneteket ábrázolták, mint az alapképek, a részletek, egyes részletek viszont eltértek.

Kenyérpirító méretű kistestvért küld a James Webb űrteleszkóp mellé a NASA

A James Webb űrteleszkóp bő másfél esztendeje figyeli a Földtől 1,6 millió kilométerről a világegyetemet. Nem marad egyedül, mert az amerikai Nemzeti Űrügynökség, a NASA nemrég kiválasztott egy kenyérpirító méretű kocka-műholdat (CubeSat), hogy a James Webb tevékenységét a helyszínen támogassa.

A szokásosan idétlen szóösszetétel és még idétlenebb rövidítés végeredményeként MANTIS nevű szerkezetet a Colorado Boulder Egyetemen tervezik, fejlesztik. „Közeli csillagok tevékenységének UV képalkotásos és spektroszkópos monitorozása” (Monitoring Activity from Nearby sTars with uv Imaging and Spectroscopy) a teljes név (kis és nagybetűkre érdemes figyelni).

webb.jpg

A kicsi, de masszív űrszondát a tervek szerint 2026-ban indítják útjára. Az ultraibolya fény teljes tartományában, az extrém UV fényt (EUV) is beleértve, energetikusan fogja folyamatosan nézni az éjszakai égboltot. A Földtől többtucatnyi fényévre lévő és égő csillagokat tanulmányozva egészíti ki a James Webb exobolygókat – a naprendszeren kívül, idegen csillagok körül keringő bolygókat – megfigyelő tevékenységét.

A MANTIS a James Webb egyfajta ultraibolya segédeszköze, követi a „nagytestvért”, mindig oda néz, ahova az, a csillagkörnyezet fontos részével egészítve ki a megfigyeléseket – közölte Kevin France, a Colorado Boulder Egyetem kutatója.

webb0.jpg

A bolygók ugyanis a gazdacsillag sugárzása miatt gyakran bocsátanak ki nagymennyiségű EUV-t, amely azt jelzi, hogy elveszíthetik a légkörüket. A sugárzás mérése viszont nehéznek bizonyult, ezért jött képbe a MANTIS. Sok bolygót a műhold jóvoltából láthatunk majd először EUV-ben, és esetleg életnek otthont adó világokat is megtekinthetünk.

A kutatók azt is elmondták, hogy meg szeretnék érteni, hogyan befolyásolja a csillagokból jövő UV-fényfolyam bolygók atmoszféráját és lakhatóságukat.

Előrejelzés: dollárbiliókkal gazdagítja a világot a generatív mesterséges intelligencia

A generatív mesterséges intelligencia munkahelyeket megszüntető hatása évek óta félelmet kelt. Egy friss CNBC-felmérés alapján amerikai munkavállalók 24 százaléka nagyon, vagy valamelyest fél az MI miatt. A fiatalok (18-24 évesek) jobban tartanak a jövőtől, mint a 65 felettiek: előbbiek 32, utóbbiak 14 százaléka. Kisebbségek körében szintén erősebb a félelem: az ázsiaiak 38, az hispanók 35, az afroamerikaiak 32, míg a fehérek 19 százaléka aggódik. Vagyon alapján is fontos a különbség: az évi 50 ezer dollárnál kevesebbet keresők 32, míg a 150 ezernél magasabb jövedelemmel rendelkezők 16 százaléka tart az MI álláspiaci következményeitől.

generativ_mi0.jpg

Összehasonlításként, egy 2013-as oxfordi előrejelzés alapján a következő tíz évben, azaz 2023-ig, az amerikai dolgozók 47 százalékának munkáját fenyegeti az automatizáció. És mi történt? Rekord-alacsonyszinten vannak az amerikai munkanélküliség-mutatók, az MI és a robotika által fenyegetettnek vélt területeken nőtt az állások száma.

E statisztikák fényében érdemes helyiértékén kezelni a McKinsey egyébként érdekes friss elemzését a generatív MI termelékenységre és munkaerőre gyakorolt hatásáról. A jó hír: a jövőben évente 2,6-4,4 billió dollárral növelheti a globális éves bevételt, ez pedig a világ összesített éves GDP-jének 2-4 százaléka!

A szerzők 2040 és 2060 közötti adaptációs forgatókönyveket és a munka termelékenységére gyakorolt hatásukat vizsgálták. Felhasználási esetek, például ügyfélszolgáltatásra alkalmazott nyelvmodellek üzleti következményeit elemezve, állapították meg, hogy globális alkalmazás esetén a generatív MI nagyon komoly pénzügyi, gazdasági hasznot teremt.

Munkakörök érzékszervi, kognitív, fizikai, nyelvi és társadalmi elvárásait figyelembe véve, potenciálisan 850 állásfajta automatizálható.

A high-tech szektor lesz a legnagyobb haszonélvező, jelenlegi értéke 4,8-9,3 százalékkal nőhet. A bankszektor, az oktatás, a gyógyszeripar és a telekommunikáció, 2-5 százalékos értéknövekedéssel, szintén a generatív MI haszonélvezőjévé válik.

Négy tevékenységcsoport – értékesítés és marketing, szoftverfejlesztés, ügyfélszolgálat, terméktervezés és -fejlesztés – adja a teljes lehetséges gazdasági növekedés 75 százalékát.

Nyolc fejlett és fejlődő gazdaságú országot vizsgálva, a szerzők megállapították, hogy a generatív MI jól jövedelmező állásokban, mint a szoftverfejlesztés és a termékfejlesztés nagyon sok feladatot automatizál, illetve a legmagasabb és a második legmagasabb jövedelmi ötödbe tartozó munkakörök legtöbb feladatát szintén automatizálja: 2040 és 2060 között a munkafeladatok kb. felét, és főként a logikus érvelést, valamint a természetes nyelv megértését igénylő állásokhoz kötődő feladatokat.

Hackertámadás érte a Microsoftot

Június első hetében a Microsoft szinte összes szolgáltatása, köztük az Azure, az Outlook és a Teams is leállt, és közel tizenöt órába telt, míg sikerült mindent helyreállítani. A nagyvállalat jóval később, csak a múlt héten jelentette be, hogy cybertámadás, egész pontosan elosztott szolgálatmegtagadással járó (Distributed Denial-of-Service, DDoS) támadás állt a „globális kimaradás” mögött.

A támadók több virtuális magánszervert (Virtual Private Server, VPS), proxi kiszolgálókat, bérelt felhőinfrastruktúrát és DDoS-eszközöket használtak. A támadás ugyan körmönfont volt, felhasználói adatokhoz mégsem fértek hozzá, így nem is tudtak változtatni azokon – hangsúlyozza a Microsoft.

microsoft_hacking_2.jpg

A DDoS-támadás lényege, hogy a rendszer ismert gyenge tulajdonságai vagy valamilyen speciális protokoll tulajdonságai a célpont, a felhasználók pedig ne érjék el a nekik fontos infókat, gépet, hálózatot. A rendszer lelassul, elérhetetlen lesz, legrosszabb esetben leáll.

A nagyvállalat a technikai részleteket is megosztotta. A támadó Storm-1359 botnetek és más eszközök sokaságával támadta a cég szervereit, és idézett elő túlterhelést. Ezt például a világ változatos pontjain lévő IP-címekről küldött többmillió HTTP(S) lekéréssel érte el.

A Microsoft szerint Storm-1359 zavarkeltésre és a nyilvánosságra összpontosít. Az Azure-felhasználóknak tanácsokat is adtak, hogy a jövőben hogyan védekezzenek hasonló DDoS-támadásokkal szemben. A károkról és az anyagi következményekről nem árultak el részleteket.

Nem sokkal a támadás után a Névtelen Szudán hackercsoport vállalta magára a felelősséget. Később a Microsoft közölte, hogy ez valószínűleg így is van, tényleg ők állhatnak a háttérben.

A Névtelen Szudán 2023 elején tűnt fel, a szudáni politikába beavatkozó külföldi országok online rendszereit igyekszik támadni. Legalábbis ezt mondják, egyes internetbiztonsági szakértők szerint viszont a Kreml- és Putyin-barát Killnet hackercsoporttal állhatnak kapcsolatban, és az afrikai országra történő hivatkozással csak a figyelmet akarják elterelni.

Beépül a ChatGPT Mercedes-autókba

A Mercedes-Benz és a Microsoft múlt csütörtökön jelentette be, hogy partnerség keretében közösen tesztelik a ChatGPT használatát autókban. Így a technológia több mint 900 ezer jármű számára lesz elérhető az Egyesült Államokban, és az amerikai vezetők péntektől már használhatják is az opcionális bétaprogramot.

A Microsoft egyik szóvivője elmondta, hogy ez a ma már legendás MI-chatbot első implementációja járműben. A technológiát a Hey Mercedes hangasszisztensen keresztül használják, és a várakozások alapján jelentős mértékben növeli a rendszer képességeit.

mercedes_1.jpg

Az ügyfelek vagy a Mercedes me alkalmazáson, vagy közvetlenül a járműben, hangutasítással regisztrálhatnak. Annyit kell mondaniuk, hogy „helló Mercedes, csatlakozni akarok a bétaprogramhoz.”

Mivel a legtöbb hangasszisztens előzetesen definiált feladatokra és válaszokra korlátozott, a ChatGPT sokkal fejlettebb természetesnyelv-megértésével jócskán bővül a megválaszolandó témák száma – hangsúlyozza a Mercedes.

Más szektorokhoz hasonlóan, a ChatGPT használata az autóiparban is viták tárgya. Egyesek, például a General Motors (GM) szerint autonóm járművek már használnak mesterségesintelligencia-, gépitanulás-megoldásokat. Valóban így van, viszont a Mercedes-Microsoft partnerség a ChatGPT egyik első nagyon speciális alkalmazása. (A GM egyébként idén már vizsgálta a ChatGPT felhasználási eseteit a járműveiben.)

Eric Boyd, a Microsoft MI platform alelnöke többek között a hangutasítások és az interakció, a képességek, a kérdés-feleletek javuló minőségét várja az integrációtól.

A ChatGPT-vel hosszabb kommunikációk folytathatók, és nemcsak a beszélgetés kezdetén érti a szövegkörnyezetet. A vezetők bonyolult kérdéseket tehetnek fel neki, fordulatosak lehetnek a beszélgetések, az új hangasszisztenstől pedig releváns és részletes válaszokat kapnak – emeli ki Boyd.

A háromhónapos bétaprogram és a felhasználói visszajelzések alapján, a Mercedes dönteni fog a technológia további integrációjáról.

A játékfejlesztők is szeretik a generatív mesterséges intelligenciát

A generatív mesterséges intelligencia leegyszerűsítheti a videojátékok gyártását, és a stúdiók egyáltalán nem lesznek boldogtalanok, mert az MI-vel csökkennek a kiadások, hamarabb elkészülnek a munkák, hagyományos módszerekkel nehezen megvalósítható, nem praktikus kreatív kísérleteket is végezhetnek, például művészi stílusokkal, karakterekkel, párbeszédekkel stb. próbálkozhatnak eddig nem látott módokon.

Tekintettel az egyre csak növekvő hatalmas költségekre, a játékfejlesztés tényleg megérett a generatív MI integrálására. Az átalakulás viszont állások megszűnésével járhat, és csak bizakodhatunk, hogy új munkahelyeket is teremt a szektorban. A „nagyok” már alkalmazzák a technológiát, még látványosabb virtuális világokat építenek vele. Az igazi nyertesek azonban nem ők, hanem a sok kis stúdió lesz.

gaming_ai.jpg

Infokom technológia nagyvállalatok folyamatosan kínálnak új MI-modelleket, de közben maguk a játékgyártók is fejlesztenek mesterséges intelligenciával médiamegoldásokat.

Az Nvidia új rendszere lehetővé teszi, hogy játékosok közvetlenül társalogjanak játékon belüli karakterekkel. Az Avatar Cloud Engine (avatár felhőmotor, ACE) tajpeji bemutatóján a játékkarakter a játékmenetet tovább vivő információkkal válaszolt valósidőben a játékosnak. Az ACE értelmezte a játékost, generálta a karakter hangját és szövegét, és irányította az animációt.

gaming_ai0.jpg

A Scenario startup speciális felhasználói felülettel rendelkező, szövegből képet generáló modellt kínál fejlesztői eszközök finomhangolásához. Egy másik vállalat, a Didimo szövegből 3D modellt létrehozó rendszerével szerkeszthető, animációra kész, fejlesztőbarát formátumú karaktermodellek hozhatók létre.

A Blizzard Entertainment saját játékaiból származó eszközökhöz gyakoroltatott be képgenerátort. Fejlesztők karakterekhez és környezetekhez dolgozzák ki elképzeléseiket az új eszközzel. Egy másik nagyágyú, a Ubisoft dialógusgenerátort mutatott be. Írók játékkarakter-párbeszédeket alkothatnak a modellel – megadnak neki egy promptot, amire több változattal áll elő.

Techcégek és játékgyártók mellett maguk a játékosok is használják a generatív MI-t, alkalmasint kedvenc játékukat változtatják meg vele, például hangklónozással adnak szöveget hallgatag karakterek szájába.

Mélytanulással jobban, pontosabban észrevehetők, követhetők sejtek

Sejtek növekedését, osztódását hosszú idő alatt felvett képeket rövid időn belül lejátszó (time-lapse) mikroszkóptechnikával vizsgálják. A technika jól működik, viszont az így keletkezett óriási adatmennyiséget szinte lehetetlen manuálisan kezelni.

Mélytanulással (deep learning) szerencsére könnyebb megbirkózni gigantikus adathalmokkal. A Santa Cruzi Kaliforniai Egyetemen fejlesztett DeepSea (MélyTenger) egyike azon kevés modelleknek, amelyekkel sejtek szegmentálhatók, követhetők, osztódásuk pontosan megfigyelhető. (A gyakorló adatsor, a felhasználóbarát és nyílt forráskódú szoftver a DeepSea honlapján elérhető.)

sejt0.jpg

A time-lapse alapú mikroszkópokkal a kutatók egyes sejtek osztódását, különböző sejtekké válását – őssejtek speciális sejttípussá alakulását –, formájuk és méretük változását követve, biológiai jelenségeket mérve, juthatnak el új felfedezésekig. Miután a képeket összegyűjtötték, két fontos feladatot kell elvégezniük: a szegmentálást, azaz a sejtek határainak megállapítását és elválasztásukat a háttértől, valamint a sejtek kockáról kockára követését (ld. a két kép közti különbséget.)

A képek válogatása, kezelése tipikusan számítógépnek, és nem embernek való feladat. Ezért hasznos a szegmentálást kevesebb mint egy másodperc alatt elvégző, sejtek követésében 98 százalékos pontosságot elért DeepSea.

sejt_1.jpg

A sejtosztódás detektálása külön kihívást jelentett a fejlesztőknek, mégpedig azért, mert MI-alapú technikák, gépilátás-rendszerek ritkán szembesülnek egy objektum kettéválásával.

A 2D-UNET modellen alapuló, a gyorsaságot és a jó eredményeket viszont sokkal kevesebb paraméterrel elérő DeepSea általánosítható, azaz sok sejttípus vizsgálható vele. A legjobb „sejtfigyelő” modellekkel összehasonlították, és pontosságban, gyorsaságban egyaránt felülmúlta őket. Tüdő-, izom- ős- és egyéb sejteket tartalmazó adatsoron gyakoroltatták, a jövőben még több fajtával bővíthető a repertoár.

Már egy felfedezésre is jutottak vele: a többsejtű élet alapját jelentő, mindenféle más sejttípusra osztódó embrionális őssejtek, amelyekről ismert, hogy szokatlanul gyorsan osztódnak, úgy szabályozzák méretüket, hogy a kisebb sejtek hosszabb időt töltenek a növekedéssel, mielőtt a következő generációs sejteket létrehoznák. A kutatók egyelőre nem tudják, hogy miért van így, és azt sem, hogy pontosan hogyan történik.

A jövőben sejtek térbeli kapcsolatait, sejtjegyek 3D mintázatokká szerveződését, szerkezetek formálódását igyekeznek tanulmányozni, és a címkézett sejtképek hiányát is próbálják megoldani.

süti beállítások módosítása