Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

A vírusok nyelve

2021. február 01. - ferenck

MIT-s (Massachusetts Institute of Technology) kutatók nyelvi modellt gyakoroltattak fertőző vírusokat, például a SARS-CoV-2 még virulensebbé tevő mutánsok előrejelzésére.

Abból indultak ki, hogy az immunrendszer vírusokra adott reakciója hasonlít ahhoz, ahogy az ember megérti a természetes nyelveket. A fertőző vírusok rendelkeznek biológiailag pontos „nyelvtannal” és szemantikus értelemben vett jelentéssel is, amire az immunrendszer vagy reagál, vagy nem. A mutációk javíthatnak ezeken a nyugtalanító minőségeken.

Kétirányú hosszú-rövidtávú (biLSTM) memóriát treníroztak egy nyelvi modell genetikai megfelelőjén. A modellnek mondatból hiányzó szót kellett kitalálnia. A gyakorlósor különféle fertőző hibákból eredő génszekvenciákat tartalmazott: 25 ezer influenza-, 60 ezer HIV és 4 ezer SARS-CoV-2 variánst.

virus_1.jpg

A biLSTM-et a szekvenciából hiányzó aminosav pótlására tanították meg. Közben a modell az aminoszekvenciák kapcsolatait megjelenítő beágyazásokat generált. Ezt követően, egyszerre csak egy aminosavon változtatva, mutálódott szekvenciákat hozott létre.

Egy-egy adott mutáció rangsorolásához súlyozott összeg valószínűségét vizsgálták – mennyire képzelhető el, hogy a mutálódott vírus megtartotta a fertőzött nyelvtant? Mekkora az eredeti és a mutálódott szekvencia beágyazása közötti szemantikai különbség?

Érdekes eredményeket kaptak, majd a modell legmagasabb pontszámú mutációit összehasonlították a valódi vírussal. A legjobb teljesítményt erősen fertőző és az antitestek elkerülésére képes SARS-CoV-2 variánsokat előrejelezve érte el, de két fajta influenzával és a HIV-vel is boldogult.

Nyelv és génszekvenciák hasonlóságait más kutatók szintén vizsgálták. A Salesforce-nál például aminosav-szerű szavak kezelésére, működő fehérjékből nyelvtanilag pontos „mondatok” írására alkalmas, az orvostudományban felhasználható nyelvi modellt gyakoroltattak.

Mivel a betegektől kell DNS-t venni, veszélyes mutációk felfedezése sokáig tart. Ártalmatlan mutációk előrejelzésével a problémásakat is könnyebb lesz megtalálni, és a vizsgálódások segítenek a járványkutatóknak, akik az új infók alapján könnyebben frissítik modelljeiket.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr2916409610
süti beállítások módosítása