A DNS az emberi test felépítésének és működésének a „teljes receptje.” A Google DeepMind AlphaGenome MI-modellje ezt a receptet igyekszik értelmezni, ismereteinket bővíteni, segítségével tudósok mutathatják ki a DNS-ben lévő csekély, de fontos különbségeket, például, hogy mitől alakulhat ki magas vérnyomás, öregkori demencia, elhízás, bármely genetikai alapú megbetegedés vagy a rák. Az MI új gyógyszerek kikísérletezésében is a medicina hasznára válhat.
A fejlesztők szerint modelljük még nem tökéletes, szakértők viszont máris mérföldkőről beszélnek.

Az emberi genom a DNS-kód mintegy hárommilliárd betűjéből áll, amelyeket az A, a C, a G és a T jelenítenek meg. Nagyjából két százalék a test növekedéséhez és működéséhez szükséges összes fehérjét kódoló gén. A kevésbé értett 98 százalék, a „sötét genom” kulcsszerepet játszik a gének szervezetben történő felhasználásában. Betegségekhez kapcsolódó sok mutációt ebben az állományban kell keresnünk.
A „sötét genom” megfejtésében segítő AlphaGenome egymillió kódbetűt képes egyszerre elemezni, megmutatja hol és mire van hatással, előrejelzi, hol vannak a gének. Talán a legfontosabb, hogy akár a genetikai kód egyetlen betűváltozásának a következményeit is megmondja.
A szintetikus biológiában és a génterápiában alkalmazható új DNS-szekvenciák tervezésében szintén segíthet. Nem-kereskedelmi célú használatát tavaly engedélyezték, ma már legalább háromezer tudós dolgozik vele.
„A tudományos fejlődés új korszakának kezdetén járunk, és az MI sok különféle áttörést tesz lehetővé” – jelentette ki a Google DeepMind tudományos és stratégiai kezdeményezésekért felelős részlegének elnökhelyettese, Pushmeet Kohli.
Az emberi és egérsejt-kísérletek nyilvánosan hozzáférhető adatbázisain begyakoroltatott AlphaGenome nem úgy működik, mint a szekvencia következő szavát előrejelző nagy nyelvmodellek, az LLM-ek. Helyette „szekvencia-funkció” MI, amely azt vizsgálja, hogy a szövegben bekövetkező változások hogyan befolyásolják a végső jelentést.
Általános vélemény, hogy a modellen sok a finomítanivaló. Egyes területeken kevésbé pontos, mint másokban: gének szabályozásának előrejelzése nagy – több mint százezer betűnyi kód – távolságokon, különböző szövettípusok kezelése stb. Például egy agyi neuronnak ugyanaz a genetikai kódja, mint egy szívsejtnek, a genetikai utasítások sejttípusonkénti használata viszont eltér egymástól.






