Ha egy molekuláris szerkezet képét elforgatjuk, az ember meg tudja mondani, hogy ugyanaz a molekula, gépi tanuló modell viszont új adatpontként kezelheti. Számítástechnikai szaknyelven a molekula szimmetrikus: ugyanaz marad, ha bizonyos átalakulásokon megy keresztül, például elforgatjuk.
Szimmetrikus adatokkal több területen, különösen a természettudományokban és a fizikában találkozunk. A szimmetriát felismerő MI-modell képes objektumok azonosítására, teljesen függetlenül attól, hogy hol találhatók az adott képen.
Viszont, ha például egy gyógyszerkutató modell nem érti a szimmetriát, pontatlan előrejelzéseket tehet molekuláris tulajdonságokról. De a tapasztalati sikerek ellenére sem világos, létezik-e számítási szempontból hatékony módszer a szimmetriát garantáltan tiszteletben tartó jó modell betanítására.
Az MIT (Massachusetts Institute of Technology) kutatói bemutatták az első ilyen, mind a számítási, mind az adatigény tekintetében bizonyítottan hatékony, szimmetrikus gépitanulás-módszert. A módszer komoly segítség lesz a szimmetriát jobban kezelő alkalmazásokban, új anyagok felfedezésétől csillagászati anomáliák azonosításáig, komplex éghajlati mintázatok megfejtéséig, számos területen hasznosítható modellek fejlesztésénél.
Szimmetrikus adatok kezelésére nem könnyű betanítani modelleket.
Az adatkiegészítés az egyik bevett módszer: az összes szimmetrikus adatpontot több adatponttá alakítják át, hogy a modellt jobban általánosíthassuk új adatokra. Például új gyakorlóadatokhoz többször elforgatunk egy molekuláris szerkezetet, viszont ha azt akarjuk, hogy garantáltan tiszteletben tartsa a szimmetriát, ez korlátozó lehet számítási szempontból.
Alternatív lehetőség a szimmetriának a modell architektúrájába kódolása, például a gráf neurális hálózatok (GNN), amelyekről viszont senki nem tudja, mit tanulnak és miért működnek. Az MIT-kutatók ezt próbálták megérteni, elméletileg kiértékelni, mi történik akkor, ha az adatok szimmetrikusak. Szimmetrikus adatokkal végzett gépi tanulás statisztikai-számítási kompromisszumát vizsgálták. A kompromisszum lényege, hogy kevesebb adatot igénylő módszerek számítási szempontból drágábbak lehetnek, ezért meg kell találni a korrekt egyensúlyt.
Az elméleti kiértékelésre alapozva tervezték meg a szimmetrikus adatokkal eredményesen dolgozó gépitanulás-algoritmust. A probléma zsugorítására, egyszerűsítésére az algebrából, átfogalmazására a geometriából vettek át a szimmetriát jól megragadó ötleteket. Végül a kettőt a hatékonyságot megoldó optimalizációs problémaként hozták közös nevezőre, és az új algoritmus lett az eredmény.
Elmondták, hogy a legtöbb elmélet és alkalmazás vagy az algebrára, vagy a geometriára összpontosít, és a kettőt egyesítve, ők innen léptek tovább. A hagyományos megközelítéseknél kevesebb adatminta kell a gyakorláshoz, amellyel a modell pontosabb, jobban adaptálódik új alkalmazásokhoz.
A megközelítéssel GNN-ek is könnyebben elemezhetők.