Az infokom világ egyik szenzációja, hogy Elon Musk múlt héten csilliárdokért felvásárolta a népszerű közösségimédia-oldalt, a Twittert. A felvásárlásban a szabad véleménynyilvánítás megőrzése is motiválta. Az évek során a vállalat bevett gyakorlatává vált ugyanis egyes tweetek promótálása, mások eltemetése. De hogyan akar ezen változtatni Musk?
A létező legegyszerűbb módon, a cég rangsoroló algoritmusának (ranking algorithm, lásd 2. ábra) nyilvánossá tételével. Egy ilyen algoritmus, például a Google-é vagy a Facebooké féltve őrzött kincs. Ezek a programok döntik el, hogy adott esetben milyen tweetek kerülnek a felhasználó hírfolyamába. A közösségimédia-vállalatok titokban tartják, utolsóként tennék közkinccsé.
Musk törekvése felkavarhatja az állóvizet. Andrew Ng, a gépitanulás-kutatás egyik legelismertebb képviselője néhány hete osztotta meg a témára vonatkozó gondolatait hírlevelében.
Mi indokolja a rangsoroló algoritmusok titokban tartását? – teszi fel a kérdést, majd sorolja is az érveket.
Elsőként, így nehezebbé válik a csalók és a levélszemétküldők (spammers) tevékenysége, nehezebben manipulálják a program outputjait. Persze a védekezésnek léteznek más módjai is, de az algoritmus titokban tartása tényleg korlátozza a csalást. Más szempontból, nyílt forrású szoftverek is lehetnek nagyon biztonságosak, mert komplett közösségek lesik a hibákat, és tömik be a réseket. Ugyanakkor más egy hagyományos szoftvert megvédeni hackerektől, és más egy rangsoroló algoritmust megóvni a statisztikák manipulálásától. A támadók, ha rendelkeznek az algoritmus offline másolatával, és folyamatosan kísérleteznek, várhatóan jobban promótált üzenetformátumokat dolgoznak ki.
Másrészt, ha azt akarjuk, hogy minél többen értésék az algoritmus működését, akkor az azt működtető adatokat is nyilvánossá kell tenni, mert a rendszer viselkedése mindkettőtől függ. A Twitter adatainak nyilvánossá tétele nem praktikus, és nemcsak az adatsor monumentális mérete miatt, hanem mert a felhasználók érdekeit és jogait is sérti.
Harmadrészt, az algoritmus viselkedése, a gépi tanulás „fekete doboz” jellege miatt akkor is nehezen elemezhető, ha a kód és az adatok elérhetők.
Negyedrészt, a szabadalmaztatott algoritmusok versenyelőnnyel rendelkeznek. A Twitter rengeteg időt és anyagiakat fektetett az algoritmus fejlesztésébe, és a program a cég egyik védjegye, ez is megkülönbözteti a versenytársaktól. Ha nyilvános lesz, a riválisok versenyelőnyhöz jutnak.
A titokban tartás melletti érvek után Ng felsorolja az ellenérveket is, összesen kettőt.
Egyrészt, kutatók és a szélesebb szakmai közösség jobban megismerik az algoritmust, jobban figyelnek a problémákra és a szolgáltató semlegességére. Az ilyen típusú megfigyelés nyomás alatt tartja, és a termék állandó tökéletesítésére ösztönzi a céget, és ha jónak bizonyul, nagyobb a társadalmi elfogadottsága, többen bíznak meg benne.
Mivel ezek az algoritmusok milliók, milliárdok életét, demokratikus választások végeredményét befolyásolják, az állampolgárokat és a kormányokat megilleti az a jog, hogy többet tudjanak róluk.
Az online szabad véleménynyilvánításnak persze csak egy része a rangsoroló algoritmus, és Musk kicsit naivnak is tűnik, ráadásul a megengedőbb közösségi médiumokat elönti a gyűlöletbeszéd, sok a csalás, a levélszemét, süllyed a színvonal. A Twittert viszont az üzleti teljesítménye miatt érte rengeteg bírálat, ez tette lehetővé Musk színrelépését is.
Ng szerint bonyolult a kérdés, viszont hajlik az algoritmus legalább részleges közkinccsé tételére.