Mi történik, ha mesterséges intelligencia tervez számítógépes chipeket? Például csökkennek a fejlesztési költségek, ami komoly, robbanásszerű változásokat hozhat a computer-gyártásban, különösen az adatok speciális feldolgozását igénylő területeken.
A Google ezen az úton jár, mérnökei megerősítéses tanulással (Reinforcement Learning, RL) rendezték el a tenzorfeldolgozó egységük (TPU) legújabb változatának alapját jelentő többmilliárd tranzisztort. A TPU-chipeket komoly számításokat végző ideghálókra optimalizálják.
A Google 2015-ben mutatta be az első TPU-t, ma ezek a – fejlesztők számára a nagyvállalat számítási felhőjében (Google Cloud) elérhető – chipek működtetik az olyan szolgáltatásokat, mint például a keresés vagy a fordítás.
A tanulórendszer nagyon jól teljesített, a tervet hat óra alatt készítette el. Összehasonlításként: az eddigi módszerekkel ugyanez hetekig eltarthatott volna.
A chiptervezés olyan, mint egy társasjáték. A szilíciumréteg a táblára emlékeztet, a paraméterek, mint például a makrók száma vagy a topológiák a játék különféle elemeihez, míg a kiértékelési mutatók a győzelmi feltételekhez hasonlítanak. A megerősítéses tanulás kifejezetten jól működik ilyen feltételek mellett.
A kutatók tízezer chipből álló adatsorokon 48 óráig gyakoroltattak egy ideghálót. A háló a chipekről átalakítható reprezentációkat generált. Míg az előzetes gyakorlás felügyelet mellett ment, egyes fontos részei megerősítéses tanulással történtek. A bemenet egy adott tervrajzhoz kapcsolódott, az MI „jutalmat” kapott a torlódások és a vezetékhossz csökkentéséért. A rendszer hat óra alatt kivitelezte a finomhangolást.
A Google mérnökei meglévő TPU-t tervező személyek alkotta csapat munkájával hasonlították össze a mesterséges intelligencia által generált outputot, és a drasztikus időbeli különbség mellett az is kiderült, hogy a vezetékhossz és a fogyasztás szempontjából az MI legalább olyan jól, de általában jobban teljesített, mint a mérnökök.