A Nemzetközi Energiaügynökség előrejelzése szerint, mivel a fejlesztőcégek egyre nagyobb modellek gyakoroltatására és működtetésére összpontosítanak, az MI energiafogyasztása és az üvegházhatású gázok kibocsátása növekedni fog. Minél pontosabb egy modell outputja, annál több káros gáz termelődik, és annál több ember is használja.
A probléma elvileg a paraméterek számával csökkenthető: kisebb modellek kevesebb energiát használnak el. De stratégiailag még fontosabb, hogy a megfelelő modellt találjuk meg a megfelelő feladathoz. MI-szolgáltatók úgy is csökkenthetik a károsanyag-kibocsátást, hogy a bemeneteket azokat pontosan és hatékonyan feldolgozó modellekhez irányítják, a kimeneteket pedig megfelelő hosszúságúra korlátozzák.
Ehhez a stratégiához se új infrastruktúrát, se új modellt nem kell építeni.
Német kutatók tizennégy nyílt súlyú nagy nyelvmodellen (LLM-en) tanulmányozták a széndioxid- és más károsanyag-kibocsátást (zárt modellekhez szükséges információk nem állnak rendelkezésre). Kiderült és számszerűsítették, hogy az érvelés, a token-generálás és a kérdés-válasz referenciaértékek pontossága összefügg a nagyobb energiafogyasztással.
Változatos méretű, érvelő-készséggel rendelkező/nem rendelkező modelleket teszteltek kérdésekkel, amelyeket röviden és hosszan is meg kellett válaszolni. Mindegyiknek százat tettek fel, öt témakörben: filozófia, világtörténelem, nemzetközi jog, absztrakt algebra, matematika. A kérdéseket két formában fogalmazták meg: több felelet közül választós egyszavas válaszokkal, nyitott válaszokat kiváltó promptok. Az OpenAI o4-mini értékelte a nyílt válaszokat.
A modelleket nyolcvan gigabájt memóriájú Nvidia A100 GPU-n futtatták, és megmérték a chip által elhasznált energiamennyiséget. A kilowattórában kifejezett energiafogyasztást globális átlaggal (kilowattóránkénti 480 gram széndioxid-egyenértékkel) szorozták meg, hogy meghatározzák a keletkező kibocsátást.
Így jöttek rá a párhuzamokra. A 84-91 százalék pontos, csúcsteljesítményű modellek ezer (ötszáz-ötszáz) kérdésnél 1300-2000 gramm széndioxidot vagy annak megfelelő gázt termeltek. A legkisebb mindössze 35 százalékban vagy még kevésbé volt pontos, de 2000 helyett is csak maximum harminc gramm káros gáz kibocsátásáért volt felelős.
Ugyanazon modellek energiahasználata megnégyszereződött, meghatszorozódott, a Deep Cogitoé például 56 grammról 372-re ugrott, amikor érvelniük kellett.
A szerzők elmondták: a kibocsátásokat valószínűleg túlbecsülték, mert az öregebb GPU-k energiahatékonyabbak az újaknál, és mert sok számítási felhőnek megújuló energiaforrásokkal működő adatközpontok adnak otthont.