Új nyílt multimodális mesterségesintelligencia-modellt tett közzé a Mistral

2025. április 03. - ferenck

A Mistral a Földközi-tenger melletti dél-francia megyéken végigsüvítő hideg szél, elsősorban Marseille-t és környékét, de keleten Toulonig az egész tengerparti térséget, északon a napsütötte Provence-t is sújtja, nyugaton pedig Languedoc megyében (székhelye Montpellier) is érezteti hűvös hatását.

A Mistral egy mesterségesintelligencia-fejlesztő párizsi startup neve is.

Az európai MI-kutatás motorja Franciaország, zászlóshajója a 2023-ban három vizionárius kutató (Arthur Mensch, Guillaume Lample és Timothée Lacroix) által alapított Mistral AI. Ugyanarra az egyetemre, a Párizshoz közeli École Polytechnique-re jártak, a Google DeepMindnál és a Meta Platformsnál tettek szert gyakorlatra és komoly tapasztalatra. MI-megközelítésük viszont más, merészebb, mint a mainstream.

Megkérdőjelezik a „nagy MI” átlátszatlan doboz jellegét, és a csúcstechnológiát mindenki számára elérhetővé kívánják tenni. Magyarán nyílt forráskóddal, nyílt súlyú nagy nyelvmodellekkel (LLM) és a hozzáférhetőséggel demokratizálják az MI-t, innovatív modelleket, termékeket, szolgáltatásokat és más kapcsolódó megoldásokat. A terület nagyágyúi, a szabadalmaztatott modelljeikkel az MI-t védett kertbe zárni igyekvő mamutvállalatok alternatívájaként határozzák meg magukat. (Ez a filozófia azt követően is működik, hogy tavaly februárban partnerségre léptek a Microsofttal.)

„Építsétek velünk a jövőt” – hangzik a szlogenjük.

Legújabb modelljüket, a Mistral Small 3.1-et március végén tették közkinccsé. A 24 milliárd paraméteres LLM értelemszerűen nyílt súlyú, szöveget és képeket dolgoz fel (multimodális), miközben fogyasztói hardveren, mint az RTX 400 grafikus kártyával fut.

A Mistral Small 3.1 különféle ismeretek és utasítások vonatkozásában felülmúlja a Gemma 3-at, a Google Gemini 2.0-n alapuló új nyílt forrású modelljét és hozzá hasonló kisméretű modelleket is. Akár 128 ezer kontextus-tokent képes kezelni, másodpercenkénti százötven token sebességgel működik, azaz gyors is.

Az új változat jól szemlélteti, hogy a nyílt MI-modellek közötti verseny hogyan csökkenti a szabadalmaztatott alternatívákkal szembeni teljesítménybeli különbségeket, miközben fejlesztők is szabadon hozzáférhetnek.