Az Nvidia és az Alibaba új nagyteljesítményű nagy nyelvmodellt (LLM) tett közzé, míg a Stability AI bemutatta a zászlóshajónak számító, szövegből képet generáló Stable Diffusion friss, karcsúsított változatát. Az Nvidia és az Alibaba modellek súlyai/értékei teljesen nyíltak, a Stable Diffusion 3 Mediumé viszont korlátozottak.
A Nemotron-4 340B nyelvmodell-család (Nvidia, amely immáron a világ legértékesebb vállalata) alapmodellje 340 milliárd paraméteres, finomhangolt változata emberi visszajelzésre jutalmazó modellként működik megerősítéses tanulásban (reinforcement learning) – a Hugging Face rangsorolásában, ebben a kategóriában most ez a modell az első.
Angol mellett ötven más természetes nyelven trenírozták, negyvennél több programozási nyelvre tanították. A licenc alapján a felhasználók szabadon használhatják, módosíthatják mindaddig, amíg nem használják illegális célra a modellt.
Az Alibaba Qwen2 nyelvcsaládja alap- és utasításokkal finomhangolt öt, 500 millió és 72 milliárd paraméter közötti verzióból áll. A feldolgozható kontextusok hossza 32 ezer és 128 ezer token között van. A legnagyobb Qwen2-72B viszonyítási pontnak számító, több modellt lehagy, különösen természetesnyelv-feldolgozásban, matematikában és kódolásban jó.
Havonta maximum százmillióan használhatják, kereskedelmi alkalmazásokhoz is módosíthatják. Az Alibaba vezetősége elmondta, hogy multimodális adottságokkal fogják bővíteni.
A Stable Diffusion 3 Medium alapmodellje kétmilliárd paraméteres, kereskedelmi GPU-val működő, Nvidia- és AMD-hardverre optimalizált laptopokon és házi számítógépeken fut. Képzelt jelenetek renderelésében remekel, korai felhasználók szerint az emberi anatómiával viszont változatlanul problémái vannak (a korábbi modelleknek is voltak).
Nem kereskedelmi célokra használható, legalább egymillió dollár bevétellel és egymilliónál kevesebb felhasználóval rendelkező vállalatok a Stability AI más modelljeivel együtt, havi húsz dollárért licencelhetik.