Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Nagy táblázatokat is olvasnak a nagy nyelvmodellek

2024. október 17. - ferenck

A nagy nyelvmodellek (LLM) kis táblázatokat feldolgoznak, de nagyobbakkal meggyűlik a bajuk, mert túl méretes az input. A Microsoft kutatói táblázattömörítő megoldást javasolnak, így LLM-ek is képesek azonosítani azokat, vizsgálhatják speciális kérdéseket megválaszoló részeiket. A legtöbb…

Tovább

A világ leggyorsabb mesterségesintelligencia-platformja

A SambaNova Systems a Llama 3.1 405B (a B a milliárd paraméter rövidítése) modelljét a versenytársaknál jóval gyorsabban futtató felhőszámítás-szolgáltatást indított. Elérhető egy ingyenes és fizetős (vállalkozás) szint is, a szintén fizetős fejlesztői szint év végéig startol. A vállalat…

Tovább

Megmagyarázható lesz a nagy nyelvmodellek működése

A mai mesterségesintelligencia-fejlesztések alapja, a nagy nyelvmodellek (large language models, LLM) működése sok kérdést vet fel, mert nem értjük teljesen. Miként változtatja meg a modell finomhangolása a bemenetek megjelenítését? Mi történik a modell belsejében a gondolati láncra felépített…

Tovább

A Gemini AI-val hasznosabbak az irodai robotok

Google-kutatók a természetesnyelv-feldolgozást és a gépi látást összekombinálva, új eszközt fejlesztettek robotok navigációjához: szöveges promptok és vizuális inputok alapján, belső térben történő tájékozódásra tanítottak meg egyet. Robotok navigációjához a környezet feltérképezése mellett…

Tovább

Dokumentált dezinformáció

A mesterséges intelligencia által létrehozott dezinformáció, főként képek, videók és hanganyagok száma folyamatosan nő, 2023 végén már a számítógéppel manipulált médiatartalmak több mint harminc százalékáért MI volt a felelős. A realisztikus anyagokat generáló MI-modellek széleskörű elérhetőségével…

Tovább

Nehezen tanulnak kínai szövegeken a mesterségesintelligencia-modellek

A multimodális GPT-4o-val hanggal, szöveggel, videóval interakcióba léphetünk. A modell megjelenése utáni napokban viszont több probléma felmerült az OpenAI csúcstermékével kapcsolatban.  Scarlett Johansson például hangja jóváhagyása nélküli utánzásával vádolta a céget. Aztán kiderült, hogy a…

Tovább

Mennyire pontosan válaszolnak nagy nyelvmodellek professzionális szintű lekérdezésekre?

Sok pénzügyi szakember és jogász dokumentumok feldolgozásától kamatlábak előrejelzéséig, változatos célokra használ nagy nyelvmodell-alkalmazásokat. Ezekben az esetekben azonban kitüntetett fontosságú az output felügyelete, mert a tévedések súlyos következményekkel járhatnak. A mesterséges…

Tovább

Jön az Apple nagy nyelvmodellje, félhet a ChatGPT

Az Apple eddig kimaradt a ChatGPT-vel jelképezett mesterségesintelligencia-forradalomból, a generatív MI diadalútjából, a nagy nyelvmodellek (large language models, LLM) fejlesztéséből. Tavaly már röppentek fel hírek változásokról, hogy az almás cég bekapcsolódna a versenybe, nagy titokban folyó…

Tovább

Nyelvtanulás másként

A gépitanulás-modellek jellegzetesen olyan feladatokon gyakorolva tanulnak nyelveket, hogy egy adott szövegben előre kell jelezniük a következő szót. A Stanford Egyetem két kutatója viszont kevésbé fókuszált, inkább emberi módon trenírozott egy nyelvmodellt. A nyelvet indirekt módon, szöveges…

Tovább

Nyílt forrású nagy nyelvmodelleket tett közzé a Google

A Google története folyamán számos nyílt forrású (open source) mesterségesintelligencia-kezdeményezéssel (AlphaFood, TensorFlow, a BERT és a T5 több változata, Switch stb.) gazdagította a számítástudományt, információs társadalmat. Az utóbbi időben, a nyílt forrású nagy nyelvmodellek (large…

Tovább
süti beállítások módosítása