Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Hogyan javítsunk a promptokon?

2023. november 03. - ferenck

A nagy nyelvmodellek (LLM) legújabb generációja túlmutat a nyelven. Ezekkel a mesterséges intelligenciákkal már multimodálisan, szöveg mellett vizuálisan, a kép-szöveg valamilyen kombinációjával, hang és más módszerekkel is kommunikálunk, változatos utasításokat, promptokat adhatunk nekik, amelyekre…

Tovább

A ChatGPT most már lát, hall és beszél is

Az OpenAI, egy weboldal szalvétára felskiccelt koncepcióját kóddá fordító anyaggal szemléltetve, márciusban vezette be a GPT-4-t, nagy nyelvmodellhez (large language model, LLM) viszont a Google használt először vizuális inputot úgy, hogy az output is kép legyen (image-to-image). Egy májusi…

Tovább

A telekom iparágra specializálódik egy nagy nyelvmodell

A biztonságra összpontosító Claude chatbot fejlesztője, az Anthropic összeállt Dél-Korea legnagyobb mobiltelefon-szolgáltatójával, az SK Telekommal, és százmillió dollárt kap, hogy többnyelvű nagy modellt építsen. Az LLM-et (large language model) a telekommunikációs iparra fogják fejleszteni, azaz…

Tovább

Honnan jönnek a mesterséges intelligenciát forradalmasító nagy nyelvmodellek?

A generatív mesterséges intelligencia (MI) forradalma a nagy nyelvmodelleken (large language models, LLM) alapul. Honnan jönnek, milyen technológiákból fejlődtek ki az LLM-ek? A természetes nyelvfeldolgozás (natural language processing, NLP) korai éveiben a munkák jelentős részét az Egyesült…

Tovább

Hogyan építsünk nagy nyelvmodellekre alkalmazásokat?

Egyre több nagy nyelvmodell (LLM) nyílt forrású vagy majdnem az, így fejlesztők több opció között választhatnak, hogy hogyan és milyen alkalmazásokat építsenek rájuk. A legegyszerűbb mód az utasításadás (prompting). Az előzetesen gyakoroltatott LLM-nek utasításokat adva, gyakorlósor nélkül percek,…

Tovább

Mit ért a világból a mesterséges intelligencia?

Egyre gyakrabban merül fel a kérdés, hogy a nagy nyelvmodellek (LLM-ek) megértik-e a világot, általánosabban fogalmazva: értenek-e valamit a valóságból a mesterségesintelligencia-rendszerek? Egyelőre nincs semmilyen elfogadott tudományos teszt, amellyel meg lehetne válaszolni a kérdést. Andrew Ng…

Tovább

Chatbotok ketrecharca

Egy új online eszköz, a Chatbot Arena egymás elleni versenyek alapján rangsorol chatbotokat. Lehetővé teszi a felhasználó számára, hogy szimultán adjon utasítást, promptot két nagy nyelvmodellnek (large language model, LLM), és azonosítsa azt, amelyik jobb választ adott. Az eredmény egy ranglista,…

Tovább

Falcon: nyílt forrású nagy nyelvmodellt fejlesztettek Abu Dhabiban

A szabad kereskedelmi felhasználást engedélyező nyílt forrású licenceknek köszönhetően független fejlesztők, fejlesztőcsoportok is építhetnek akár a nagy techvállalatok termékeivel versenyképes rendszereket. Egy nemrég kiszivárgott Google-feljegyzés szerzője egyenesen a cég üzleti tevékenységét…

Tovább

Gyorsan fejlődik a szövegből generált képek szerkesztése

Sokat fejlődnek a szöveges utasítás alapján szöveget létrehozó modellek, látványosan egyre jobbak az outputok. Vajon a képgenerátorok hatékonyabb gyakoroltatásától – hogy tényleg a promptokat kövessék – is hasonló eredmény várható? A Berkeley-i Kaliforniai Egyetem (UC Berkeley) kutatói által…

Tovább

Egy percnél rövidebb idő alatt olvas el egy teljes regényt egy chatbot

Gyakran megfeledkezünk a chatbotok egyik korlátjáról, a memóriáról. A nagy nyelvmodelleket ugyan sok terabájt szövegen gyakoroltatják, a használat közben feldolgozható mennyiség, az input és output szövegek „kontextus-ablakként” ismert kombinációja viszont limitált, például a ChatGPT esetében kb.…

Tovább
süti beállítások módosítása