Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Amerikai és kanadai rádióállomások MI műsorvezetőt tesztelnek

2023. május 09. - ferenck

Mivel a mesterségesintelligencia-modellek megkönnyítik végtelen mennyiségű szöveg és hang előállítását, napról napra markánsabb a teljesen automatizált médiaprogramok jelenléte.

2022 októberében a dubai Play.ht híres, esetenként elhunyt személyeket szimuláló podcast-et indított. Eddig Oprah Winfrey és Terence McKenna volt benne Alan Watts-szal, illetve Lex Friedman Richard Feynman-nel.

Idén januárban a Seinfeld sitcomra (szituációs komédiára) épülő, MI által generált, soha véget nem érő komédia indult a Twitchen (az Amazon tulajdonában lévő, videojáték-közvetítéssel foglalkozó weboldalon). Szkriptek létrehozására a GPT-3-at, hangok szimulálására a Microsoft Azure-t, jelenetek készítésére a Unity játékmotort használja.

ai_dj.jpg

A zenei streaming-szolgáltató Spotify nemrég indított automatizált DJ-je a felhasználó hallgatói szokásaira vonatkozó tényszerű infókkal és megfigyelésekkel tesz izgalmasabbá egyéni lejátszási listákat (playlists).

A digitális közönség bevonására fókuszáló clevelandi Futuri médiavállalat termékét, a RadioGPT-t az Egyesült Államokban és Kanadában is tesztelik.

A saját fejlesztésű Topic Pulse meghatározza a rádióállomás helyi piacának trendi témáit, a GPT-4 szkriptet hoz létre belőlük, amelyet egy másik modell egy és három hang között vokalizál. A felhasználó vagy előre beállított hang, vagy a sajátjának a klónja között választhat.

A RadioGPT a felhasználó által válogatott listáról játszik számokat. A bemutatót csevegő MI-hanggal teszi színesebbé, amely a dalokról és a művészekről mond el érdekességeket, de rövid időjárás-jelentést, közlekedési és közéleti híreket is szolgáltat.

Az appot letöltő hallgatók hangmemókat küldhetnek a rendszernek, amelyeket az automatizált DJ akár a szkriptbe is integrálhat. Úgy is lejátszhatja őket, mintha pont betelefonálnának az adásba, tartózkodási helyük alapján pedig – az állomás hatósugarán belüli területeken – hívhatja is őket.

Az Egyesült Államokban 207 rádióállomással rendelkező Alpha Media és a Kanadában 55-öt birtokló Rogers Sports & Media áprilisban kezdte bétatesztelni a technológiát.

Sok rádióállamos már eleve nagymértékben automatizált, és nem maguk által készített, hanem mások, felhasználásra engedélyezett (szindikált) műsorain alapulnak. Ha MI DJ helyi hírekkel és a hallgatók interakcióival áll elő, programjaikat könnyebben alakíthatják ki saját piaci elvárásaik szerint, így pedig versenyképesebbek lesznek a streaming szolgáltatásokkal szemben.

A RadioGPT azért nagyon fontos, mert a generatív MI-t a hagyományos rádiós munkamenetbe integrálja. A technológia a jövőben alapjaiban változtathatja meg a médiumot.

Mesterséges intelligenciával generált képekből áll a Republikánus Párt új videója

A politikában és persze a politikán kívül is egyre gyakrabban használnak mesterséges intelligenciával generált képeket.

2019-ben a gaboni elnök egyik videója meghiúsult puccskísérlethez vezetett. A puccsot megelőző híresztelések arról szóltak, hogy a videó mélyhamisítvány (deepfake). 2020-ban egy indiai regionális választás egyik jelöltjének a videóján az illető szájmozgását úgy változtatta meg a mögötte álló párt, hogy szinkronban legyen a más nyelvekre fordított hanganyaggal. A 2022-es dél-koreai elnökválasztás két jelöltjének MI-vel létrehozott alteregói válaszoltak szavazók kérdéseire.

beatbiden.jpg

Az amerikai Republikánus Párt nemrég közzétett propagandavideója, a Beat Biden teljes egészében mesterséges intelligencia által generált képekből áll. A Joe Biden elnököt támadó állókép-sorozat fontos állomás, a generatív MI vele érkezett meg az Egyesült Államok politikai mainstreamjébe.

beatbiden2.jpg

A videó abból indul ki, hogy mi történhet Biden esetleges 2024-es újraválasztását követően. A harminckét másodperces anyag események rövid sora, hangalámondással, színészek fiktív híreket olvasnak fel. Az elmérgesedett USA-Kína viszony a tajvani főváros, Tajpej bombázásához vezet, a gazdasági válság miatti összeomlás következtében bedeszkázott ajtókkal-ablakokkal vannak teli az utcák, bevándorló-tömegek lépik át a déli határt, San Franciscóban fegyveres katonák járőröznek, mögöttük harckocsik, mert akkora az erőszakhullám.

beatbiden1_1.jpg

A képernyő bal felső sarkában látható apróbetűs szöveg ugyan figyelmeztet, hogy a videó teljes egészében mesterséges intelligencia által készített képekből áll, de ez valószínűleg sok néző figyelmét elkerüli. A gyártást ismerő névtelen forrás közölte a Vice magazinnal, hogy a képek generatív MI munkái, magát a forgatókönyvet viszont emberek írták.

beatbiden0.jpg

Politikai kampányok egyre több pozitív visszajelzést akarnak a befektetett pénzért, és úgy tűnik, hogy a cél eléréséhez a szövegből képeket készítő modellek a leghatékonyabb eszközök közé tartoznak. A videón a kamuképek úgy néznek ki, mintha valódiak lennének, a fiktív események sora felkavarja a nézőt, mert teljesen hitelesnek tűnnek. Egyértelműen jelzik, hogy melyik jelöltre szavazzon.

A generatív MI további fejlődésével a propagandaanyagok még hatásosabbak, erőteljesebbek lesznek.

Eminem-, Oasis-, The Beach Boys-klónok tűntek fel a közösségi médiában

Egyre gyakoribb jelenség művészek utánzása mesterségesintelligencia-technikákkal. 2021-ben például fiatalon elhunyt sztárokat, köztük Jimi Hendrixet, Kurt Cobaint és Amy Winehouse-t emulálták, tavaly pedig az OpenAI bemutatta a népszerű zenészek stílusában számokat generáló Jukebox rendszert.

A lemezipar igyekszik szigorúan fellépni mindenféle fake ellen, a világpiac harmadát uraló UMC (Universal Music Group) pár hete szólította fel a legnagyobb streaming-szolgáltatókat a hozzá tartozó művészek zenei adatait használó MI-muzsikák blokkolására.

fake_musicians.jpg

Az UMC hozzáállása nem meglepő, mert minden új technológiageneráció komoly és nehezen kezelhető kihívást jelent az ipar számára. Az 1970-es években elterjedt audiókazetták megkönnyítették a másolást, a következő évtizedben jött a hangmintavétel (sampling), az 1990-es és a 2000-es években pedig a remixek és a mashupok. Ma az MI jelenti az új kihívásokat.

Az iparágban nincs mindenki ellene. Az elektronika és a pop határán alkotó kanadai Grimes közölte, hogy bárkivel megosztja a bevételeit, aki lemásolja a hangját. Liam Gallaghernek, az Oasis korábbi énekesének kifejezetten tetszett az MI-utánzat.

A közösségi médiában az utóbbi hetekben több ismert zenész MI-vel generált utánzata tűnt fel: a Drake and The Weeknd stílusában előadott hip-hopot több tízmillióan hallgatták meg, mielőtt levették volna a netről. Aztán az 1990-es évek britpop sztárzenekera, az Oasis, a rapper Eminem, de még a jellegzetesen hatvanas évekbeli The Beach Boys is sorra került.

Hagyományosan szerzett és előadott számok csendülnek fel, amelyek hírességekre emlékeztető vokálokkal rétegződnek, folynak egybe. Utóbbiakat hangklónozó modellek hozzák létre.

Első lépés néhány perctől több óráig tartó hanganyag beszerzése, amelyen az énekes hangszeres és bármilyen kíséret nélkül hallható. A modell (Demucs3, Splitter, lalal.ai) „demixeli” az anyagot, kiszedi belőle a szükséges részeket. Az adatsoron hangklónozó modell (Soft Voice Cloning VITS, Respeecher, Murf.ai) tanulja meg az énekes hangszínének, hangmagasságának stb. utánzását.

Az új hanganyag felvétele a következő lépés. A modell az általa betanított hang hangszínének az előadás hangmagasságához és a szöveghez való hozzárendelésével dalt generál, amelyet digitális audió-munkaállomás (Audacity, Ableton Live, Logic Pro) kever össze hangszerekkel.

Robotizált szövettel gyógyítható a kézödéma

A kézödéma sérülésből vagy betegségből eredő túlzott folyadék-felgyülemlés okozta duzzanat. Jelenlegi legjobb kezelése a képzett terapeuta által végzett kézmasszázs, amelyhez sajnos a költségek és más okok miatt sokan nem férnek hozzá.

A Cornell Egyetem kutatói szakorvosokkal együttműködve, rájuk gondolva speciális, kötött szövetet (KnitDema) dolgoztak ki. A viselhető (wearable) technológiával a páciens otthon, a beágyazott kicsi robotikus aktuátoroknak köszönhetően, maga végezheti el a masszázst.

odematextil_1.jpg

A projektet vezető Cindy Kao és kutatótársai három éve fejlesztett másik viselhető technológiájukból, a viselője bőrére változatos okok miatt reagáló, arra nyomást gyakorló, megcsípő stb. KnitDermisből indultak ki. Hatástanulmányokból kiderült, hogy többeket érdekelne személyre szabható, a bőrt masszírozó eszköz.

Kao és csapata heteken keresztül konzultált szakorvosokkal az optimális megoldásról, és végül azért döntöttek a kézödéma mellett, mert szignifikáns hatása van a mindennapokra, akadályozza az ujjak nélkülözhetetlen mozgékonyságát.

Ujjra húzható, kötött, robotizált textíliát terveztek, beágyazott „alakemlékező ötvözetből” (shape memory alloy, SMA) készült rugókkal. A rugókat parányi 3D nyomtatott áramkör aktiválja, egymás utáni összenyomódásukkal a folyadékot kiszorítják a kéz duzzadt részéből.

Az SMA rugók nyomása, a nyomás intenzitása páciensenként szabályozható. A szimulált kézen végzett első tesztek után, a rugók összehúzódásakor mért 45 Celsius-fok átlaghőmérséklet a „valódi” tesztek egyik résztvevőjének sem okozott kellemetlenséget. Az eszközt eleve úgy alakították ki, hogy kényelmesen lehessen viselni, a nyomás pedig egyenletesen oszoljon el a duzzadt részen.

Maga a fonal is rugalmas, üreges részekkel, és az aktuátorok még passzív állapotban is valamilyen nyomást gyakorolnak a kézre. A kutatók többfajta fonállal kísérletezve találták meg az ideális kombinációt, hogy a nyomás egyrészt hatékony legyen, másrészt ne okozzon kényelmetlenséget.

Kao szerint a KnitDema és a technológiával készülő későbbi „személyes rehabilitációs” eszközök fontos szerepet játszhatnak a gyógyászat jövőjében.

Hollywood pánikol a generatív MI diadalmenete miatt

Sok művész aggódik az egyre népszerűbb generatív mesterségesintelligencia-alkalmazások miatt. Nem a munkájukat féltik, hanem a tömeges plágium lehetősége nyugtalanítja őket. A modelleket az ő képeiken is gyakoroltatják, aztán a stílusukban hoznak létre alkotásokat. Ez lényegében bárkivel bármikor megtörténhet.

Az aggodalomhullám elérte a filmipart, Hollywoodot is. Április elején Phil Wiser, a Paramount Global technológiai vezetője kongatta meg a vészharangokat az igazgatóságnak tartott prezentációja során. Előadás közben a DALL-E képgenerátorral előállíttatta a nagyvállalat legikonikusabb karaktereit: először SpongyaBobot, majd a stúdióban ácsorgó Optimusz fővezért a Transzformerekből.

marvel_1.jpg

„Mindenki felébredt erre” – jegyezte meg később szarkasztikusan.

Wiser problémája ugyanaz, mint a képzőművészeké. A szórakoztatóipar profitjának jelentős része a szellemi tulajdonjogokból származik. Ha viszont olcsó vagy ingyenes és könnyen kezelhető a mesterséges intelligencia, akkor bárki felhasználhatja a filmkaraktereket. Automatikusan merül fel a kérdés, hogy kit illet meg ilyenkor az esetleges bevétel?

Wiser szerint a legnagyobb kockázatok egyike, ha a modellek a stúdió szellemi tulajdonát új módokon alakítják át, ami bármikor megtörténhet, mert rendelkezésünkre állnak a szükséges eszközök. Bírósági eljárásoknál pedig nagyon nehéz megállapítani, hogy meddig érvényes a jogvédelem, mikortól beszélhetünk független alkotásról.

marvel0_1.jpg

Mások szerint viszont a generatív MI-nek helye van a filmiparban. A 2022-es, közepes költségvetésű, Oscar-díjas Minden, mindenhol, mindenkor egyik kulcsjelenetében a mesterséges intelligencia használata napokkal rövidítette le a forgatást. Megint mások azonban az eredetiség halálát látják az MI-ben.

„Meglévő dolgokat használ, amivel nem teremt innovációt. Ha a filmtörténet legünnepeltebb alkotásaira, például az Aranypolgárra gondolok, nehezen hiszem el, hogy megszülettek volna az MI által generált tartalom korában” – nyilatkozta Jason Blum a horror-orientált Blumhouse alapító-igazgatója.

Joe Russo, több Marvel-mozi rendezője szerint az MI óriási hatással lesz a területre, és akár két éven belül készíthet filmet.

„Olyan világban élünk, ahol egy teljes generáció könnyen megtanulta használni, és nem fél tőle. Egyértelműen a történetmesélésre, annak megváltoztatására, folyamatosan fejlődő sztorikhoz kell használni. Demokratizálja azt. Fotorealista képalkotó motorral és MI-eszközökkel bárki képes történetet mesélni, játékot alkotni” – magyarázza Russo.

Fizetni kell a gyakorlóadatokért?

Február óta a Twitter havi 42 ezer dollárt kér alkalmazásprogramozói felületének (API) használatáért. Adatokban dúskáló más platformok szintén fizetőssé tették vagy bezárták az API-jukat. Egyértelmű, miért: mesterségesintelligencia-fejlesztők a webről szedik össze a modellek gyakoroltatásához szükséges adatokat.

Régóta ez a bevett – ingyenes – gyakorlat, működött is, bár az utóbbi hónapokban egyre több a pereskedés. Hírmagazin-kiadók egy csoportja pár hete ki is jelentette, hogy az MI-k szövegeiken történő gyakoroltatása megsérti a szellemi tulajdonjogokat.

free_data.jpg

A Reddit beszélgető platform és a Stack Overflow kérdés-felelet honlap a napokban közölte, hogy tervet dolgoztak ki adataik nagy nyelvmodellekkel (large language models, LLM) szembeni védelmére. Jelenleg mindkét weboldal API-kat kínál posztok, beszélgetések tömeges gyűjtésére, de hamarosan változik a helyzet.

A Reddit frissítette szabályzatát, és mostantól megakadályozhatja az LLM-ek számára történő, engedély nélküli adatgyűjtést. Pénzt kérnek az API-hoz való hozzáférésért; egyetlen kivétel van: ha a Reddit-felhasználók hasznot húznak az adatok segítségével fejlesztett alkalmazásokból. 

free_data0.jpg  

A Stack Overflow vezetősége elmondta, hogy az oldalon lévő adatok gépi tanulásra való használata ellentétes a szabályzatukkal. A fejlesztőknek egyértelműen fel kellene tüntetniük az adatok forrását, amit nem tesznek meg. A cég az oldal fizetőssé tételét tervezi.

Az LLM-eket adataikkal működtető közösségi oldalaknak jár az anyagi kompenzáció. Eddig ugyan nem volt, de változik a helyzet, ráadásul a pénz az adott oldalak továbbfejlesztésére, felhasználóbarátabbá tételére is elkölthető, a Stack Overflow pont ezt tervezi.

A közhiedelemmel ellentétben az adatoknak általában van ára, sőt, egyes korpuszok értéke folyamatosan nő. A beszélgető oldalak, mint a Reddit és a Stack Overflow gyűjteményei kulcsfontosságúak nyelvmodellek trenírozásához, kódíráshoz stb.

A meglévő adatsorok és modellek törvény előtti státusza bizonytalan, a jövőbeli hozzáférés jogi és kereskedelmi megállapodások tárgya lehet. Egyelőre még nem folytattak ezirányú megbeszéléseket, holott teljesen érthető, ha az akaratlanul is besegítő Reddit és társai is szeretnének profitálni az LLM-áttörésből. Viszont komoly problémát okozhat, ha csak a nagyvállalatok tudnak fizetni, és a kisebb fejlesztők számára ellehetetlenül az adatgyűjtés, mert a fejlesztés a privilegizált cégek szűk csoportjának a kezében összpontosulhat.

Anyagkutatás és -fejlesztés emberi segítség nélkül

Képzeljünk el egy szakácskönyvet, 150 ezer ínycsiklandozó ételképpel, majd azt is képzeljük el, hogy alig van recept hozzájuk. Az Egyesült Államok Lawrence Berkeley Nemzeti Laboratóriuma (LBNL) Anyagok projektjével pont ez történik most.

Számítógépeinek kb. 150 ezer új anyagot kell kiokoskodnia akkumulátor-elektródák, katalizátorok és más eszközök minőségjavításához. Az adatbázist a világ változatos pontjain élő kutatók használják, viszont csak a benne szereplő anyagok töredékéből tudtak tesztelhető valamit készíteni. Ezzel szemben sokezer teszteletlen, azaz, legalábbis egyelőre, a szintézis a szűk keresztmetszet.

uj_anyagok.jpg

Az LBNL kutatói eldöntötték, hogy mesterséges intelligenciával és robotikával számolják fel az egyre idegesítőbb szűk keresztmetszetet. Az MI találgat, és a legjobbnak tűnő találgatás alapján elkészíti az óhajtott anyag receptjét, majd a feltételeket iterálja, miközben a robotok megpróbálnak fizikai mintákat készíteni.

Az új A-Lab napi szinten százszor gyorsabban szintetizál anyagokat, mint a labor humán dolgozói. Kb. két hete a kutatók el is döntötték, hogy ezt az utat kell járniuk.

Nincsenek egyedül, mert például gyógyszercégeknél, sőt már felsőoktatási intézmények anyagtudománnyal foglalkozó tanszékeinél is lassan megszokottá válnak az MI-vel vezérelt robotizált laboratóriumok. Csakhogy azok a laborok folyékony prekurzor vegyületekkel dolgoznak, amelyekkel relatíve könnyebb a keverés, illetve az egész folyamat. (A prekurzor más vegyületet előállító reakcióban résztvevő vegyület.)

Az LBNL-nél viszont tipikusan szilárd halmazállapotú porokat kell összekeverni, majd oldószereket különböző kombinációkban hozzájuk adni, hővel, szárítási idővel és más inputokkal kísérletezni, hogy aztán az előrejelzett anyaggá kristályosodjanak össze.

A receptek száma kvázi végtelen, és míg számítógépek meg tudják mondani, milyen végső összetétellel optimalizálhatók eszközök, addig a szintézisre nincs elmélet, hogy mit lehet megtenni, és mit nem.

Korábban random csinálták, most viszont inkább a klasszikus vegyészek módszerét követnék: az MI kivitelezhetőnek tűnő szintézis-javaslattal áll elő, majd robotkart vezérel, hogy válasszon ki kb. kétszáz (lítium, nikkel, réz, vas, mangán stb.) port. A prekurzorok összekeverése után egy másik robot tégelyekbe osztja a keveréket, a tégelyek kemencébe kerülnek, ott gázokkal (oxigénnel, hidrogénnel, nitrogénnel stb.) keverednek össze. Az MI határozza meg a sütési és a szárítási időt, hőmérsékletet és így tovább.

A sütés után egy adagoló minden tégelyhez golyóscsapágyat rendel hozzá, hogy az új anyagokat finom porrá őröljék, amelyeket lapra öntenek. A mintákat robotkar csúsztatja az elemzést végző röntgen- vagy más készülékbe.

Az eredményeket a projekt adatbázisába küldik, és ha az nem az előrejelzett, a rendszer újrakezdi a folyamatot.

Az Amazon is beszáll a generatív MI-versenybe

A DALL-E 2 és a ChatGPT kevesebb mint egy éve indult világhódító útjára. A közben eltelt időszakban a generatív MI töretlen fejlődését láthattuk, és a fejlődés tempója egyelőre nem lassul.

A Google, a Meta és a Microsoft mellett most már az Amazon is bekapcsolódott a szöveg- és képgeneráló mesterségesintelligencia-szolgáltatásba. Nemrég indított Bedrock felhőplatformja általa és partnerei által fejlesztett modelleket kínál.

amazon_ai.jpg

Üzleti felhasználók a célközönség, ők válogathatnak a modellek közül, saját felhasználásra finomhangolhatják azokat. Egyelőre korlátozottan és csak szelektált ügyfelek férhetnek hozzá az Amazon Web Services-en. Még az árat sem jelentették be.

A platform ad otthont a Stability AI Stable Diffusion képgenerálójának. Novemberben kötöttek partnerszerződést, a mostani együttműködés a szerződés kiterjesztése. A Stability AI az Amazon Web Services-t jelölte meg preferált felhő-feldolgozás és -tárolás szolgáltatójaként.

A kiválasztottak olyan modellekhez is hozzáférhetnek, mint az AI21 szöveggeneráló Jurassic-2-je vagy a kérdés-feleletalkalmazásban beszélgetőpartnerként funkcionáló Claude-hoz, az Anthropic modelljéhez.

A Bedrock az Amazon Titan-alapú két nyelvmodelljét is hosztolja. A Titan Text szövegeket generál és foglal össze, míg a Titan Embeddings – ahogy a neve is elárulja – szöveg-beágyazásokat hoz létre.

Az Amazon riválisai saját számítási felhőjükön keresztül kínálnak hasonló szolgáltatásokat.

A Meta áprilisban jelentette be saját nyelvi modellel működő eszköz indítását. Hirdetőknek szeretnének segíteni szövegek létrehozásában. A Google márciusban vezetett be egy API-t (alkalmazásprogramozói felületet) a PaLM nyelvmodellhez, valamint a Google Cloudban működő szöveggeneráló appokat is bejelentett. A Microsoft Azure az OpenAI modelljeihez, köztük a GPT-4-hez, valamint a képgeneráló DALL-E-2-höz kínál hozzáférést.

Svéd kutatók a vegyészetben alkalmaznak kvantumszámítógépet

Más területekhez hasonlóan, a vegyészetben is komolyak a kvantumszámítógépekkel kapcsolatos elvárások. Bizakodnak, hogy forradalmian új lehetőségeket biztosítanak kémiai folyamatok szimulálásához. Ha így lesz, gyógyszerfejlesztéstől új anyagok kikísérletezéséig, a technológia óriási hatást gyakorolhat az egész szakterületre.

A svéd Chalmers Egyetem kutatói a felsőoktatási intézmény Mikrotechnológia és Nanotudomány Tanszékén épített kvantumprocesszorral végeztek vegyi számításokat. A zaj által kiváltott hibák kezelésére úgynevezett referenciaállapot-hibacsökkentés (referemce-state error mitigation, REM) módszert alkalmazták. A korrekcióhoz kvantumkomputer mellett hagyományos számítógépet is használtak, ami jelenleg bevett gyakorlat.

sved_kvantum.jpg

Az REM úgy veszi figyelembe egy molekula referenciaállapotát, hogy mindkét számítógéptípuson leírja, majd megoldja a problémát. Utána összehasonlítja az eredményeket, és az összehasonlítás alapján becsüli meg a zaj miatt keletkezett hibamennyiséget. Az eredeti problémát végül a kvantumprocesszoron (azt lefuttatva) oldja meg. Összességében, sikeresen minimalizálták a hibaszámot.

A hardver tényleges működését, az esetleges továbbfejlesztések szükségességét csak valódi kvantumalgoritmusokat használva tudják megállapítani. Úgy tűnik, hogy a kémia lehet a kvantumszámítógép egyik első gyakorlati alkalmazási területe – vélik a Mikrotechnológia és Nanotudomány Tanszék szakemberei. 

A kutatók az REM és a felsőoktatási intézmény öt kvantumbites (qubites) Särimner kvantumprocesszorának adatait összekombinálva, számolták ki egyes molekulák, például a hidrogén és a színtelen lítium-hidrid vegyület belső energiaállapotát. (Särimner egy disznó az északi mitológiában, akit minden nap levágnak és megesznek, de mindig újjászületik.)

A Särimner öt qubites első változatát közben huszonöt qubitessel helyettesítették. A Wallenberg Kvantumtechnológia Központ (WACQT) célja száz qubites kvantumszámítógép, amellyel már megoldhatnának a legjobb hagyományos szuperkomputerekkel megoldhatatlan problémákat.

„Munkánkkal bebizonyítottuk, hogy módszerünkkel javítható a kvantumkémiai számítások minősége” – jelentette ki Said Rahm, az egyik kutató.

Megérkezett az automatizált promptmérnök

Ha pontos választ szeretnénk nagy nyelvmodellektől, jól ki kell találnunk a szöveges utasítást, mert egyes promptok sokkal jobban működnek, mint mások. De hogyan lehet kitalálni jobbakat?

Az elmúlt hónapokban, egy-két évben új szakma is született erre a feladatra: a promptmérnök. Most viszont úgy tűnik, hogy az ő munkájuk is veszélyeztetett, mert a folyamat automatizálható.

ape.jpg

A kanadai Toronto és Waterloo egyetemek által fejlesztett Automatizált Promptmérnök (APE) pont ezt teszi.

Nem túl sok input-output párból egy nagy nyelvmodell ugyanazokkal a bemenetekkel hasonló kimeneteket képes generálni. Ha maga készít promptot, addig variálhatja azokat, amíg az outputok még hasonlóbbak lesznek.

Az APE működéséhez két nagy nyelvmodellre, prompt- és tartalomgenerátorra van szükség. Az elsőhöz inputokat befejező (GPT-3, InstructGPT) és az üres részeket kitöltő (T5, GLM, InsertGPT) modellekkel, a másodikhoz az InstructGPT-vel kísérleteztek.

A generátornak ilyen promptot adtak meg: „egy barátomnak adtam egy utasítást és öt inputot. Elolvasta az utasítást, és mindegyik inputhoz írt egy-egy outputot. Íme az input-output párok…” Utána következett egy kis sor input-output példa, mondjuk, két állat neve, és hogy melyik a nagyobb, majd a prompt így zárult: „Az utasítás kész.” A generátor válasza: „Válaszd ki a nagyobb állatot.”

A generált prompthoz az outputokat létrehozó tartalomgenerátor adatsorából ötven további input példát adtak.

A prompt minőségét az alapján ítélték meg, hogy a tartalomgenerátor milyen gyakran készített az elvárásnak pontosan megfelelő outputot.

A prompt élesítéséhez utasították a tartalomgenerátort, hogy állítson elő a legmagasabb pontszámot elérőhöz hasonló promptot, majd megismételték a folyamatot. Ezt a lépést háromszor játszották el, és kijött például, hogy „Azonosítsd a nagyobb állatot.”

Automatizált promptmérnököt korábban is fejlesztettek már, de iteratív módszerrel egyiken sem finomítottak. A teszteken az APE náluk és humán promptmérnököknél is jobban teljesített.

süti beállítások módosítása