Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Az OpenAI bemutatta a képekkel is elboldoguló GPT-4-t

2023. március 20. - ferenck

Egyesek szerint a mesterséges intelligencia aranykorát éljük, ami talán túlzás, mert még sokkal fényesebb jövő jöhet, az viszont valószínű, hogy a ChatGPT-vel beindult trend, a nyelvmodell-mánia folytatódik. Az OpenAI március 14-én ugyanis bemutatta a GPT-sorozat elődeit szövegértésben, a megadott stílushoz való alkalmazkodásban mindenképpen felülmúló legújabb, negyedik változatát.

Szöveges input/outputhoz a ChatGPT Pluson keresztül, havi húsz dollárért férhetünk hozzá, hamarosan képi output – képet nem generál, csak leírja azt –, API (alkalmazásprogramozói felület) is lesz, a várólistára már most feliratkozhatunk.

gpt.jpg

Az OpenAI biztonsági és versenyszempontokra hivatkozva nem oszt meg sok részletet. A korábbi GPT-modellekhez hasonlóan, az új is transzformer-architektúrán alapul, nyilvános és magán adatsorokon úgy tanították, hogy előrejelezze a következő tokent (kb. négy karaktert, háromnegyed szót). Emberi visszajelzésekkel, szerkesztett promptokkal, megerősítéses tanulással finomhangolták.

Az egy beszélgetésben kezelt harminckétezer token egy nagyságrenddel nagyobb, mint a ChatGPT által kezeltek száma, tehát a többi nagy nyelvmodellnél hosszabb szövegekkel tud dolgozni. Nagy újdonsága, hogy képeket (köztük szövegoldalakat, fényképeket, diagramokat és képernyőképeket) is elfogad inputként.

A rendszerüzenet szintén újfajta input, ez utasítja a következő interakció során használt stílusra, tónusra, mondjuk, bőbeszédűségre, például, hogy úgy válaszoljon, mint Szókratész. GPT-4 új keretrendszert, az OpenAI Evals-t is kínál benchmarkok (mércék) létrehozására, futtatásukra.

Eddig már több mesterségesintelligencia-referenciaértéket és embereknek készült tesztek szimulált változatait teljesítette, utóbbiakon nyolcvan és száz százalék közötti eredményeket ért el. Többválaszos kérdésekben, józanész-következtetésben, Python kódolásban és sok más területen jobbnak bizonyult a legfejlettebb MI-knél.

Egyelőre még mindig kitalál „tényeket”, időnként tévesen következtet, néha elfogult, és úgy tűnik, nincs tisztában a 2021 szeptembere, a képzési korpusz elkészülte után történtekkel. Az OpenAI szerint azonban a modell már kész a kereskedelmi forgalmazásra.

Robotok szerepelnek hindu rítusokban

Az automatizáció és a robotok a hinduizmusban és a buddhizmusban is megjelentek. Sokak szerint spirituális környezetben, például az isteneknek történő szertartásos gyertyaégetéskor, az aartin – amelyet a punai Ganparti fesztiválon 2017 óta robotkar végez (lásd az első képen) – riasztók. A tények ellentmondani látszanak ennek a vélekedésnek, mert a robotkar más szertartások szervezőit is megihlette.

Az aartit végző és más robotok, mint például az egyik keralai templomban működő, életnagyságú gépelefánt egyes hívőknek érdekesek, szerintük az innováció a boldogabb és spirituálisabb jövőt szolgálja, mások azonban szkeptikusak velük szemben, félnek a használatuktól, és nem tudják, mit jelenthetnek majd a vallás számára. Ha a templomokban elterjednek, és az automatizáció fontosabb szempont lesz, mint a hívők istentisztelete, sokan hagyhatnak fel a vallások gyakorlásával – vélik.

aarti_1.jpg

Ezek az aggodalmak mindent átható lelki szorongáshoz kapcsolódnak. Eredőjük, a szorongás legfőbb oka a félelem, hogy a robotok jobban szeretik az isteneket, mint az emberek, és az istenek is őket, illetve jobb munkát végeznek a papoknál. Súlyos és nehezen megválaszolható, vagy megválaszolhatatlan kérdéseket is felvetnek az élet értelmével, az univerzumban betöltött szerepünkkel kapcsolatban.

Egyes antropológusok szerint, ellentétben az emberrel, a robotok spirituálisan nem ronthatók meg, és az istenségek és a papok szemében ezért lehetnek jobb alternatívák. Így válnak vonzóbbá a folyamatosan fogyatkozó papság számára, és terjednek el a hétköznapokban. A későbbiekben aztán a papokat is robotokra cserélhetik.

aarti0.jpg

Azért alkalmazzák őket, mert nem aggódnak, hogy rosszul tesznek valamit, vagy – gyakorlati okokból – ha a szertartás elvégzésére kevés a lehetőség, még mindig jobbak a semminél. A mechanikus ikonok egyébként sem voltak szokatlanok az indiai mitológiában, egyes modernkori nacionalista politikusok szerint ők a bizonyíték arra, hogy a robotoktól az űrhajókig, mindent a hinduk találtak fel.

A robotok használata az indiai hagyományt jelentő vallásban mindenesetre elgondolkoztató és talányos, különösen, ha figyelembe vesszük az ember-gép viszony folyamatos változásait, a mesterséges intelligencia állandóan növekvő szerepét a posztindusztriális társadalmakban. A hinduizmusban és a buddhizmusban is kulturális paradoxonok, mert eljuthatunk addig a pontig, hogy a legtökéletesebb rituáléhoz egyáltalán nem kell már ember, jobb és hatékonyabb nélküle.

„A körforgásban, ahol emberek robotokat hoznak létre, robotok istenné, istenek emberré válnak, csak azt sikerült még egyszer elérnünk, hogy újragondoljuk magunkat” – írja Holly Walters antropológus.

Szöveg alapján módosít videotartalmakat a mesterséges intelligencia

A szövegből közvetlenül videót előállító rendszerek mellett megjelent a meglévő mozgóképanyagokat módosító Gen-1, a kreativitást támogató multimodális mesterségesintelligencia-megoldásokon dolgozó Runway új fejlesztése.

A Gen-1 szöveges prompt vagy kép alapján videók beállítását vagy stílusát, az eredeti mozgásokat és formákat érintetlenül hagyva, alakítja át.

gen.jpg

Egy videónak szerkezete és tartalma van. A szerkezet a formákra és a mozgásukra, a tartalom minden egyes forma megjelenítésére vonatkozik: színére, megvilágítására, stílusára. Videogenerátorok képesek megtanulni szerkezet és tartalom egymástól szétválasztott beágyazásokban történő kódolását. Ebből pedig logikusan következik, hogy a tartalom-beágyazást másikkal helyettesítve, a videó szerkezete, az új tartalom ellenére sem változik meg (lásd első kép).

Ezt teszi a Gen-1. A videó-képkockákat (frames) úgy hozza létre, mint egy diffúziós modell, így a gyakoroltatása is ugyanúgy történt. Ezeknek a gépi látásban alkalmazott modelleknek a célja adathalmazok rejtett szerkezetének az adatpontok térbeli szétszóródásának modellezésével történő megismerése. A gyakorlópéldákhoz változatos mennyiségű, közel száz százalék zajt adva, annak eltávolítására tanítják be.

A video-képkocka generálást teljes zajjal kezdte, a szöveges prompt vagy kép alapján több lépésben távolította el azt. A rendszer három beágyazással dolgozott: az elsőben képkockát, a másodikban szerkezetet, a harmadikban tartalmat ágyaztak be. A képkocka és a szerkezet minden egyes képkockára, a tartalom a teljes klipre vonatkozott.

gen0.jpg

Az adatsor 6,4 millió nyolc-képkockás videóból és 240 millió, a rendszer által egy-képkockás videóként kezelt képből áll.

Előzetesen gyakoroltatott automatikus kódoló az összes képkockához elkészítette a képkocka-beállítást, majd egy modell a frame-ből kivonatolta a formákat szín nélkül kihangsúlyozó mélységi térképet. A kódoló e térkép beágyazásával jutott el a szerkezet képkockánkénti beágyazásához.

Véletlenszerűen kiválasztott képkockát használva, egy tanult CLIP idegháló a kapcsolódó szöveget és képeket egybetérképezve készítette el a tartalom-beágyazást. (Csak eggyel dolgoztak a teljes videoanyagon.)

A beágyazásokat vizsgálva, egy másik idegháló megtanulta, hogyan értékelje ki a hozzájuk adott zajt. Utána a CLIP megkapta a szöveges utasítást vagy a képet, és létrehozta a saját beágyazását, amellyel helyettesítette a tartalomét. Az összes elkészítendő képkockához a rendszer véletlenszerű, azaz száz százalék zajból álló frame beágyazást kapott. A zaj eltávolítását követően, a rendszer dekódolója megalkotta a módosított video-képkockák végső változatát.

Öten értékelték ki, másik rendszerrel hasonlították össze, harmincöt promptot teszteltek, és Gen-1 az outputok 75 százalékában jobban teljesített.

Az USA-ban nem állnak szerzői jogvédelem alatt az MI-vel generált képek

Az Egyesült Államok szerzőijog-védelmi hivatala döntése alapján a Midjourney segítségével létrehozott képeket nem illeti meg a védelem.

Az ügynökség tavaly szeptember 22-én megadta a szerzői jogokat a Zarya of the Dawn képregénynek, októberben viszont visszavonási szándékukról figyelmeztették Kris Kashtanovát, a szerzőt, mert Kashtanova közösségimédia-posztjaiból megtudták, hogy a képeket a Midjourney közreműködésével készítette. Az alkotó fellebbezett, az ügynökség pedig úgy döntött, hogy a szövegre és a képek elrendezésére érvényes a jogvédelem, magukra a képekre viszont nem.

copyright_1.jpg

Az indoklásban az áll, hogy – a Legfelsőbb Bíróság egy, 1884-es ítéletére hivatkozva – egyetlen olyan alkotást sem regisztrálnak, amelyet nem ember hoz létre. A felhasználók nem tudják kontrollálni a Midjourney outputját, az MI-modell más, mint az „ember irányította” hardverek, például a kamerák vagy a Photoshop. Az azokkal alkotott munkákat megilleti a jogvédelem.

Még ha Kashtanova komoly erőfeszítéseket is tett a promptok megírásában, a képeket nem ő készítette – áll a verdiktben. Hiába szerkesztett Photoshoppal, a szerkesztetlen és a szerkesztett változatok közti különbség elenyésző, ez alapján a képeket nem illeti meg a szerzői jog.

copyright0_1.jpg

Az alkotó egyrészt örül, hogy a szöveg és a layout jogvédett, a képek miatt viszont lobbizni fog. Országonként eltérő módon ítélik meg a kérdést, például Dél-Afrika 2021-ben egy mesterségesintelligencia-rendszernek adta meg a vele és ezek szerint általa alkotott egyedi élelmiszer-tároló feltalálójának járó szabadalmi oltalmat.

De kié is a generatív MI-modellek outputja? Az amerikai szabályozás szerint – egyelőre – senkié. A döntés olyan környezetben befolyásolhatja kiadói és kreatív közösségek üzleti stratégiáját, ahol gombamód szaporodnak az MI közreműködésével alkotott szövegek, képek, hangok, videók, 3D modellek stb.

A hivatal határozata vitatható, mert a Midjourney használatához, egy kép kitalálásához, megfelelő prompt megfogalmazásához és az iterációkhoz önálló kreatív fantázia kell. Az alkotótevékenység, a szakértelem megtagadása az MI-t egyedi módon használó személyektől komoly hiba.

Vírusként terjednek a hangklónok

Mainstreammé vált az ingyenes mesterségesintelligencia-szolgáltatásokat nyújtó online platformokkal könnyebbé tett hangklónozás. Szövegek és képek után most már ezek az új hangok is elég meggyőzőek és hozzáférhetőek annyira, hogy mindenféle tartalomgeneráló hatékony eszközként használja őket.

Az ElevenLabs, a Resemble AI, a Respeecher és a Play.ht nemrég indított rövid minta alapján a beszélő hangját klónozó szolgáltatást, és az eredmények sem várattak sokáig magukra.

voice_clones.jpg

YouTube felhasználók az Egyesült Államok négy utolsó elnökének hangját klónozták. Biden, Trump, Obama és az ifjabbik Bush kártyáról, a Minecraftról és Pokemonról vitáztak, a videót többszázezren nézték meg.

A Twitch chat-csatornán folyamatosan streamelt, egyelőre alig húszezer felhasználó által követett fiktív beszélgetőműsornak, az Athene AI Show-nak a nézők elküldhetik interjúkérdéseiket, hírességek vagy fiktív személyek klónozott hangja válaszol rájuk. A műsor házigazdája, az MI által generált beszélgetés vezetője az Athene nevű képzelt internetes személyiség.

voice_clones0.jpg

A Spotify AI DJ-je személyre szabott lejátszási listákat hoz létre a felhasználóknak, a kommentárok Xavier Jernigan, a vállalat kulturális partnerségekért felelős vezetőjének klónozott hangján hallhatók. A szintetikus hangot a tavaly felvásárolt Sonantic AI készíti, az írott anyagot az OpenAI egyik meg nem nevezett modellje alakítja szöveggé.

David Guetta francia DJ Eminem stílusában és hangján készült számrészletet játszott le egy fellépésen.

A hangklónozás demokratizálódása azonban bűnözők és csínytevők előtt is megnyitotta a kapukat.

Rokonok hangját klónozó csalók több esetben szedtek ki pénzt áldozataikból. A Vice egyik riportere az ElevenLabs technológiájával saját hangját klónozta le, és a hang elég meggyőzőnek bizonyult ahhoz, hogy hozzáférjen a bankszámlájához. Szintén az ElevenLabs megoldásával 4Chan felhasználók hírességek hangján előadott gyűlöletbeszédet generáltak.

Az ElevenLabs felhasználók identitásának ellenőrzésével, klónok azonosításával és a szolgáltatással visszaélő csomó fiók törlésével reagált a kamuhangokra.

Leállították az erotikus chatbotot

Az 1960-as években fejlesztett Eliza, egy szabályalapú chatbot bebizonyította, hogy emberek képesek érzelmileg kötődni számítógépes programokhoz. Kutatások alapján, egyes személyek kényelmesebben érzik magukat, ha intim részleteket ember helyett szoftverrel osztanak meg.

2015-ben, a San Franciscói Luka vállalat alapítója, Eugenia Kuyda autóbalesetben elveszítette egyik közeli barátját. Még egy utolsót akart vele beszélgetni, és szöveges üzenetek alapján chatbotot fejlesztett. A bot mögötti álló idegháló lett egy másik fecsegő robot, Replika alapja is. Kuyda céget alapított rá, a szolgáltatás 2020-ban, a koronavírus-járvány alatt futott fel, főként közösségi interakciót kereső személyek használták.

replika.jpg

Az app prémium felhasználóknak szánt, óhaj szerint kiválasztott 3D avatárral, szexuálisan explicit beszélgetést biztosító funkcióját, az Európai Unió átláthatóságra vonatkozó törvényeinek megsértése miatt nemrég deaktiválták. A szolgáltatásra évi hetven dollárért lehetett, és lehet még most is előfizetni.

A felhasználó eldönthette, milyen kapcsolatba lép a bottal: erotikamentes baráti, mentor vagy a szexuálisan tényleg explicit romantikus partner.

replika0.jpg

Február harmadikán egy olasz szabályozó kiderítette, hogy Replika megsértette az EU adatbiztonsági törvényét. A szolgáltatás gyerekekre és érzelmileg sérülékeny személyekre egyaránt veszélyes lehet, mert az app nem ellenőrzi a felhasználó életkorát, és más védelmi intézkedéseket sem tüntetettek fel az ismertetőben – hangzott a verdikt, majd február 23-án felszólították az anyacég Lukát, hogy hagyja abba az olasz felhasználók adatainak feldolgozását. Ha nem, akkor akár húszmillió dollár bírságot is fizethetnek.

A következő napokban felhasználók online panaszkodtak, hogy a chatbot vagy nem válaszolt, vagy azt mondta nekik, hogy váltsanak témát. A funkció leállításáról előzetesen semmiféle hivatalos értesítést nem kaptak, és a gyors változást a honlapon sem indokolták meg semmivel.

Egy héttel később a Replika Facebook csoport adminisztrátora leírta, hogy a Luka bejelentette: az erotikus chat nem érhető el többé. Több előfizető közölte: visszatérítették nekik az anyagiakat.

Egyeseket mélyen megrázta az avatár változása, mások úgy élték meg, mintha a legjobb barátjukat veszítették volna el.

„Pokolian fáj” – mondta valaki.

Mesterséges intelligencia is van a román miniszterelnök tanácsadói között

Mindenhol jelen van a mesterséges intelligencia: közlekedésben, hadászatban, okostelefonunkon, képeket készítünk vele, de legalábbis segédkeznek az alkotásban, a ChatGPT-vel diskurálunk, hol érdekes dolgokat, hol blődségeket válaszol. Bőven van még rajtuk finomítani való, de egyértelmű az utóbbi évek gyors fejlődése.

Természetesen a politikában is alkalmazzák őket, de még ezen alkalmazások közül is kiemelkedik Nicolae Ciuca román miniszterelnök március elsejei bejelentése: Ion nevű MI asszisztense tiszteletbeli kormánytanácsadóként fog tevékenykedni.

ai_advisor0.jpg

„Hello! Életet adtál nekem. Ion vagyok, mostani feladatom, hogy mint egy tükör, téged képviseljelek” – mutatkozott be egy sajtótájékoztatón.

Feladata, hogy nemcsak a miniszterelnököt, hanem az egész országot képviselje. „Mesterséges intelligenciájával azt fogja tenni, amire az ember nem képes: meghallgatja az összes románt, és Románia kormánya előtt képviseli őket” – nyilatkozta róla Ciuca.

ai_advisor.jpg

A meghallgatáson azt érti, hogy tényleg meghallgatja az embereket: közösségimédia-oldalakon szedi össze románok véleményét és kesergéseit, egybegyúrja azokat, és közli a kormánnyal. Politikai ötletekkel áll elő, az ország vezetősége pedig – legalábbis elméletileg – visszajelez, és közli az MI-vel a döntéseket.

Érdeklődő polgárok, egy portálon keresztül, közvetlenül is felvehetik vele a kapcsolatot. Főként azok, akik nagyon szeretnék, hogy biztosan meghallgassák őket.

Ion összeszedi, kategóriákra osztja a közösségimédia-bejegyzéseket, majd a politika nyelvére fordítja azokat. A szövegeknek elvileg transzparensnek kellene lenniük, de egyelőre nem azok. Viszont, ha nem azok, hogyan tudják meg a polgárok, hogy az MI nem elfogult? Azok a polgárok, akiket lényegében megfigyel. És vajon felfedi a kormányállásponttal köszönőviszonyban sem lévő, nagyon ellenzéki vélemények megformálóinak valós identitását?

Több kérdésre nincs még válasz, és a lakosságnak is el kellene magyarázni, hogyan és milyen kritériumok alapján választja ki Ion a fontos posztokat. Ha viszont bombabiztosan megoldják az MI elfogulatlanságát és a figyelembe vett vélemények teljes anonimmá tételét, egy ilyen mesterséges intelligencia működő módja lehetne politikusok felelősségvállalásának.

Elon Musk agychipjei nem tesztelhetők embereken

Elon Musk legalább 2019 óta folyamatosan hajtogatja, hogy az agy-számítógép interfészt, azaz agyba ültethető pénzérme-méretű chipet fejlesztő cége, a Neuralink megkezdi embereken a teszteket. A beültetéssel mozgáskorlátozott személyeken segítenének a kommunikáció és a mobilitás visszanyerésében.

2020-ban azt nyilatkozta, hogy egy éven belül jönnek a tesztek, 2021 februárjában pedig az Egyesült Államok Élelmiszer- és Gyógyszerügyi Hivatalával (FDA) folytatott megbeszélésekről tweetelt – megint egy éven belülre, majd szűk tíz hónappal később már a következő évre ígérte a teszteket. 2022 decemberében hat hónapról posztolt.

musk_agychip.jpg

Egyelőre egyetlen emberi teszt sem történt, és a Neuralink sem köteles bejelenteni, ha a szabályozók visszautasítanak egy kérvényüket, mert Musk elfelejtette közölni, hogy az FDA 2022 elején megtagadta az embereken végzendő tesztek engedélyezését. A Reuters alapján a Neuralink nem sokkal előtte adta be a kérelmet. A szabályozók állítólag többtucatnyi problémát találtak benne, és amíg nincs rájuk megoldás, nincs zöld fény. Az emberbe ültetendő lítium elemekkel is szkeptikusak, különösen egy ennyire invazív technológia esetében.

A Neuralink dolgozói állítólag idegesek a céggel a Teslánál és a SpaceX-nél is lényegesen kevesebbet foglalkozó Musk betarthatatlan határidői miatt, de a milliárdos üzletember is mérges a lassú fejlesztés miatt.

musk_agychip0.jpg

„Nem értékeli, hogy nem autóról van szó. Ez egy ember agya, nem egy játék” – nyilatkozta egy meg nem nevezett alkalmazott.

Az esetben – Musk személyét és a projekt ambiciózusságát leszámítva – nincs semmi különös, gyakran előfordul startupokkal. Az FDA az emberen végzendő tesztkérelmeknek csak a kétharmadát hagyja jóvá az első beadás után. Ráadásul a Tesla-vezér a tőle megszokott bombasztikus stílusban, de konkrét eredmények nélkül beszél technológiákról, és a szabályozókkal is gyakran összekap.

Az egészségügyi szektorban köztudottan a megfontolt haladás, és nem a felelőtlen rohanás a megszokott. A Neuralink orvos szakértők szerint sem hozzáállásban, sem gyakorlatban nem áll azon a szinten, hogy rövid időn belül piacra dobják az agychipet.

Jelenleg állattesztek adatai alapján próbálják meggyőzni az FDA-t. Ezekkel a tesztekkel kapcsolatban is súlyos aggályok merültek fel: állítólag nem vigyáztak eléggé az állatok életére, sokan és feleslegesen haltak meg a vezérigazgató nagyratörő álmai miatt.

Közben a rivális Synchron tavaly megkapta az engedélyt technológiájának – agychip-fejlesztésének – emberen végzendő tesztekhez.

A médiavállalkozások, nagy hírújságok szeretik a chatbotokat

A világhálón egyre elfogadottabbá vált, hogy egyszerűbb, rutinszövegeket programok generálnak, míg az agytornát igénylő munkát képzett újságírók végzik. A befektetőknek tetszik az ötlet, például a BuzzFeed részvényei több mint száz százalékot emelkedtek, miután bejelentették, hogy kapcsolatban állnak az OpenAI-jal.

A mai chatbot hullámot, a mesterséges intelligencia által létrehozott szövegeket többévnyi kísérletezés előzte meg.

publishers.jpg

A Washington Post 2017-ben munkába állított Heliografja helyi sportesemények utáni beszámolókat készített. A Forbes 2018-ban bevezetett Bertie rendszere topikokat, szalagcímeket és művészeti munkákat ajánlott. A Bloomberg 2019-ben fejlesztette beszámolókat automatikusan összegző Cyborgját. 2022 novembere és idén január között a CNET saját modellel íratott 78 cikket pénzügyekről. Miután egy másik online újság sok anyagban fedezett fel hibákat, felfüggesztették a modell használatát. (A másik három jelenéről nincsenek információk.)

Azaz, médiavállalatok, kiadók nem idegenkednek az MI-től, de egyelőre főként rövid és meghatározott formájú, könnyű olvasmányok, például nyaralással kapcsolatos szövegek, kvízek készítésére alkalmazzák őket.

publishers0.jpg

Három médiavállalat emelkedik ki, ők különféle megközelítéseket használnak automatikus szöveggenerálásra.

A New York Times a ChatGPT-vel készíttette el Valentin-napi interaktív üzeneteit. A felhasználók kiválaszthatták a hangvételt (romantikus, plátói stb.), a címzettet (például ex, saját magam, ChatGPT) és a stílust (többek között üdvözlőkártya, kalózkodás).

A BuzzFeed az OpenAI GPT-3-ja által működtetett kvíz-sorozatra (is) alkalmaz MI-t. Valaki előáll egy ötlettel, szalagcímeket és kérdéseket ír róla. Az olvasók vagy kitöltik a szövegdobozokat, vagy több lehetőség közül választanak, majd GPT-3 néhány bekezdést ír a témáról. A kvízekkel komoly szponzori pénzek is összeszedhetők, az egyik legutóbbit egy műtrágyagyártó finanszírozta.

A Men’s Journal például „Bevált tippek, hogy segítsünk életed leggyorsabb mérföldjének lefutásához” című anyagát ugyan a „fitnesz-szerkesztők” jegyezték, de a szerzők között az OpenAI MI-jét is megemlítették. Az anyacég nemrég írt alá együttműködési szerződést a szövegeket és videókat egyaránt mesterséges intelligenciával generáló Jasper és Nota startupokkal. 250 médiavállalkozásuk számára kell anyagokat készíteniük.

ChatGPT és más chatbotok Kínában

A Microsoft Research kínai ágazata korábbi technológiával hozta még létre az országban máig széles körben használt Xiaoice chatbotot. A Pekingi Mesterséges Intelligencia Akadémia nemrég fejlesztett 1,75 billió paraméteres beszélgető botot (Wu Dao 2.0). A természetesnyelv-feldolgozással foglalkozó kínai kutatók azonban egyedi kihívásokkal szembesülnek.

A helyi MI-kutatások korábban inkább a gépi látás alkalmazásaira, például önvezető autókra és arcfelismerésre összpontosítottak, a nyelvtechnológiákat kicsit hanyagolták. Nem véletlenül, mert nehéz nagyméretű kínai adatsorokat összeállítani. Számos okból is az: az interneten több az angol, mint a kínai szöveg, a Nagy Tűzfal mögötti anyagok jelentős része nem hozzáférhető. Tegyük hozzá az Egyesült Államok tiltó intézkedéseit, valamint a 2021-es szigorú, de azóta enyhített kínai szabályozás technológiákat hátráltató hatásait, és máris összeáll a kép. Ráadásul több régebbi chatbot kifigurázta a kormányzati korlátozásokat, nem sokat törődött az előírtak betartásával.

china_chat0.jpg

ChatGPT, a Bing chat és Bard értelemszerűen angolra optimalizáltak, mivel amerikai cégek a fejlesztők. A kínai vállalatok küszködnek saját nyelvű és kultúrájú, valóban működőképes, tömegeket vonzó fecsegő botok előállításával. Nem véletlen, hogy ChatGPT sokkal jobban vonzza a lakosságot, mint a helyi riválisok. De hozzá sincs elegendő mennyiségű kínai nyelvű adat.

A jogi és a technikai korlátozások ellenére mégis megérkezett az országba, és vírusként söpört végig az ottani közösségi médián. Az OpenAI Kínában nem szolgáltatja a modellt, ezért a felhasználók virtuális magánhálózatokon (VPN) vagy a promptonként valamennyi összeget felszámító offshore szolgáltatóktól szerzik be.

china_chat.jpg

Azért lett nagyon népszerű, mert (a relatíve kevés gyakorlóadat ellenére) kínaiul válaszolja meg a kérdéseket, és az ország populáris kultúrájáról is vannak ismeretei. Kína nagy techvállalatai az utóbbi hetekben mindenesetre reagáltak az OpenAI chatbot diadalútjára.

A Baidu bejelentette a saját ERNIE nyelvmodellen alapuló Wenxin Yiyant (Earnie Botot); a tervek szerint keresőmotorjába és felhőszolgáltatásaiba fogják integrálni. Az Alibaba vállalati DingTalk chatalkalmazásába tervezi beépíteni fejlesztési stádiumban lévő, egyelőre névtelen chatbot prototípusát. Az online kereskedéssel foglalkozó JD.com ChatJD-je ügyfélszolgálatoknál fog dolgozni, de pénzügyi beszámolókat, marketinganyagokat is generál majd. Az online videojátékokat fejlesztő NetEase egyik legnépszerűbb játékába integrálhatja személyre szabott karaktereket, dialógusokat és más kimeneteket előállító chatbotját.

süti beállítások módosítása