Miért ne féljünk a mesterséges intelligenciától?

0

2023. november 15. - ferenck

A szenzációhajhász média mellett egyes szakemberek és Elon Musk is jó ideje a mesterséges intelligencia (MI) miatti egzisztenciális veszélyekkel, az emberiség gépek általi kipusztításával riogatnak. Az ilyen jóslások nemcsak alaptalanok, hanem komoly károkat is okozhatnak.

Andrew Ng, világhírű gépitanulás-szakértő régóta foglalkozik ezzel a kérdéssel is, mert próbálja megérteni, vagy egyszerűen csak vizualizálni, hogy a riogatók pontosan hogyan gondolják a folyamatot. Egyik klasszikus forgatókönyvük, hogy bizonyos politikai csoportok biofegyvereket gyártanak MI-vel, egy másik szerint pedig MI-rendszerek véletlenül pusztítják el az embert, mint ahogy a Homo sapiens is pusztított már ki véletlenül fajokat.

Amikor Ng próbálta kiértékelni az ilyen szcenáriókat és a bennük lévő érveket, frusztrálóan laposnak és nem-specifikusnak találta azokat, lényegében arra csapnak le, hogy „megtörténhet”, mint ahogy bármi előfordulhat. Az ellenkezőjük pedig nyilvánvalóan nem bizonyítható, mint ahogy az sem, hogy például a Földön kibocsátott rádióhullámok hatására földönkívüliek nem indulnak meg bolygónk felé, és nem irtják ki az emberiséget.

Az ennyire túlzó félelmek mindig kárt okoznak. Gimnazisták mondták Ng-nek, hogy azért félnek az MI-től, mert hallották: végromlásunkat okozhatják, és ki akarnak maradni belőle. Azaz, sokakat már a gimnáziumban igyekeznek elriasztani társadalmilag hasznos technológiai pályáktól.

Ng nem kételkedik az MI-szkeptikusok egy részének őszinteségében. Mások viszont anyagilag érintettek az ítéletnap-forgatókönyvek terjesztésében: később anyagi javakkal járó figyelmet akarják magukra felhívni, nonprofit szervezetek pénzt kalapozhatnak össze az általuk kitalált fantom elleni küzdelemre, politikusok jelentősen növelhetik a kampánytámogatást, ha keménykednek a technológiai cégekkel.

Ng meggyőződése, hogy az MI jobbá, teljesebbé teheti, meghosszabbíthatja életünket. Persze ez megakadályozható, mégpedig úgy, ha a szabályozók rossz tanácsokra hallgatva, a technológiai fejlődést hátráltató törvényeket hoznak. A nyílt forrású megoldásokkal való versengést elutasító nagy cégek lobbistái is próbálják meggyőzni a szabályozókat az MI gonosz alaptermészetéről, és még inkább arról, hogy kormányengedélyhez kössék a nagy MI-modelleket. Ha így történne, a nyílt forráskódú kezdeményezések megszűnhetnének, az innováció brutálisan lelassulna.

Ng szerint ezek a valódi félelmek, ezek ellen kell harcolni. Szerencsére a fejlesztői és a tudományos közösség a valóság talaján áll, a nyílt forrású megoldásokat sokan támogatják. Nekik kell a pozitív MI-képet promótálniuk.

Az MI távolról sem tökéletes, és rengeteg a munka, mielőtt biztonságosabb és felelősségteljesebb lesz. De az emberiség már így is sokat köszönhet neki, és a jövőben még többet fogunk profitálni belőle.

„Gondoskodjunk arról, hogy megalapozatlan félelmek ne akadályozzák a fejlődést” – összegez Ng.

komment

jövő mesterséges intelligencia

A Prada tervezi a NASA következő űröltönyét

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 14. - ferenck

Jó hír a divat szerelmeseinek, hogy a Homo sapiens olasz luxusmárka termékében tér vissza a Holdra.

Tavaly nyáron a kereskedelmi űrrepüléssel foglalkozó Axiom Space jövedelmező szerződést kötött a NASA-val. A szerződés értelmében ők tervezik az amerikai űrügynökség 2025-re várható Artemis III űrmissziójához az asztronauták ruháját.

Csakhogy az Axiom nem egymagában tervezi, varrja a ruhákat, hanem az olasz divat egyik legismertebb luxusmárkája, a Prada segít be neki. A texasi startup október elején jelentette be az „úttörő partnerséget.” A milánói divatházzal a ruha anyagán és kialakításán is közösen dolgoznak.

A Prada nyersanyagokkal, gyártási technikákkal, innovatív tervezési koncepciókkal kapcsolatos műszaki szakértelme nemcsak az űrhajósok holdfelszíni kényelmét, hanem a régebbi űrruhákból hiányzó emberi tényezőt is garantálja – véli az Axiom vezetősége. Tehát egészen különleges darabra számíthatunk.

A Pradát is felvillanyozta az együttműködés. Az alapító Mario Prada folyamatos előrelátására, a lehetőségek és a dimenziók bővítési szándékára, világűrre, mint új kalandra való hivatkozására emlékezve, úgy érzik: történelmi küldetés részei.

A divatház nyilván nem mozog otthonosan űrruhák tervezésében, viszont óriási a kihívás: extrém környezetre, az eddigiektől teljesen eltérő céllal kell alkotniuk valamit.

Anyagtudományi ismereteik kiemelkedőek, és azt is nehéz elképzelni, hogy a Prada űrruhája ne lenne majd óriási előrelépés esztétikai és remélhetőleg kényelmi szempontból is a NASA asztronautái által az utóbbi hatvan évben viselt darabos és ma már inkább komikus, idejétmúlt űr-egyenruhákhoz képest.

Hosszabb távon különösen jól járhat a Prada. Ha az űrmisszió és az öltözék sikeres lesz, és ha ez emberiség előbb-utóbb elkezd utazgatni a világűrben, a milánói divatház rendelkezni fog elegendő tapasztalattal ahhoz, hogy versenyelőnyre szert téve, ő öltöztesse a jövő űrturistáit. A földi mellé interplanetáris divatot is teremtenek.

komment

űrkutatás divat NASA

Milliárdokat költ mesterségesintelligencia-fejlesztésekre az Apple

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 13. - ferenck

Az Apple-t talán váratlanul érte, hogy a ChatGPT és a generatív mesterséges intelligencia (MI) meghódította a világot, most mindenesetre, igaz, jól megkésve, tervezi a teljes készülékpalettáját érintő választ. A Mac jövője fókuszpontba került, debütál az olcsóbb Apple Pencil, és a Vision Pro is közelebb került.

A világ leggazdagabb vállalatának azonban a mesterségesintelligencia-hullámra kell elsősorban reagálnia. A partvonalra kerültek, miközben az OpenAI szárnyal, a Google és a legklasszikusabb rivális, a Microsoft is utcahosszal előttük jár MI-fejlesztésekben. Megjelent a keresőik MI-változata, meggyőzően emberi válaszokkal. A Microsoft intelligensebb asszisztensekkel frissítette Windows appjait, és az Amazon is MI-vel újította meg az Alexát.

Mindeközben az Apple egyetlen értelmezhető MI-fejlesztése egy feljavított auto-correct rendszer az iOS 17-en.

Tim Cook ugyan elmondta, hogy évek óta dolgoznak a generatív MI-n, de a vezetőséget tényleg meglepte a hirtelen MI-aranyláz. Egy nagy nyelvmodellen (LLM), az Ajaxon munkálkodnak, létezik belső használatú chatbot is, az Apple GPT. Kérdés persze – és ez a következő, kritikus lépés –, hogy ezek a technológiák mennyire versenyképesek, és mennyire integrálhatók a cég termékeibe.

Az Apple állítólag évi egymilliárd dollárt költ mesterségesintelligencia-fejlesztésekre. Teljesen megváltoztatják a ma már kövületnek számító Sirit, jövőre jön egy sokkal intelligensebb változat, de ez csak egy termék, a teljes váltás hosszabb ideig eltarthat.

A szoftverfejlesztő részleg az iOS következő változatát bővíti MI-funkciókkal. Siri és a Messages app lekérdezésekre ad majd választ, maguktól fejeznek be mondatokat stb. A generatív MI-t fejlesztői eszközökbe, mint az Xcode igyekeznek integrálni, amellyel alkalmazásprogramozók gyorsabban írhatnak új appokat. Egy kicsit talán úgy, mint a Microsoft GitHub Copilotja.

A cél, hogy annyi appot turbózzanak fel MI-vel, ahányat csak lehet. Vizsgálják, mit tehetnek az Apple Music-kal, talán a Spotify mintájára jönnek az öngeneráló lejátszási listák. A Microsoft Word és PowerPoints MI-funkcióihoz hasonlókra szintén számíthatunk. A belső ügyfélszolgálati alkalmazásokban már tesztelik a generatív MI-t, felhasználási módja cégen belüli viták tárgya – csak eszközökön, vagy felhőalapú legyen, vagy valahol a kettő között. Az első gyorsabb, az adatvédelem sem sérül, viszont az LLM-ek felhőn keresztüli működtetése sokkal fejlettebb műveleteket eredményezne.

A „csak az eszközön” stratégia a technológiai frissítéseket és a gyorsan mozgó ipari szektorhoz történő alkalmazkodást is nehezíti. Mindezek fényében kombinált megközelítés tűnik a legvalószínűbbnek.

Ma már az Apple-nél is pontosan tudják, hogy a generatív MI sokkal több szimpla hívószónál: a következő évtizedek számítástudományának egyik kulcseleme. Egy ekkora cég egyszerűen nem engedheti meg magának, hogy hosszú ideig követőmódból figyelje a történéseket.

komment

okostelefon mesterséges intelligencia Apple chatbot nyelvtechnológiák

2024 tíz legmarkánsabb felhőszámítás-trendje

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 09. - ferenck

Bernard Marr világhírű techjövő-kutató a Forbes hasábjain fejtette ki, mit gondol a felhőszámítások (cloud computing) 2024-es alakulásáról, egy, története során először jövőre egybillió dollárnál nagyobb üzletről. A növekedést főként két tényező okozza: új platformok egyre fontosabb adaptálása, valamint a „mint szolgáltatás” jellegű kínálatok – köztük az MI-szolgáltatásoké is.

E két hajtóerő (miközben a felhő is az újítások és a lehetőségek hajtóereje) egyértelműen jelzi, hogy 2024-re az üzleti vállalkozások túllépnek a felhőre való költözést kizárólag idő- és pénzspóroló lehetőségként felfogó hozzáálláson. Esettanulmányok példázzák, hogy a felhő kulcsszerepet játszik vállalkozások innovatívabbá, agilisabbá és sikeresebbé válásában. Az új modellek, mint a hibridrendszerek további határokat sértenek, és közben természetesen új lehetőségeket kínálnak.

Az első trend az MI, mint szolgáltatás (AI-as-a-Service, AIaaS): a felhőinfrastruktúra meghatározó szerepet játszik a mesterséges intelligencia széles rétegek számára való elérhetőségében. A legtöbb cég nem rendelkezik elegendő forrással ahhoz, hogy óriási adatmennyiségen gyakoroltassa MI-jeit, ezért szolgáltatásként veszi igénybe azt. 2024-ben ez a tendencia szignifikáns mértékben erősödni fog.

A hibrid és multi-felhők a második: több vállalat fog egynél több szolgáltatótól venni szolgáltatást, amellyel nő a rugalmasságuk, csökkennek a kiadásaik, bár az adatkezelés és az örökölt rendszerek integrációja problémákat okozhat. A felhő és a helyszíni infrastruktúra keverése, a hibrid felhő szintén népszerűbb lesz.

Három: a valós idejű adatfeldolgozás, a valósidejű felhőinfrastruktúra tovább erősödik, miközben az egyre több streamelt adattal (Netflix, Spotify, Zoom- és Tennis-beszélgetések, „felhő gaming”) az adattárolásnál még fontosabb szempont lesz az azonnali hozzáférhetőség.

Négy: a felhőszámítások használatával több komoly változást hozó technológia lesz hozzáférhetőbb: MI, IoT, blokklánc, kvantumszámítások stb. Cégeknek nem kell közvetlenül architektúrába és infrastruktúrába fektetniük ezekhez.

A felhőbiztonság és az ellenállóképesség az ötödik: a félelmek és fenyegetések növekedésével a titkosítás, a hitelesítés és a katasztrófa utáni helyreállítás lesznek a legkeresettebb felhőfunkciók. A biztonság szolgáltatónak és felhasználónak egyaránt kiemelt szempont.

Hat: a fenntarthatóság a nagy cégek 2030-ra, 2040-re ígért zéró széndioxid-lábnyom vállalásaival továbbra is markáns trend marad, a zöldebb és a környezetre kevésbé káros megoldások iránti igény állandó növekedésével, a felhőt is értelemszerűen fenntarthatóbbá kell tenni.

Leegyszerűsödnek, technológiailag nem képzett személyek számára is használhatóvá válnak a felhőszámítások – ez lesz 2024 egyik legmarkánsabb (egyben a hetedik) trendje.

Nyolc: a „felhő privacy”, a felhőalapú adatvédelem a vállalkozásokat a felhő kezelésében segítő, adataik védelmét garantáló technológiai, szabályozási és jogi megoldások folyamatos fejlesztése. Ha egy üzlet felhőszolgáltatást használ, adatai külső személyhez, általában a szolgáltatóhoz kerülnek. Védelmük erősítése 2024-ben minden korábbinál fontosabb szempont lesz.

Kilenc: a szervernélküliség felhőszámítási modell, amelyben a vállalatoknak nincs szükségük saját szervereik menedzselésére. Immáron nem fizetnek a szerverekért, hanem csak a közvetlenül használt erőforrásokért. Nő a hatékonyság, alaptevékenységekre fordítható idő szabadul fel. A modell folyamatos terjedése tapasztalható.

Tíz: az információfeldolgozás helyszíne még közelebb kerül a gyűjtés helyszínéhez, azaz fontosabbá válnak a peremszámítások, az edge computing. A kisebb, energiahatékonyabb processzorok, a jobb algoritmusok és fejlettebb hálózatok, mint például az 5G mind hozzájárulnak a peremszámítások egyre több alkalmazásban való használhatóságához.

komment

jövő felhőszámítások

A „peremen” futó mesterségesintelligencia-alkalmazások drasztikus növekedése várható

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 08. - ferenck

Előrejelzések alapján 2025-ig 61 százalékkal nő a világ adatállománya (a céges adatoké 75 százalékkal). A növekedés jelentős részben a hálózatok peremén (edge) ténykedő, irdatlan mennyiségű adatot generáló dolgok internetével (IoT) magyarázható. Minden adatot a számítási felhőben lévő adatközpontok tárolnak, dolgoznak fel, amivel a hálózati sávszélesség-követelmények drasztikusan növekednek, és a lehetőségek határát közelítik. Hiába fejlődik a technológia, az adatközpontok nem garantálják a sok alkalmazás szempontjából kritikus megfelelő átviteli sebességet és válaszidőt. Ráadásul a peremen működő eszközök (IoT, okostelefonok, laptopok, PC-k) folyamatosan használják a felhőből jövő adatokat.

Andrew Ng világhírű gépitanulás-szakértő szerint a mesterséges intelligencia, benne a generatív MI is gyorsan terjed a hálózatok peremén futó alkalmazásokban. Észrevétele ellentmondani látszik a hagyományosan értelmezett számítástudománynak: a legtöbb MI adatközpontokban, és nem peremeszközökön fut.

Több okból: a legmasszívabb nagy nyelvmodellek (LLM-ek) legalább százmilliárd vagy több paraméteresek, és még a következtetésekhez is óriási memóriakapacitás szükséges.

Az üzleti vállalkozások a felhőszámítás-alapú, „szoftver, mint szolgáltatás” (SaaS) termékeket jobban szeretik a peremen futó szoftvereknél. Az SaaS-szel a cégek hozzáférnek a termék minőségén javító adatokhoz, és könnyebb is vele a frissítés.

A legtöbb mai fejlesztőt SaaS-alkalmazások építésére gyakoroltatták, és inkább írnak felhőalapú, mint desktop- vagy más edge-alkalmazást.

Ng szerint mégis óriási a potenciál a perem és az MI összekapcsolódásában. Például azért, mert az MI-alkalmazások egyre jobban működnek peremeszközökön. Laptopján rendszeresen futtat egy-tízmilliárd paraméteres modelleket, ha pedig repülőn, wifi nélkül dolgozik, kis modelleket használ.

Sok alkalmazás esetében nincs semmi probléma korlátozott méretű modellekkel, mindegyik finomhangolható az aktuális feladathoz. Nyelvtani hibák kijavításához egyébként sem kell a történelemről, filozófiáról, csillagászatról és minden más témáról átfogó ismerettel rendelkező, 175 milliárd paraméteres modell.

Sok felhasználó, különösen az 1996 és 2010 között született Z-generáció – a jövőbeli trendek indikátora – egyre érzékenyebb a személyes adatokra (privacy), és ha például a helyesírási hibáinkat ellenőrizzük, semmi szükségünk adatainkat nagy techcégekkel megosztani. De az adataik magántermészetét féltő cégek számára is vonzó lehet az edge computing.

Erős kereskedelmi érdekek szintén a perem felé terelik az MI-t. A chipfejlesztők, mint például az Nvidia, az AMD és az Intel adatközpontoknak és PC-s, laptopos használatra értékesítik a chipeket. Így a félvezető- és a PC/laptop-gyártók erősen motiváltak a „perem MI” (edge AI) elterjedésében, mivel fogyasztóiknak a modernebb MI-használathoz frissíteniük kell a gépeiket. Magyarán sok cég kezd profitálni a perem MI felemelkedéséből, és komoly érdekük a reklámozása.

komment

jövő mesterséges intelligencia edge computing

Gépi tanulással szűk térben is jól csomagolnak a robotok

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 07. - ferenck

Ha próbáltunk már a családi nyaralásra elegendő cuccot autónk csomagtartójába pakolni, tudjuk, hogy nehéz feladat. Az emberhez hasonlóan, robotoknak is meggyűlik a bajuk a „sűrű” csomagolással.

Robotok számára a csomagolási probléma megoldása számos feltétellel jár: csomagok egymásra rakása, hogy a bőröndök ne essenek ki a csomagtartóból, nehéz tárgyak ne kerüljenek könnyebbek tetejére, a robotkar és a jármű lökhárítója közötti ütközések is elkerülendők és így tovább.

Egyes hagyományos módszerek szekvenciálisan kezelik a problémát. Egyszerre egy, valamelyik feltételnek megfelelő részmegoldást találnak ki, és megnézik, más feltétel nem lett-e megsértve. A műveletek hosszú sora és egy halom poggyász bepakolása miatt a folyamat annyira időigényes, hogy praktikusnak egyáltalán nem nevezhető.

Az MIT (Massachusetts Institute of Technology) kutatói a diffúziós modell nevű generatív mesterségesintelligencia-technikát használták a feladat hatékony kivitelezéséhez. Gépitanulás-modellek gyűjteményével dolgozva, mindegyiket speciális feltételtípus megjelenítésére tanították be. A modelleket később összekombinálták, hogy az összes feltételt egyszerre figyelembe vevő, globális megoldásokat generáljanak.

Módszerükkel a többi technikánál gyorsabban dolgoztak ki hatékony megoldásokat, és ugyanannyi idő alatt jóval több valósult meg sikeresen. Szintén fontos, hogy a feltételek új kombinációival a tárgyak nagyobb száma miatt előforduló újabb problémákat is képesek voltak kezelni. Olyanokat, amelyeket a modellek nem láttak gyakorlás közben.

Az általánosíthatóságnak köszönhetően, a robotoknak megtanítható a csomagolási problémák feltételeinek megértése, teljesítése. Az így gyakoroltatott robotok a raktározástól a könyvespolcok feltöltéséig, sokféle bonyolult feladat elvégzésére alkalmazhatók komplex környezetekben.

komment

robot gépi tanulás MIT

Hat éve tökéletesen működik egy bionikus kar

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 06. - ferenck

Ötven éve ment az életeket megváltoztató bionikus technológiákat felvázoló, A hatmillió dolláros ember televízióssorozat. „Újra tudjuk építeni önt, meg van hozzá a technológiánk” – hangzott a mottó.

2023-ra svéd kutatók megvalósították a legendás sorozat jövőképét. Egy, jobb karját mezőgazdasági balesetben húsz esztendeje elveszített nőn 2017-ben sikeres bionikus beültetést végeztek. Azóta a mesterséges végtag teljes mértékben integrálódott az illető idegeivel, csontjaival és izomzatával.

A most ötven éves nő elmondta, hogy a bionikus kar drasztikusan megváltoztatta az életét, mozgékonyabb lett, és sokkal kevesebb fájdalmat érez. Előtte olyan érzése volt, mintha folyamatosan húsdarálóban lenne a keze.

Kétféle fájdalma volt: csonk-, ahol a könyök alatti amputáció történt, valamint fantomfájdalma. Utóbbi gyakori jelenség, a beteg a végtag eltűnése után is úgy érzi, mintha fájna a nemlétező testrész.

Nagymennyiségű fájdalomcsillapítót szedett. Mindezek mellé a korábbi szabvány karpótlást nehézkesnek, kényelmetlennek tartotta.

A bionikus kar mindent megváltoztatott. A fejlesztést svéd, ausztrál, olasz és amerikai kutatók végezték. A műtét után tízes skálán ötösről hármasra csökkent a fantomfájdalom, míg az akkor hatosnak érzékelt csonkfájdalom mára teljesen eltűnt. Sokkal kevesebb gyógyszerre van szüksége, jobban kontrollálja a bionikus kart.

Szakértők elmondták, hogy a kontroll, a nehéz irányíthatóság a hagyományos beültetések egyik legnagyobb problémája. Léteznek már nagyon kifinomult szerkezetek, de a megbízható és intuitív kontroll komoly gondot okoz. Kényelmetlenek és viselésük fájdalmakkal jár, mivel a bőrt erősen összenyomó foglalattal a végtag maradékához rögzítik őket.

A nemzetközi kutatócsoport ezért döntött az olasz Prensilia robotkarja, a Mia Hand mellett. Úgy tervezték, hogy viselője mindennapi rutintevékenységének akár nyolcvan százalékát elvégezze. Az esztétikumra is ügyeltek, mert az eddigi mesterséges végtagok inkább stigmatizáltak, semmint kellemes érzeteket keltettek.

A csontba integrált beültetések segítségével, közvetlenül a csontvázhoz kapcsolódik. Az idő múlásával a csontszövet beburkolja az eszközben lévő titánt, erős kötődés alakul ki a test és a bionikus tárgy között – összenőnek.

A beültetések a művégtag és az idegekbe és izmokba implantált elektródák között is kommunikációs kapuként működnek. Az elektródák a lokalizált idegkontrollról gyűjtenek infókat, amelyeket külső számítógépre továbbítanak. A számítógép mesterségesintelligencia-szoftverrel segíti a kézhasználatot.

A kéz a páciens saját idegei és a bionikus kar által érintett bármely tárgy közötti szenzorikus visszacsatolást kialakító érzékelőkkel is fel van szerelve. Ha az idegrendszerét a beültetésként funkcionáló elektronikával összekapcsolják, kevesebb a fájdalom, nagyobb a kontroll.

A bionikus kar természetesen felhasználóbarát is. Viselője éjszakai alvás előtt könnyedén és mások segítsége nélkül le tudja venni. Kényelmesen érzi magát, rengeteget segíti a mindennapokban.

Egyelőre ő az első és egyetlen páciens, aki ennyire integrált bionikus kart hord, és bár a kar minden eddiginél jobb, fejlesztői szerint még még sokat kell tenni a biológiai karhoz való hasonlóság fokozásáért.

komment

implantátum bionikus

Hogyan javítsunk a promptokon?

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 03. - ferenck

A nagy nyelvmodellek (LLM) legújabb generációja túlmutat a nyelven. Ezekkel a mesterséges intelligenciákkal már multimodálisan, szöveg mellett vizuálisan, a kép-szöveg valamilyen kombinációjával, hang és más módszerekkel is kommunikálunk, változatos utasításokat, promptokat adhatunk nekik, amelyekre aztán valamilyen választ generálnak.

Az OpenAI GPT-4V, azaz a vizuális elemmel kiegészült GPT-4 ma a legismertebb ilyen modell. A Microsoft kutatói behatóan tesztelték a benne rejlő potenciált, és változatos feladatokat használva értékelték ki a promptolás adta lehetőségeket.

Az opciók között képek, szavak és számítógépes kódok közötti kifinomult interakciók is szerepeltek. A beszámolókban csak – pozitív és negatív – kvalitatív eredmények olvashatók. Más konkurens modellel, például a LLaVA-val nem végeztek összehasonlítást.

A GPT-4V-nek vizuális promptot adva, egy képen belül kiemelve az érdeklődésre számot tartó részt, majd dobozokkal és szöveges címkékkel hangsúlyozva azt, a modell teljesítménye folyamatosan javult.

Nem sorrendbe rakott képsorozatot látva, a GPT-4V azonosította az első eseményt, majd előrejelezte a következőket. Amikor pontos sorrendben kapta meg a képeket, leírta a cselekménysorozatot.

Amikor tengerparti tájról kapott fényképet, és arra kérték, hogy csökkentse a nézők érdeklődését, elmagyarázta, hogy a sziklák csúszósak és élesek, a hely pedig alkalmatlan a fürdésre.

Koponya MRI-vizsgálata alapján, szakértő radiológusi véleményt kértek a modelltől, amelyre pontos diagnózissal állt elő. A kiértékelést szakemberek végezték.

Egyszer a GPT-4V által generált képaláírások több részletet tartalmaztak, mint a valóságos példák. A kutatók ebből azt a következtetést vonták le, hogy a meglévő benchmarkok (kiválóság, teljesítmény mércéje, amelyhez hasonlókat kell mérni, megítélni) nem teszik lehetővé a kép tartalmának megértését.

A kvalitatív példák látványosak, de úgy válogatták össze őket, hogy csak felvillantsanak valamit a GPT-4V lehetőségeiből. A Microsoft szerint a modell viselkedése nem konzisztens, és bőven akad rajta finomítani való.

komment

mesterséges intelligencia Microsoft OpenAI képtechnológiák nyelvtechnológiák multimodalitás

Százszor energiahatékonyabb lett a mesterséges intelligencia

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. november 02. - ferenck

Az Illinois állambeli Északnyugati Egyetemen új nanoelektromos eszközt fejlesztettek gépitanulás-alapú osztályozó feladatok valóban energiahatékony megvalósítására. Az eszköz a jelenlegi technológiák fogyasztásának századrészét használva hatalmas adatmennyiség feldolgozására, mesterségesintelligencia-munkák kivitelezésére képes valósidőben, és az elemzéshez a számítási felhőt sem kell használnia.

E tulajdonságai miatt ideális a viselhető (wearable) elektronikai szerkezetekbe, például okosorákba és fitnesz-mérőkbe történő közvetlen integrációhoz, a valósidejű adatfeldolgozáshoz és közel valósidejű diagnosztikához.

Az elképzelést nyilvánosan hozzáférhető elektrokardiogram (EKG) adatsorok nagymennyiségű információijának osztályozására használták fel. Nemcsak hatékonyan és pontosan azonosította a szabálytalan szívverést, de az aritmia hat kategóriáját is 95 százalékos pontossággal megkülönböztette egymástól.

A jelenlegi bevett gyakorlat alapján szenzorok gyűjtik, és a számítási felhőbe küldik az adatokat, ahol a szerverek komoly energiamennyiséget használva elemzik azokat, mielőtt visszaküldenék a felhasználónak. Ez a megközelítés nagyon drága, túl sok a fogyasztás, és időkésleltetés is jár vele.

Az új eszköz teljesen másként működik, többek között sürgősségi egészségügyi esetekben vehetik majd komoly hasznát.

Mielőtt gépitanulás-technikák új adatokat elemeznének, a gyakorlóadatokat kell különféle kategóriákba rendezniük. Szilíciumalapú technológiákkal EKG-szerű nagy adatsorok kategorizálásához több mint száz tranzisztor kell, mindegyik saját energiát használ.

Az Északnyugati Egyetem új módszerével ugyanaz a gépitanulás-osztályozás két eszközzel megoldható, így pedig drasztikusan csökken az energiafogyasztás, az eszköz mérete, miközben jelentősen nőnek más tárgyakba, rendszerekbe integrálásának a lehetőségei.

A kutatók szerint a változatos anyagösszetétellel (kétdimenziós molibdén-diszulfid és egydimenziós szén nanocsövek) magyarázható különleges hangolási készség miatt működik ennyire hatékonyan az új eszköz. Rekonfigurálható tranzisztorai elég dinamikusak ahhoz, hogy különböző lépésekbe váltsanak.

komment

adat anyagtudomány adatközpont energiafelhasználás felhőszámítások viselhető technológiák

A GPT-4 kinyitotta a szemét

Facebook Tumblr Tweet Pinterest Tetszik

0

2023. október 31. - ferenck

Amikor hozzáférhetővé vált a GPT-4 csak szöveges változata, az OpenAI hetekig nem tette közzé a kvantitatív eredményeket, és az architektúráról és a gyakorlásról máig nincs részletes anyag. Lényegében csak sejtjük, mire lehet képes a nagy nyelvmodell (large language model, LLM).

A GPT-4 legújabb változata, a GPT-4V a szöveggel, képpel és a kettő kombinációjával interakciókat folytató nagy multimodális modellek születőben lévő generációjának egyik korai példája. Eddig speciális rendszerek által végzett feladatokat (tárgydetektálás, arcfelismerés, optikai karakterfelismerés stb.) kivitelez, és mellette alkalmazkodik képekhez, szöveges és vizuális promptok alapján alkot, változtat rajtuk.

A modell képszerkesztőkkel, tervezőeszközökkel, személyes asszisztenssel és egy sereg más alkalmazással hozható közös nevezőre. A lehetőségek szerteágazók és izgalmasak.

A GPT-4 Vision-nel kiegészített verziót, a szeptember 24-én bemutatott GPT-4V-t kevesen tesztelték, de akiknek lehetőségükben állt, mind elégedetten nyilatkoztak róla. Többek közhött az X, a korábbi Twitter felhasználói széles körben tesztelték, például olyan szituációban is, amikor a modellnek ismernie kellett a kép tartalmát, kontextusát, következtetnie kellett belőle, és elfogadható válaszokat kellett generálnia.

Egy felhasználó például több parkolótáblával kirakott közlekedési oszlopról mutatott neki képet, beírta az időt és a napot, majd rákérdezett: parkolhat-e ott? A modell elolvasta a jeleket és helyesen válaszolt: „délután négytől, egy óra hosszat parkolhat itt.”

Egy másik „mérnök ágenst” építve, lehetővé tette, hogy a modell kóddá alakítsa a weboldal képernyőképét, majd a kódolási és a tervezési hibákat megszüntetve, iteratív módon javítsa a programot.

A 2000-es hollywoodi sikerfilm, a Gladiátor egyetlen képkockája alapján a modell sikeresen azonosította a Maximus Decimus Meridust alakító Russell Crowe-t, és még a kapcsolódó párbeszédet is bemutatta.

Amikor az emberi sejtről mutattak neki diagramot, és megkérték, hogy kilencedik osztályos diák szintjén írja le azt, személyre szabott oktatóként viselkedett.

komment

mesterséges intelligencia multimodalitás

Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Miért ne féljünk a mesterséges intelligenciától?

A Prada tervezi a NASA következő űröltönyét

Milliárdokat költ mesterségesintelligencia-fejlesztésekre az Apple

2024 tíz legmarkánsabb felhőszámítás-trendje

A „peremen” futó mesterségesintelligencia-alkalmazások drasztikus növekedése várható

Gépi tanulással szűk térben is jól csomagolnak a robotok

Hat éve tökéletesen működik egy bionikus kar

Hogyan javítsunk a promptokon?

Százszor energiahatékonyabb lett a mesterséges intelligencia

A GPT-4 kinyitotta a szemét