Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe


Megjelent az első kínai szöveget videóvá alakító modell

2024. július 01. - ferenck

Mérföldkőhöz érkezett a kínai Kuaishou vállalat: június hatodikán elindította az első nyilvánosan tesztelhető, szövegből videót ingyen generáló, jelenleg már hatszázmillió felhasználós mesterségesintelligencia-modellt. Neve Kling, és az OpenAI Sora MI-jéhez hasonlóan (elvileg) akár kétperces,…

Tovább

Dokumentált dezinformáció

A mesterséges intelligencia által létrehozott dezinformáció, főként képek, videók és hanganyagok száma folyamatosan nő, 2023 végén már a számítógéppel manipulált médiatartalmak több mint harminc százalékáért MI volt a felelős. A realisztikus anyagokat generáló MI-modellek széleskörű elérhetőségével…

Tovább

A Sony betámadta a generatív mesterséges intelligenciát

A lemezipar legnagyobb üzleti és legtöbb kiadót tömörítő vállalkozása, az UMG (Universal Music Group) tavaly szólította fel az Apple Musicot és a Spotify-t, hogy blokkolják felvételeit az azokat letöltő mesterségesintelligencia-fejlesztők elől, illetve MI-vel generált UMG-szerződéssel védett anyagok…

Tovább

2024 a multimodális mesterséges intelligenciák éve

A nagy mesterségesintelligencia fejlesztők közötti verseny egyre elképesztőbb tempóban eredményez egyre jobb modelleket. Az OpenAI GPT-4o-ja multimodális (teljeskörű) inputtal és outputtal mutatja meg a végpontok közötti modellezés értékét.  Jelentős teljesítmény- és gyorsaságnövekedés,…

Tovább

Nehezen tanulnak kínai szövegeken a mesterségesintelligencia-modellek

A multimodális GPT-4o-val hanggal, szöveggel, videóval interakcióba léphetünk. A modell megjelenése utáni napokban viszont több probléma felmerült az OpenAI csúcstermékével kapcsolatban.  Scarlett Johansson például hangja jóváhagyása nélküli utánzásával vádolta a céget. Aztán kiderült, hogy a…

Tovább

A ChatGPT immáron Reddit-tartalmakhoz is legálisan férhet hozzá

A Reddit közösségimédia-szolgáltató bejelentette, hogy partnerségre lépett a GPT legújabb változatával, a GPT-4o-val május közepén debütált OpenAI-val. A szerződés értelmében a ChatGPT fejlesztővállalata mesterségesintelligencia-modelljeit a Reddit több tízmillió napi felhasználója által posztolt…

Tovább

Mik a legjobb generatív MI-modellek a képzőművészetben és a designban?

A generatív mesterségesintelligencia-eszközök közül a képalkotó modellek az elsők között mozgatták meg a nagyközönség fantáziáját. A technológia és a piac fejlődésével kuriózumból hasznos és hatékony alkalmazásokká váltak. Ma már bejáratott művészeti és designplatformok integrálták a generatív MI-t.…

Tovább

Mennyire pontosan válaszolnak nagy nyelvmodellek professzionális szintű lekérdezésekre?

Sok pénzügyi szakember és jogász dokumentumok feldolgozásától kamatlábak előrejelzéséig, változatos célokra használ nagy nyelvmodell-alkalmazásokat. Ezekben az esetekben azonban kitüntetett fontosságú az output felügyelete, mert a tévedések súlyos következményekkel járhatnak. A mesterséges…

Tovább

Közeledik a robotika „ChatGPT-pillanata”?

A robotika Szent Grálja a diszciplína kezdetei óta a házimunkáinkat elvégző gépek voltak. Hosszú évtizedekig csak álmodozhattunk róluk, mert teljesen más kontrollált laboratóriumi körülmények között, aprólékos tervezés után megvalósítani valamit, mint folyamatosan változó, akadályokkal teli…

Tovább

A YouTube figyelmeztette az OpenAI-t: ne használják videóikat modelljeik gyakoroltatásához

Amikor Mira Muratit, az OpenAI főmérnökét a Wall Street Journal arról faggatta, hogy milyen adatokat használtak a szövegből videót generáló Sora csúcsmodell trenírozásához, a CTO mellébeszélt. „Egy alkotónak elvárásai vannak, ha feltölti kemény munkájának gyümölcsét a platformunkra. Ezek egyike a…

Tovább
süti beállítások módosítása