Az Neumann Társaság blogja a legfejlettebb infokom technológiákról

Jelenből a Jövőbe

Jelenből a Jövőbe

Altatótörténeteket mesél gyerekeknek Alexa, az Amazon intelligens asszisztense

2022. december 13. - ferenck

Komoly nyomás nehezedik az Amazonra, hogy újraélessze, új élettel töltse meg az Echo termékvonalat (a cég intelligens hangszórói). Értékesítésük eleve veszteséges, de a nagyvállalat abban bízott, hogy más áruk vásárlására ösztönöznek. 2022-es eddigi veszteségük viszont tízmilliárd dollár, és következményként, az Alexa szoftver fejlesztőrészlegére is elbocsátások várnak.

Eközben 2022 a szöveget, képet, videót és zenét generáló mesterségesintelligencia-modellek éve, és ebből Alexa sem maradhatott ki. Történetmesélő funkciójában több generatív modellt koherens egésszé kombináltak össze. Az persze más kérdés, hogy milyen eladásokat produkálnak vele.

alexa.jpg

De miről is van szó?

Képzeljük el, hogy nagyon fáradtnak érezzük magunkat, esetleg kifogytunk az ötletekből, és képtelenek vagyunk gyerekünknek lefekvés előtti történetet, mesét mondani.

alexa0.jpg

Itt jön képbe az Amazon az intelligens kijelzőjével, az Echo Show eszközzel, amelyen igény szerinti, személyre szabott sztorik pereghetnek.

Az Alkoss Alexával (Create with Alexa) funkcióval gyerekeknek szóló történetek hozhatók létre, képi illusztrációval, zenével és hangeffektusokkal.

alexa1_1.jpg

A képernyőn a beállításra vonatkozó promptok (utasítások) sora jelenik meg, például „a világűr felfedezése”, vagy „elvarázsolt erdő”, főszereplővel, mondjuk, egy űrhajóssal vagy földönkívülivel, meghatározó színnel, tónussal (vidám, titokzatos stb.).

Választásaink után, írott történeteken gyakoroltatott nyelvi modell öt jelenetre bontott öt-tízsoros szöveget hoz létre. Minden egyes jelenethez jelenetgeneráló modell választja ki egy könyvtárból a megfelelő háttérképet. A könyvtárban ember által alkotott és mesterséges intelligencia által generált képek egyaránt találhatók.

A modell tárgyakat és karaktereket ad hozzá, a szöveghez kapcsolódó arckifejezésekkel és gesztusokkal, például kezével integető, mosolygós arcú kalózt és másokat.

A hanggenerátor az audió-könyvtárban lévő akkordok, harmóniák és ritmusok közül választja ki, és keveri egybe a sztorihoz leginkább passzoló anyagot.

Mindezek után a mesterséges intelligencia álomba ringatja a gyereket.

A bejegyzés trackback címe:

https://jelenbolajovobe.blog.hu/api/trackback/id/tr5817999116
süti beállítások módosítása