Buddhistický robot interaguje s gesty a generuje hudbu s umělou inteligencí

Sociálního robota se vzhledem bódhisattvy – osvícené bytosti, která podle buddhistické perspektivy zůstává ve fenomenálním světě, aby pomáhala druhým lidem – vyvinuli vědci z Federální univerzity v Lavras (UFLA), v Minas Gerais, Ontario Tech University, v Kanadě, a Hongik University, v Jižní Koreji. Pomocí 3D tisku založeného na digitálním skenování ve vysokém rozlišení objekt reprodukuje v životní velikosti buddhistickou sochu z počátku 7. století našeho letopočtu, považovaná za „národní poklad“. z Koreje. A je schopen interakce s uživatelem prostřednictvím jemných pohybů hlavy, trupu a paží, rozpoznávání gest a řeči.

„Navíc na základě příkazů dokáže systém produkovat hudbu kompatibilní s meditativním stavem uživatele. Hudbu generuje umělá inteligence založená na buddhistických kánonech,“ říká André de Lima Salgado, profesor na katedře informatiky UFLA a koordinátor brazilského týmu.

Práce byla publikována ve sborníku 2025 IEEE International Conference on Collaborative Advances in Software and Computing (Cascon), která se konala v kanadském Torontu.

Model byl vyvinut jako důkaz koncepce pro novou generaci kulturně situovaných systémů interakce člověk-robot. „Ústředním cílem bylo ukázat, jak velké jazykové modely v kombinaci s multimodální umělou inteligencí a modulární architekturou mohou podporovat sociálně smysluplné interakce mezi lidmi a stroji v kulturním a duchovním prostředí,“ říká Salgado.

Myšlenka robotů schopných sociální interakce byla zkoumána přibližně 15 let. Ale jen málo studií zkoumalo robotické systémy záměrně navržené tak, aby převzaly symbolické charakteristiky v mysticko-filosofických nebo náboženských kontextech. Tato zařízení se liší tím, že se nesnaží napodobovat lidi, ale představují duchovní postavy, obsahují ikonografické prvky, oblečení a sekvence rituálního chování – což vyžaduje .

„V reakci na poptávku Korejců jsme se snažili s maximální přesností reprodukovat tvar sochy označeného jako ‚National Treasure nº 83‘. Model byl rozdělen do konstrukčních modulů, které umožňovaly rychlou montáž a instalaci vnitřních komponent. Motory řízené mikrokontroléry umožňují pohyb objektu,“ říká Salgado.

Robot je vysoký 93 centimetrů a zůstává sedět, stejně jako původní socha. Důležitým detailem je jeho schopnost rozpoznávat symbolická gesta (mudrā) lidí, kteří s ním komunikují. V tomto ohledu museli být badatelé obzvláště opatrní, protože mudry mají v hinduistických a buddhistických tradicích velmi specifické a přesné tvary. Malá obměna může zprostředkovat úplně jiný obsah. Rozpoznání známého gesta, jako je abhaya mudrā (vyrobené se zdviženou a plochou rukou, jako symbol nebojácnosti, ochrany a požehnání), bylo úspěšné v 75 % případů.

„Systém byl strukturován podle paradigmatu smysl – myslet – jednat [perceber-pensar-agir]. V tomto modelu je každé chování implementováno jako nezávislý uzel, schopný přijímat data, zpracovávat je a generovat akce. Tento decentralizovaný přístup umožňuje modulům delegovat úkoly na sebe prostřednictvím komunikačního protokolu, čímž se zvyšuje škálovatelnost a robustnost systému,“ říká Salgado. Výzkumníci zjistili, že centralizované architektury bývají křehké a obtížně se rozšiřují, zatímco sítě autonomních modulů umožňují komplexnější a přizpůsobivější chování.

Robot používá odlehčený model strojového jazyka, který se provádí lokálně prostřednictvím notebooku připojeného k systému. Namísto přístupu k externím serverům probíhá veškeré zpracování offline, po předchozím školení na infrastruktuře s vyšší kapacitou. „Začali jsme s malým modelem a specializovali jsme ho na datový soubor, který nám pomohli vytvořit lidé v Koreji,“ vysvětluje výzkumník.

Další novinkou bylo použití modelu CLIP [rede neural multimodal que aprende a associar imagens a textos, permitindo reconhecê-las, classificá-las ou descrevê-las] přizpůsobené obrázkům s prvky buddhistické ikonografie – chrámy, symbolická zvířata atd. „Výsledky ukázaly vysoký výkon ve vizuální identifikaci kulturně relevantních symbolů, dosahující přesnosti 85,64 % pro architekturu a 85,06 % pro zvířata spojená s náboženským kontextem,“ uvádí Salgado.

Přestože byl projekt navržen tak, aby obohatil zkušenosti návštěvníků korejských muzeí, vědci si představují aplikace technologie v jiných oblastech. Budoucí linie zahrnuje sociální roboty schopné pomáhat farmářům, skupinu, ve které studie naznačují vysokou úroveň stresu a sociální izolace.

Prototyp naznačuje, že sociální robotika, umělá inteligence a kulturní dědictví se mohou sblížit a vytvořit novou kategorii rozhraní – systémy schopné nejen plnit úkoly, ale také symbolicky interagovat s lidmi. Další fáze projektu předpokládá dlouhodobé studie v reálných prostředích k měření důvěry, zapojení a psychologického dopadu na uživatele.

Studie získala podporu od FAPESP prostřednictvím tematického projektu „Od semene k šálku: internet věcí v řetězci produkce kvalitní kávy“, na který je Salgado jako přidružený výzkumník napojen.

source