Berta Sándor
Látja és hallja az embereket az intelligens szoba
Az Universitat Politecnica de Catalunya (UPC) kutatói egy olyan intelligens szoba létrehozásán dolgoznak, amely képes azonosítani a benne tartózkodó embereket.
A különleges terem prototípusát a Smart Room program keretében fejlesztették ki és 85 mikrofonnal, valamint nyolc kamerával szerelték fel. A szakemberek célja valódi interakció kialakítása az emberek és a számítógépes rendszerek között. A mikrofonok a számítógép fülei, míg a kamerák a szemei. A Smart Room alapjait 2004-ben, a Computer in the Human Interaction Loop (CHIL) európai uniós projekt keretében határozták meg, és a tudósok azóta az intelligens szoba továbbfejlesztésével foglalkoznak.
"Az audioterületen a legnagyobb hangsúlyt az akusztikus események felismerésére helyezzük. Gyakran előfordul, hogy a beszéd mellett nem figyelünk fel más zörejekre. Pedig az emberek számára ugyanilyen fontos lehet például a lépések hangja, egy ajtónyitódás vagy -záródás, illetve különböző tárgyak lerakásának zaja. A mikrofonok segíthetnek meghatározni, hogy ezek a hangok, illetve például a beszéd milyen irányból jön" - hangsúlyozta Josep Ramón Casas, a kutatók egyike.
Az UPC programjának alapját a CHIL során szerzett tapasztalatok és elért eredmények adják. A mostani továbbfejlesztett rendszer már érti az emberi beszédet és képes arra megfelelő módon reagálni. Az akusztikus modult képfelismerő megoldások egészítik ki, amelyek nemcsak az emberek arcának, hanem gesztusainak felismerésére is alkalmasak. S hogy mire lehet mindez jó? Többek között egy tanár akkor is tudomást szerezhet egy diákja kézfelemeléssel való jelentkezéséről, hogy ha nem látja a mozdulatot.
Casas elmondta, hogy egyes vizsgált ötletek átvihetők és megvalósíthatók a valós életben. Ilyenek lehetnek az utasításokat megértő mikrofonok és a kérdésekre válaszokat közlő képernyők. De ugyanígy a kórházakban vagy az idősek otthonában egy ilyen rendszer időben jelezhet a személyzetnek egy vészhelyzetet. Ezzel pedig életeket lehet megmenteni. A kutatók igyekeztek egy olyan számítógépes rendszert létrehozni, amelynek futtatásához nincsen szükség szuperszámítógépekre és amely akár egy átlagos PC-n is jól használható. A jelenlegi tesztekben tizenkét linuxos PC-t alkalmaznak a videók és további hatot a hangok elemzésére.
"A CHIL-program célja egyébként ennél is több volt. A számítógépeket egy jobb emberek közötti interakcióban akartuk felhasználni. Így például egy értekezletre későn érkező vállalati vezető tudomást szerezhet az addig történtekről anélkül, hogy meg kellene zavarnia, ezáltal pedig szakítania az aktuális, megbeszéléseket" - tette hozzá Joachim Neumann, a projekt korábbi és a Telefónica Research jelenlegi munkatársa.
A különleges terem prototípusát a Smart Room program keretében fejlesztették ki és 85 mikrofonnal, valamint nyolc kamerával szerelték fel. A szakemberek célja valódi interakció kialakítása az emberek és a számítógépes rendszerek között. A mikrofonok a számítógép fülei, míg a kamerák a szemei. A Smart Room alapjait 2004-ben, a Computer in the Human Interaction Loop (CHIL) európai uniós projekt keretében határozták meg, és a tudósok azóta az intelligens szoba továbbfejlesztésével foglalkoznak.
"Az audioterületen a legnagyobb hangsúlyt az akusztikus események felismerésére helyezzük. Gyakran előfordul, hogy a beszéd mellett nem figyelünk fel más zörejekre. Pedig az emberek számára ugyanilyen fontos lehet például a lépések hangja, egy ajtónyitódás vagy -záródás, illetve különböző tárgyak lerakásának zaja. A mikrofonok segíthetnek meghatározni, hogy ezek a hangok, illetve például a beszéd milyen irányból jön" - hangsúlyozta Josep Ramón Casas, a kutatók egyike.
Az UPC programjának alapját a CHIL során szerzett tapasztalatok és elért eredmények adják. A mostani továbbfejlesztett rendszer már érti az emberi beszédet és képes arra megfelelő módon reagálni. Az akusztikus modult képfelismerő megoldások egészítik ki, amelyek nemcsak az emberek arcának, hanem gesztusainak felismerésére is alkalmasak. S hogy mire lehet mindez jó? Többek között egy tanár akkor is tudomást szerezhet egy diákja kézfelemeléssel való jelentkezéséről, hogy ha nem látja a mozdulatot.
Casas elmondta, hogy egyes vizsgált ötletek átvihetők és megvalósíthatók a valós életben. Ilyenek lehetnek az utasításokat megértő mikrofonok és a kérdésekre válaszokat közlő képernyők. De ugyanígy a kórházakban vagy az idősek otthonában egy ilyen rendszer időben jelezhet a személyzetnek egy vészhelyzetet. Ezzel pedig életeket lehet megmenteni. A kutatók igyekeztek egy olyan számítógépes rendszert létrehozni, amelynek futtatásához nincsen szükség szuperszámítógépekre és amely akár egy átlagos PC-n is jól használható. A jelenlegi tesztekben tizenkét linuxos PC-t alkalmaznak a videók és további hatot a hangok elemzésére.
"A CHIL-program célja egyébként ennél is több volt. A számítógépeket egy jobb emberek közötti interakcióban akartuk felhasználni. Így például egy értekezletre későn érkező vállalati vezető tudomást szerezhet az addig történtekről anélkül, hogy meg kellene zavarnia, ezáltal pedig szakítania az aktuális, megbeszéléseket" - tette hozzá Joachim Neumann, a projekt korábbi és a Telefónica Research jelenlegi munkatársa.