Berta Sándor
Felderíthetik a környezetüket az okosotthon-eszközök
A készülékek a zajok elemzésével segíthetnek nagyon sokat.
Az Apple és a Carnegie Mellon Egyetem kutatói egy olyan technikát fejlesztettek ki, amelynek a segítségével az okosotthonokban lévő termékek felismerhetik a különböző zörejeket és azok kiértékelésével feltérképezhetik az adott környezetet.
A szakemberek hangsúlyozták, hogy az olyan hálózatba kötött eszközöknek, mint például az okoshangszóróknak eddig csak minimális mértékben volt tudomásuk arról, hogy mi történik a közvetlen környezetükben. Ahhoz, hogy ezek a készülékek valóban hasznos asszisztensekké váljanak, a hardvereiknek a körülöttük zajló dolgokkal kapcsolatban számos információra van szükségük. Ezeket pedig a legegyszerűbb módon egy audioelemzéssel lehet összegyűjteni, mivel a legtöbb termékbe be vannak építve a tevékenységhez szükséges mikrofonok.
Az okoshangszoró idővel megtanulja, hogy melyik hang származik a mikrosütőtől, és melyik egy emberi utasítás
Azoknak a rendszereknek az esetében, amelyeket a tulajdonosaik manuálisan képeznek, vagyis minden összegyűjtött zajt kategóriákba sorolnak, nagyon magas felismerési arányok érhetők el. Azonban ez a módszer meglehetősen hosszadalmas és kényelmetlen a felhasználók számára. Éppen ezért az arany középutat a manuális és az automatikus zörejfelismerés ötvözése jelentheti. E folyamat részeként a rendszer időnként megkérdezheti, hogy az adott zajokat, például a mikrohullámú sütő vagy a vízcsap hangját kategorizálja-e vagy sem.
A kutatók a munkájuk során egy hangszóróval összekötött Raspberry Pi 3 miniatűr számítógépet használtak, amelyet négy mikrofonnal egészítettek ki és a kielemezendő audiofájlokat WLAN-kapcsolaton keresztül küldték tovább a szerverként szolgáló Mac Prónak. A kifejlesztett megoldás a különböző környezetekben - iroda, konyha, fürdő- és lakószoba - 87 százalékos felismerési arányt ért el.
A technikát hosszú távon nem csupán az okoshangszórókba integrálhatják, hanem akár az okosórákba is, hogy megtanulja kiismerni a felhasználók szokásait. Az egyelőre kérdéses, hogy az Apple termékei esetében sor kerülhet-e majd integrációra, ennek hátterében pedig adatvédelmi okok szerepelnek, hiszen az iPhone vagy a HomePod készülékek nem "hallgatózhatnak" folyamatosan. Az ideális az lenne, ha a rögzített felvételeket az eszközökön lehetne tárolni, ahhoz viszont megfelelő processzorteljesítmény kellene. Megoldást jelenthetne, ha a számítási feladatok egy részét a felhőkörnyezetben lehetne elvégezni, illetve, ha olyan technikákat alkalmaznának, amelyek felismerhetetlenné teszik a felvételeket.
Az Apple és a Carnegie Mellon Egyetem kutatói egy olyan technikát fejlesztettek ki, amelynek a segítségével az okosotthonokban lévő termékek felismerhetik a különböző zörejeket és azok kiértékelésével feltérképezhetik az adott környezetet.
A szakemberek hangsúlyozták, hogy az olyan hálózatba kötött eszközöknek, mint például az okoshangszóróknak eddig csak minimális mértékben volt tudomásuk arról, hogy mi történik a közvetlen környezetükben. Ahhoz, hogy ezek a készülékek valóban hasznos asszisztensekké váljanak, a hardvereiknek a körülöttük zajló dolgokkal kapcsolatban számos információra van szükségük. Ezeket pedig a legegyszerűbb módon egy audioelemzéssel lehet összegyűjteni, mivel a legtöbb termékbe be vannak építve a tevékenységhez szükséges mikrofonok.
Az okoshangszoró idővel megtanulja, hogy melyik hang származik a mikrosütőtől, és melyik egy emberi utasítás
Azoknak a rendszereknek az esetében, amelyeket a tulajdonosaik manuálisan képeznek, vagyis minden összegyűjtött zajt kategóriákba sorolnak, nagyon magas felismerési arányok érhetők el. Azonban ez a módszer meglehetősen hosszadalmas és kényelmetlen a felhasználók számára. Éppen ezért az arany középutat a manuális és az automatikus zörejfelismerés ötvözése jelentheti. E folyamat részeként a rendszer időnként megkérdezheti, hogy az adott zajokat, például a mikrohullámú sütő vagy a vízcsap hangját kategorizálja-e vagy sem.
A kutatók a munkájuk során egy hangszóróval összekötött Raspberry Pi 3 miniatűr számítógépet használtak, amelyet négy mikrofonnal egészítettek ki és a kielemezendő audiofájlokat WLAN-kapcsolaton keresztül küldték tovább a szerverként szolgáló Mac Prónak. A kifejlesztett megoldás a különböző környezetekben - iroda, konyha, fürdő- és lakószoba - 87 százalékos felismerési arányt ért el.
A technikát hosszú távon nem csupán az okoshangszórókba integrálhatják, hanem akár az okosórákba is, hogy megtanulja kiismerni a felhasználók szokásait. Az egyelőre kérdéses, hogy az Apple termékei esetében sor kerülhet-e majd integrációra, ennek hátterében pedig adatvédelmi okok szerepelnek, hiszen az iPhone vagy a HomePod készülékek nem "hallgatózhatnak" folyamatosan. Az ideális az lenne, ha a rögzített felvételeket az eszközökön lehetne tárolni, ahhoz viszont megfelelő processzorteljesítmény kellene. Megoldást jelenthetne, ha a számítási feladatok egy részét a felhőkörnyezetben lehetne elvégezni, illetve, ha olyan technikákat alkalmaznának, amelyek felismerhetetlenné teszik a felvételeket.