Spencer
Audiovizuális beszédfelismerési technológia az Inteltől
Az Intel kiadott egy új, szájról olvasásra is képes kommunikációs szoftvert, mely szakértők szerint újabb mérföldkövet jelenthet a tökéletes beszédfelismerési megoldások fejlesztésében.
Az AVSR (Audio Visual Speech Recognition) nevezetű audiovizuális beszédfelismerő program nemcsak az emberi hangot figyeli, hanem folyamatosan figyelemmel kíséri az emberi arcot és a mozgó szájat, ily módon pedig minden korábbinál hatékonyabb beszédfelismerést valósít meg.
Az Intel munkatársai elmondták, hogy az AVSR úgy van kialakítva, hogy még a legzajosabb környezetekben is tökéletesen használható legyen, valamint utaltak arra, hogy az AVSR szerves részét képezi az OpenCV projektnek. Utóbbi projekt keretein belül olyan nyílt forrású szoftvereket fejlesztenek ki, melyek a számítógépekkel történő vizuális kommunikálást segítik elő.
Az információs technológiai cégek az elmúlt években számtalan kisebb-nagyobb beszédfelismerési projektet indítottak, azonban ezen projektek egyrészt a szoftverek viszonylag kis tudásának, másrészt pedig a rendelkezésre álló hardverek korántsem kielégítő teljesítményének következtében általában nem túl nagy sikert arattak. A számítógépes rendszerek számítási teljesítménye azonban rohamosan növekszik, hiszen manapság már az átlagos személyi számítógépekben is 1,5 GHz körüli processzorok teljesítenek szolgálatot, a csúcskategóriás PC-kben található processzorok frekvenciája pedig ennek akár a duplája is lehet. A hardver tehát manapság már adva van, és az Intelnek köszönhetően most már a szoftveroldalon sincsenek hiányosságok.
A világ legnagyobb chipgyártójaként nyilvántartott Intel az AVSR szoftverben alkalmazott vizuális technológiákat egyébként nemcsak a beszédfelismerésben kívánja alkalmazni, hanem számos egyéb más területen is. Az Intel fejlesztői úgy gondolják, hogy ezen technológiák a közeljövőben fontos szerephez juthatnak az egészségügyi intézményekben éppúgy, mint a bevásárlóközpontok parkolóiban, ugyanis ezen megoldások révén sokkal könnyebbé válhat a betegek folyamatos megfigyelése, vagy éppen az autótolvajok lefülelése, még pedig nagyrészt automatizált módon.
Az AVSR (Audio Visual Speech Recognition) nevezetű audiovizuális beszédfelismerő program nemcsak az emberi hangot figyeli, hanem folyamatosan figyelemmel kíséri az emberi arcot és a mozgó szájat, ily módon pedig minden korábbinál hatékonyabb beszédfelismerést valósít meg.
Az Intel munkatársai elmondták, hogy az AVSR úgy van kialakítva, hogy még a legzajosabb környezetekben is tökéletesen használható legyen, valamint utaltak arra, hogy az AVSR szerves részét képezi az OpenCV projektnek. Utóbbi projekt keretein belül olyan nyílt forrású szoftvereket fejlesztenek ki, melyek a számítógépekkel történő vizuális kommunikálást segítik elő.
Az információs technológiai cégek az elmúlt években számtalan kisebb-nagyobb beszédfelismerési projektet indítottak, azonban ezen projektek egyrészt a szoftverek viszonylag kis tudásának, másrészt pedig a rendelkezésre álló hardverek korántsem kielégítő teljesítményének következtében általában nem túl nagy sikert arattak. A számítógépes rendszerek számítási teljesítménye azonban rohamosan növekszik, hiszen manapság már az átlagos személyi számítógépekben is 1,5 GHz körüli processzorok teljesítenek szolgálatot, a csúcskategóriás PC-kben található processzorok frekvenciája pedig ennek akár a duplája is lehet. A hardver tehát manapság már adva van, és az Intelnek köszönhetően most már a szoftveroldalon sincsenek hiányosságok.
A világ legnagyobb chipgyártójaként nyilvántartott Intel az AVSR szoftverben alkalmazott vizuális technológiákat egyébként nemcsak a beszédfelismerésben kívánja alkalmazni, hanem számos egyéb más területen is. Az Intel fejlesztői úgy gondolják, hogy ezen technológiák a közeljövőben fontos szerephez juthatnak az egészségügyi intézményekben éppúgy, mint a bevásárlóközpontok parkolóiban, ugyanis ezen megoldások révén sokkal könnyebbé válhat a betegek folyamatos megfigyelése, vagy éppen az autótolvajok lefülelése, még pedig nagyrészt automatizált módon.