Sg.hu - Audiovizuális beszédfelismerési technológia az Inteltől

2003. április 30. 10:25, szerda

Spencer

Audiovizuális beszédfelismerési technológia az Inteltől

Az Intel kiadott egy új, szájról olvasásra is képes kommunikációs szoftvert, mely szakértők szerint újabb mérföldkövet jelenthet a tökéletes beszédfelismerési megoldások fejlesztésében.

Az AVSR (Audio Visual Speech Recognition) nevezetű audiovizuális beszédfelismerő program nemcsak az emberi hangot figyeli, hanem folyamatosan figyelemmel kíséri az emberi arcot és a mozgó szájat, ily módon pedig minden korábbinál hatékonyabb beszédfelismerést valósít meg.

Az Intel munkatársai elmondták, hogy az AVSR úgy van kialakítva, hogy még a legzajosabb környezetekben is tökéletesen használható legyen, valamint utaltak arra, hogy az AVSR szerves részét képezi az OpenCV projektnek. Utóbbi projekt keretein belül olyan nyílt forrású szoftvereket fejlesztenek ki, melyek a számítógépekkel történő vizuális kommunikálást segítik elő.

Az információs technológiai cégek az elmúlt években számtalan kisebb-nagyobb beszédfelismerési projektet indítottak, azonban ezen projektek egyrészt a szoftverek viszonylag kis tudásának, másrészt pedig a rendelkezésre álló hardverek korántsem kielégítő teljesítményének következtében általában nem túl nagy sikert arattak. A számítógépes rendszerek számítási teljesítménye azonban rohamosan növekszik, hiszen manapság már az átlagos személyi számítógépekben is 1,5 GHz körüli processzorok teljesítenek szolgálatot, a csúcskategóriás PC-kben található processzorok frekvenciája pedig ennek akár a duplája is lehet. A hardver tehát manapság már adva van, és az Intelnek köszönhetően most már a szoftveroldalon sincsenek hiányosságok.

A világ legnagyobb chipgyártójaként nyilvántartott Intel az AVSR szoftverben alkalmazott vizuális technológiákat egyébként nemcsak a beszédfelismerésben kívánja alkalmazni, hanem számos egyéb más területen is. Az Intel fejlesztői úgy gondolják, hogy ezen technológiák a közeljövőben fontos szerephez juthatnak az egészségügyi intézményekben éppúgy, mint a bevásárlóközpontok parkolóiban, ugyanis ezen megoldások révén sokkal könnyebbé válhat a betegek folyamatos megfigyelése, vagy éppen az autótolvajok lefülelése, még pedig nagyrészt automatizált módon.

Informatika és tudomány

Audiovizuális beszédfelismerési technológia az Inteltől

Hozzászólások

Bejelentkezés