Franczy

Új beszédfelismerési technológiák az Inteltől

Az Intel munkatársai arról számoltak be, hogy a cég kutatói immár több éve folytatnak olyan kutatásokat, melyeknek a minden korábbinál jobb minőségű beszédfelismerési technológiák kifejlesztése a céljuk, és amely kutatások mostanság kezdenek révbe érni.

Ennek köszönhetően az Intel ígéretei szerint hamarosan mind az x86-os, mind az XScale platformon be fog mutatkozni egy rendkívül fejlett, széles szolgáltatási körrel rendelkező új beszédfelismerési szoftverplatform. Az Intel vadonatúj szoftver technológiája a keresztségben a DSR (Distributed Speech-Recognition) nevet kapta, és tudni lehet róla, hogy elsősorban az Intel kínai részlegeiben folyik a fejlesztése. A DSR kezdetekben az angol, valamint a kínai (kiemelten a mandarin nyelvjárású) nyelveket fogja támogatni.

A világ elsőszámú chipgyártójaként nyilvántartott Intel végső célja nem más, mint egy olyan beszédfelismerő technológia kifejlesztése, melynek köszönhetően valós időben (real-time) működő fordítógépek lesznek készíthetők. A chipgyártó munkatársai az üggyel kapcsolatban elmondták, hogy ezen cél elérése csak magának a szoftverplatformnak a fejlesztésével lehetetlen, vagyis a végső cél elérésének érdekében komoly hardveres fejlesztéseket is végre kell majd hajtani. Az Intel szakemberei szerint a valós időben működő, beszédfelismerési technológiákon alapuló, és több nyelvet is ismerő fordítógépek működéséhez olyan számítógépeket kell majd használni, melyekben 10 GHz-es, vagy még ennél is magasabb frekvenciájú processzorok kapnak helyet.

Az Intel a minden korábbinál jobb minőségű beszédfelismerési technológiák kapcsán több vadonatúj megoldást is be kíván vetni. Az egyik ilyen megoldás lényege, hogy a beszédfelismeréshez nem egy, hanem több, megfelelően elhelyezett mikrofont kell használni, ugyanis ily módon akár jelentős mértékben is növelhető a beszédfelismerés hatékonysága. Egy másik ilyen megoldás, az audiovizuális feldolgozás lényege, hogy a számítógép, illetve a szoftver nem egyszerűen csak az emberi hangot dolgozza fel, hanem egy kamera segítségével megpróbál szájról is olvasni. Az Intel egyik munkatársa elmondta, hogy a jelenlegi beszédfelismerési technológiák 90-95 százalékos hatékonysága még nem kielégítő, ráadásul ezen hatékonyság is csak teljesen zajmentes környezetekben érhető el.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
Nem érkezett még hozzászólás. Legyél Te az első!