Napi Online

Kezdenek beérni a beszéd­felis­merési kutatások

Hamarosan eljöhet az olyan call centerek ideje, ahol nem dolgoznak emberek, mert a hangfelismerő, -értelmező és utasításokat végrehajtó szoftverek mindent megoldanak, ráadásul a jelenlegi költségek tizedéért.

Egyetlen év alatt megduplázódott és mintegy egymilliárd dolláros piaccá terebélyesedett a hangfelismerő technológiák piaca az Egyesült Államokban - írja a Business 2.0 amerikai szaklap. Az egyre modernizálódó hangfelismerő rendszerek fejlettségének bemutatására a Nuance Communications felkérte a 17 éves Ben Cookot, az SMS-írás Guinness-bajnokát, hogy egy közel 160 karakteres, latin szavakkal teletűzdelt, piranhákról szóló szöveg beírásában versenyezzen legújabb szoftverükkel. A Nuance szoftver 16 másodperc alatt hibátlanul teljesítette a feladatot, míg Cooknak több mint háromszor ennyi időre volt szüksége a szöveg telefonjába írásához.

A Nuance Mobile Dictation szoftverét idén júliusig piacra dobják a tengerentúlon, de a call centereknek besegítő szerveralapú technológiák is szép jövő elé néznek: az Opus Research tanulmánya szerint a tavalyi 600 millió dolláros szegmens piaci forgalma 2009-re megdup­lázódik.

Egy másik, a Datamonitor által készített felmérés szerint a mobiltelefonokba és dashboardokba kerülő ilyen jellegű rendszerek forgalma 2010-ig megnégyszereződik és 500 millió dollárt ér el, elsősorban az autókba kerülő navigációs és zenelejátszó rendszerek fejlődésének köszön­hetően. Előbb-utóbb minden, ember által használt eszközbe és kütyübe beépítenek valamiféle hangfelismerőt - mutat rá a tanulmány.

A Microsoft Vistában lévő rendszerrel állítólag nagyon elégedettek a felhasználók, és a Google is bejelentette, hogy kutatásokat folytat a pusztán beszéd alapján történő netes keresés megvalósítási lehetőségeiről. A mai rendszerek már arra is képesek, hogy önmagukat tanítsák. A kaliforniai TellMe Networks call centereknek és telekomcégeknek árult szoftvere például évi 10 milliárd szót és kifejezést dolgoz fel és elemez, és napról napra tökéletesíti saját rendszerét.

A Datamonitor nem csak ebben látja a fő ütőkártyát: a megújuló technológiák kiválthatják a hagyományos, az ügyfeleket idegesítő gombnyomogatós technológiát, és a jelenlegi, átlagosan öt dollárba kerülő élőerős költséget a tizedére, ötven centre csökkenthetik. Az E-Trade Financial online-brókercég napi ötvenezer megkeresést kezel Tellme rendszerével, kétszer annyit, mint korábban alkalmazottaival.

A TuVox sajátos marketingmódszert vetett be új ügyfelek szerzésére: felvették, hogy milyen lépésekkel és gombnyomogatásokkal lehet eljutni például egy bank számlázási rendszerében a célhoz, valamint a hangfelismerős technikát, amikor az ügyfél hangja alapján a szoftver intézi a teendőket. A két audiofile-t elküldték call centert használó szolgáltatóknak (bankok, biztosítók, telekomcégek), így a TuVox egy év alatt megnégyszerezte ügyfelei számát.

A bombaüzlet azonban még hátravan: az Opus felmérése szerint a mobiltelefon-használók olyan szolgáltatásokért, amelynek segítségével például a készülékbe mondott szöveg automatikusan e-mailként jelenik meg vagy egy étterem helyének kikeresését hang alapján elvégzi a készülék, hajlandók akár havi 5-15 dolláros opcionális díjat is fizetni. A Promptu még idén bevezeti ilyen jellegű szolgáltatását az Egyesült Államokban a mobiltelefon-szolgáltatók számára.

A Vocera Communications a gyógyászat területén kaszál. Speciális kitűzője a vezeték nélküli és hangfelismerő technikát kombinálja: a kórházi dolgozó bemondja kérdését a kitűzőbe, mire a gép kikeresi a megfelelő szakembert a kórház címlistájából vagy beolvassa a páciens betegkartonját. A VoxTec zsebnaptár méretű szerkezete kizárólag hangbemondás alapján 41 nyelven képes visszamondani egy adott kifejezést. Jelenleg az Irakban és Afganisztánban szolgáló amerikai csapatok használják arab és pastu nyelvek fordítására.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)