Áttörést ért el a Microsoft a beszédfelismerésben
Jelentkezz be a hozzászóláshoz.
#7
Valóban nem elképzelhetetlen, csak kevesen foglalkoznak még vele. Most szórakozom Speech Recognition Macro-sal és állati jó, hasznos. Rövid parancsszavakra programokat indít paraméterezve, vagy hosszú szövegeket másol be, esetleg batch fájlokat futtat.
Sõt visszadumál nekem :D
De ugye ez még angolul van csak, ami nem is baj, mert legalább gyakorlok. De mennyivel élvezetesebb lenne anyanyelven pampogni a géppel, és az értené, reagálna.
Amit sajnálok hogy a SR-nek nem lehet megadni más "figyelõ parancsot" csak a "Start Listening"-re hallgat.
Csak mert nekem olyan kellene hogy "Computer" megadom a parancsot és utána autómatikusan Sleep-bee megy. Azt be tudnám még állítani talán hogy az összes parancs így mûködjön (a sajtájaimat 100%), és akkor nem lenne olyan hogy kiadok egy parancsot, az asztalon pedig éppen úgy koppan a csuklóm hogy azt "beszédnek értse" (gyakran van ilyen) erre valami marhaságot még csinál. Így parancs után azonnal készenlítbe menne és figyelne a "behívó szóra".
Tehát Listen->parancs->standby.
Másik. Win8-ban vajon már benne lesz ez az új technológia?
Sõt visszadumál nekem :D
De ugye ez még angolul van csak, ami nem is baj, mert legalább gyakorlok. De mennyivel élvezetesebb lenne anyanyelven pampogni a géppel, és az értené, reagálna.
Amit sajnálok hogy a SR-nek nem lehet megadni más "figyelõ parancsot" csak a "Start Listening"-re hallgat.
Csak mert nekem olyan kellene hogy "Computer" megadom a parancsot és utána autómatikusan Sleep-bee megy. Azt be tudnám még állítani talán hogy az összes parancs így mûködjön (a sajtájaimat 100%), és akkor nem lenne olyan hogy kiadok egy parancsot, az asztalon pedig éppen úgy koppan a csuklóm hogy azt "beszédnek értse" (gyakran van ilyen) erre valami marhaságot még csinál. Így parancs után azonnal készenlítbe menne és figyelne a "behívó szóra".
Tehát Listen->parancs->standby.
Másik. Win8-ban vajon már benne lesz ez az új technológia?
#5
Ezzel szerintem a berekedt megváltozott hang is felismerhetõ.
A többi általad leírt dolog se tûnik elképzelhetetlennek.
Gratulálok. Az ön álmai valóra válnak. :)
A többi általad leírt dolog se tûnik elképzelhetetlennek.
Gratulálok. Az ön álmai valóra válnak. :)
Ĥ|Ψ>≈iħ∂|Ψ>/∂t (Az ember) \"Tudásra törpe és vakságra nagy.\" \"Ami igazán lényeges, az a szemnek láthatatlan.\" Használj TE is szinkrotronsugárzást!
#4
A maci olvast végig kellene vennie a felhasználónak. Így az eszköz megtanulná a hangját.
#3
Én egy olyan beszédfelismerõre várok aminél ha beállítod hogy most Dél-Kínai piaci akcentussal beszélek, akkor tökéletesen (80-90%-ban) felismerje hogy mit is mondok. Ha magyarra állítom és akkor beszélek hozzá magyarul, azt is érti. Sõt ha mondjuk angolon felejtem és franciául kezdek diktálni akkor megkérdezi hogy "Most ugye nem angolul beszélsz? (Tipp: Francia)".
Nekem igazából egy olyan program kellene amit játékok mellett is lehet használni. Azaz beállítom hogy ha azt mondom "Tölt" akkor tárat cserél, ha azt mondom "Rajta" akkor használja az aktuálisan kijelölt tárgyat....stb. Tehát egy segéderõként, plusz kézként funkcionáljon. Ugyanezt egyéb programban.
Olyan Star Trekes beszédfelismerõ még szerintem sokáig nem lesz. "Komjúter, kérek egy kávét, két cukorral, kevés tejszínnel, közép-langyos hõfokon, herendi csészében és jó sok habbal" aztán csinálja.
Másik probléma meg ha mondjuk be van dugulva az orrom és úgy beszélek hozzá. Vagy torokgyuszival rekedten és már nem érti. Mivel ezeket úgy programozzák hogy alap-normál emberi hangra reagáljon.
Azt meg nem tudom lehetséges e egyáltalán hogy mondjuk éppen lejátszok egy filmet, abban megy a duma, de ha én beszólok hogy "Pillanat Állj" akkor felismeri, megérti és alkalmazza. Viszont ha a filmben kiáltják ezt arra nem reagál. (Bár Zoom mikrofonnal a monitoron az aktuális helyzetemre fókuszálva talán mûködne)
Én a Dragon-t próbálgattam egy idõben, de az se volt tökéletes. Igaz arra jó egy ilyen program hogy angolul megtanuljon beszélni az ember :D
Amúgy nekem eddig a Win7-es alap Speech Recognition jött be leginkább. Az találta el legtöbbször hogy mit beszélek.
Nekem igazából egy olyan program kellene amit játékok mellett is lehet használni. Azaz beállítom hogy ha azt mondom "Tölt" akkor tárat cserél, ha azt mondom "Rajta" akkor használja az aktuálisan kijelölt tárgyat....stb. Tehát egy segéderõként, plusz kézként funkcionáljon. Ugyanezt egyéb programban.
Olyan Star Trekes beszédfelismerõ még szerintem sokáig nem lesz. "Komjúter, kérek egy kávét, két cukorral, kevés tejszínnel, közép-langyos hõfokon, herendi csészében és jó sok habbal" aztán csinálja.
Másik probléma meg ha mondjuk be van dugulva az orrom és úgy beszélek hozzá. Vagy torokgyuszival rekedten és már nem érti. Mivel ezeket úgy programozzák hogy alap-normál emberi hangra reagáljon.
Azt meg nem tudom lehetséges e egyáltalán hogy mondjuk éppen lejátszok egy filmet, abban megy a duma, de ha én beszólok hogy "Pillanat Állj" akkor felismeri, megérti és alkalmazza. Viszont ha a filmben kiáltják ezt arra nem reagál. (Bár Zoom mikrofonnal a monitoron az aktuális helyzetemre fókuszálva talán mûködne)
Én a Dragon-t próbálgattam egy idõben, de az se volt tökéletes. Igaz arra jó egy ilyen program hogy angolul megtanuljon beszélni az ember :D
Amúgy nekem eddig a Win7-es alap Speech Recognition jött be leginkább. Az találta el legtöbbször hogy mit beszélek.
#2
Egy-ket szavas parancsokat betanitani a programoknak mar regota nem problema. A gond akkor kezdodik ha mondjuk diktalni szeretnenk vagy komplex mondatok alapjan kene valamit tennie. En nemregen probalkoztam egy jobbfele diktaloszoftverrel es a nagyszamu hibazasok es csalodottsag miatt hamar elvetettem a szoftveres lehetoseget. Elotte lattam valami filmben, hogy a fazon tok szep folyamatosan diktal, gondoltam utananezek hogy all most a beszedfelismeres. Persze nyilvan nagy reszben en voltam a 'hibas' mivel a szornyu magyar akcentusommal igen megkuzdott a gep es gondolom 10-bol legalabb 6x mashogy ejtettem a mar megtanitott szavakat is. Szoval aki nem beszel szinte tokeletes angolsaggal annak az a 33%-os hibaarany legalabb egybol 50%-rol indul. Igy bizony tenyleg nem egy nagy elmeny diktalgatni. Raadasul a torles, visszatorles, pozicionalo parancsokat sem mindig ismeri fel ha rosszul ejted vagy picit halkabban :).
én anno szerettem ezt a dolgot. már az xp-hez is volt mind beszédfelismerés, mind szintetizátor. tréning után egész jól megértette a parancsokat is, az agentekkel muris kis appleteket lehetett szkriptelni. persze zenénél nem mûxött, meg anno 30% körüli cpu-t evett a 650 mhz-n. ami persze relatív, de a hasznosságához mérten sok volt.