• kukacos
    #8
    A gépi felolvasás összehasonlíthatatlanul könnyebb probléma, mint a felismerés, nem összekeverendő. Felolvasó programok (olyanok, amilyenek) még a ZX Spectrumomra is voltak, ma már valódi, emberit megközelítő intonációra képes szoftverek vannak, magyarul is.

    Én úgy tudom, jó - emberi szintet elérő - beszédfelismerő program mai napig nem létezik semmilyen nyelven. A legnagyobb gond, hogy a számítógépnek nincs semmilyen tudása a kontextusról, tehát ha a beszélgetés mondjuk az ebédről szól, akkor nem fogja kitalálni, hogy a nehezen érthető ...ábas szót inkább "lábas"-nak és nem mondjuk "hátas"-nak kell értenie. Egy ember a beszédértés során folyamatosan használja az ilyen jellegű tudását. A másik nagyon nagy gond, hogy a kimondott hangok gyakran nagyon távol állnak attól, amit a szó könyvtári alakjából várnánk, ráadásul ez is változik a szövegkörnyezettől függően.

    Persze vannak szép eredmények, de a ma létező legjobb megoldások is olyan erőművet igényelnek tárhelyben és számítási kapacitásban, amely aligha fér bele egy mobilba (sokszor a mai asztali gépek sem elegendők). Kíváncsi lennék, mit is tud valójában ez a megoldás, marketingduma nélkül...