• KillerBee
    #10
    Világos, csak az már nem automatizálható, emberórák kellenek hozzá. Plusz gyakorság-elemzés sem árt, különben jönnek az olyan felismerési hibák, mint pl. a comer-corner, amellyel sok angol szövegben találkoztam már. Az r és az n majdnem összeolvadása miatt igen gyakori, hogy a corner helyett comer kerül a szövegbe, mert kétség esetén az OCR a szótárban előrébb álló szót alkalmazta, holott a comer önálló szóként olyan ritka, mint a fehér holló - ellentétben a cornerrel.