Nyílt formátumra vált a Google Books
Jelentkezz be a hozzászóláshoz.
http://magyarorszag21.blog.hu/2009/04/16/p1069869 \"Terrorists may attack the open society, but only governments can abolish it.\" (The Pirate Party)
Az, hogy volt szöveg dögivel, elhiszem, de nem olyan, amit én írtam.
Egyébként, ha van egy csomó szöveged, arra rá lehet ereszteni a helyesírásellenõrzõt, és kiválogatni az összes olyan szót, amelyet a gép nem ismer fel, majd esetleg azt, ami emberi ellenõrzés szerint mégis jó, vissza lehet dobni.
Kara kánként folytatom tanításom.
Nem hinném, hogy a tiédet használják, egy ilyen program elkészítése pár perces munka bármely adatbázis-kezelõben, szövegek pedig dögivel rendelkezésre állnak. Nagyobb gond az elírások és a helyesírási hibák kiszûrése, nehogy hibás szavak, szóalakok is belekerüljenek az adatbázisba.
http://magyarorszag21.blog.hu/2009/04/16/p1069869 \"Terrorists may attack the open society, but only governments can abolish it.\" (The Pirate Party)
A FineReadernek eleinte nem volt magyar nyelvû szótára, de lehetõséget biztosított, hogy a felhasználó saját szótárat hozzon létre, és azt hozzárendelje az adott nyelvhez. Én évekkel ezelõtt készítettem egy kis progit, amely nagy szövegállományokból szóadatbázist nyert ki (gyakorlatilag adatbázist készített a szövegben szereplõ szavakról, majd kidobálta a többszörös elõfordulásokat).
Még az is lehet, hogy most azt a szótárt használja a FR, mert én a rendszerem nyitottá tettem a részükre (automatikus visszajelzések stb.)
Kara kánként folytatom tanításom.
Nem mindegy, milyen felbontásban szkennel az ember. Én elõször azt hittem, jobb lesz a 600 dpi, de aztán kiderült, hogy sokkal többet hibázik, mint ha ugyanazt 300 dpi-vel szkennelem be.
http://magyarorszag21.blog.hu/2009/04/16/p1069869 \"Terrorists may attack the open society, but only governments can abolish it.\" (The Pirate Party)
Én egy korábbi hsz-emben írtam, hogy a FineReadernek is. Nos, ebben nem vagyok biztos, de nekem van a FineReader alá telepített saját szótár, így ismeri a magyar szavakat is.
Kara kánként folytatom tanításom.
Az én környezetemben már alig olvas valaki (a fajsúlyosabb könyveket ne is hozzuk szóba). Bár erre mindig azt a választ szoktam kapni, hogy mindegy mit olvasunk, csak olvassunk. Tényleg mindegy, hogy Danielle Steel vagy Lawrence Durrell?
Ha jól emlékszem több felmérés szerint az olvasás jelentõsen visszaszorult más szabadidõs tevékenységekhez képest, és nem hiszem, hogy még ilyen fejlett technológiai segítséggel is újra az élre törhetne.
It\'s a definitive role-playing experience, and the only reason it can\'t be called the best game in its class is because in a sense there\'s nothing available that compares to it. /Baldur\'s Gate 2/
"fotókat készítenek minden egyes oldalról, ezt követõen pedig egy speciális eljárással kinyerik a szöveget"
Azt a "speciális eljárást" OCR-nek (optical character recognition) hívják. Ez még messze nem elég a hibátlan szöveghez, mert az OCR-program is hibázik, csak emberi felügyelet (korrektor) mellett célszerû használni. A végén egy proofreading sem árt.
"Az e-olvasó készülékek terjedésével ez még igaz is lehet."
Nélkülük is igaz már régóta.
http://magyarorszag21.blog.hu/2009/04/16/p1069869 \"Terrorists may attack the open society, but only governments can abolish it.\" (The Pirate Party)