SG.hu·

Beszédszoftver robotoknak és számítógépeknek

Az Astromobile európai uniós projekt célja egy olyan robot megalkotása, amely megérti a kapott parancsokat, felszolgálja az ebédet és még egy beszélgetésre is fogékony. Az ehhez szükséges kommunikációs programot a simon listens egyesület fejlesztette ki.

A szoftvert stílusosan Simonnak nevezték el. "Simon nem más, mint egy egér- és billentyűalternatíva. Eredetileg meg akartuk könnyíteni a fogyatékossággal rendelkező gyerekek számítógép-használatát. Az alkalmazással e-maileket diktálhatnak, szörfölhetnek az interneten vagy akár a Skype segítségével telefonálhatnak is" - tért ki az előzményekre Franz Stieger, a simon listens vezetője és projektfelelőse. A szakember hozzátette: a legnagyobb problémát a magas hibaarány jelenti, ráadásul nem mindegy az sem, hogy egy program hány szót ismer.

Az orvosi felhasználás, például egy diagnózis elkészítéséhez elég, ha az adatbázis 1000 szót tartalmaz. A Simon esetében nem ez volt a fő szempont, hiszen az idén júliusban indított Assistive SmarT RObotic platform for indoor environments: MOBILity and interaction (Astromobile) projektben a hangsúlyt a robotok önálló navigációs képességére és az emberekkel való intelligens kapcsolattartására helyezték. Utóbbi pedig elsősorban a verbális kommunikáción alapul.

Az Astromobile keretében kifejlesztett robotokat segítségre szorulók és nyugdíjasok házi ápolóiként alkalmaznák. A célok között szerepel, hogy az egységek alkalmasak legyenek ellenőrzési-felügyeleti feladatok végrehajtására és rendelkezzenek memóriafunkcióval, amelyben eltárolható, hogy az adott személynek mikor kell beszednie a gyógyszereit, kit és mikor kell felhívnia stb. Míg az olasz Scuola Superiore Sant'Anna Egyetem feladata a robot önálló mozgásának kutatása, a simon listens a beszédfelismeréssel foglalkozik. A távlati cél annak elérése, hogy a robotokkal a jövőben akár beszélgetni is lehessen. Stieger ugyanakkor elismerte, egyelőre kérdéses, hogy a Simon erre alkalmas lesz-e.


Maga a szoftver két részből áll: a Simon nevű kliensből, amely végrehajtja a kapott parancsokat és a Simond nevű szerverből. A kliens-szerver architektúrának köszönhetően a program elvileg okostelefononon át is használható és így a robot akár egy mobilról is irányítható lesz. A kutató kijelentette: Simonnak világosan meghatározott felhasználási területe van. Az alapvető feladat a kommunikációs és információs igények kielégítése. A parancsokat azonban főleg számok helyettesítik. Az alkalmazás jelenleg már együtt tud működni a különböző levelezőszoftverekkel, a Media Portal nevű nyílt forráskódú multimédiás programmal, a Skype VoIP-szolgáltatással és a Firefoxszal, ezen belül is a Mouseless Browsing kiegészítővel. Minden további alkalmazáshoz külön modult kell készíteni.

A Mouseless Browsing használatakor minden honlap hivatkozása egy külön számot kap, a szöveges adatok bevitelét egy virtuális billentyűzet könnyíti meg. A számvezérlés az Asztalon is alkalmazható, ekkor a felületet kilenc részre osztja fel a Simon és mindegyik részre rá lehet nagyítani, valamint további kilenc részt foglal magában. A megoldás előnye, hogy gyakorlatilag minden elterjedt nyelvvel használható, de akár egy saját nyelvi modell is készíthető hozzá. Az interfész úgy is kialakítható, hogy akár köhögéssel vagy nevetéssel is irányítható legyen. A program három beszédmodellt tartalmaz. Az első a statisztikai, amelyben a legalapvetőbb parancsok végrehajtására képes, míg a második már tanítható, a harmadik pedig az első kettő ötvözete, kiegészítve a beszédfogyatékossággal rendelkezők számára kialakított tanítómóddal.

A Simon további előnye, hogy akár a fényviszonyok, a fűtés és az ablakok vezérlésére is használható, hiszen a meglévő rendszerekkel ötvözhető és így akár nyugdíjas vagy szociális otthonokban is beválhat a személyzet tehermentesítésére. De a szakembereknek még nagyon sokat kell dolgozniuk, amíg ezt a szintet elérik. Stieger szerint minden egyes enber szavait többször is rögzítik, hogy így növeljék a szoftver felismerési arányát. A tapasztalatok azt mutatták, hogy egy szót legalább ötször kell elmondania a kísérletben részt vevőnek ahhoz, hogy a szoftver jó eredményt érjen el. A munka rendkívül időigényes, egy órányi felvétel feldolgozása akár 3-4 hetet is igénybe vehet.

Ha figyelembe vesszük, hogy mennyi munka van az alkalmazásban és később mekkora lehetőségek nyílnak majd meg a használók előtt, akkor szinte hihetetlennek tűnik, hogy a Simon szabadon elérhető mindenki számára, lévén nyílt forráskódú program. A szoftver egyaránt használható Windows XP és Windows Vista operációs rendszereken, különböző Linux disztribúciókon, valamint már készül a Windows 7-kompatibilis változata. Az alkalmazás gyakorlatilag a jelenleg kapható számítógépek és notebookok 90 százalékán futtatható, ugyanakkor még közel sem tökéletes.

Kapcsolódó cikkek és linkek

Hozzászólások

Jelentkezz be a hozzászóláshoz.

© Kara kán2010. 09. 27.. 14:27||#19
Persze, hogy nem beszéltél hülyeséget.
Minden téren zakatol a vonat, hála istennek mûködik az evolúció. Én csak a kacskaringókat szeretném elkerülni.
© B0nFire2010. 09. 27.. 04:37||#18
Természetesen én is ismerem az angol "ragozást". De igen ritka. Vannak hosszú toldalékos szavaik, azonban jobb szeretik élõ beszédben megkerülni ezeket. Egy példa: conscious ~ öntudat; unconscious ~ öntudatlan; unconsciousness ~ öntudatlanság. Viszont ha egy mód van rá, ezt kifejezhetik így is: without conscious. Ebben az esetben már két rag nélküli szóról van szó, az egyik az elöljáró, ami meghatározza az utána következõ viszonyát. Öntudat nélkül = öntudatlanság.

És ezek is általában sokkal kevésbé rendhagyóak, mint a mi ragozott szavaink. Amit linkeltél az hatalmas munka lehetett. De a cikk is megjegyzi a végén, hogy a 266 ragozott szóalaknak csupán a negyedét öleli fel. Ezek szerint nem is beszéltem akkora marhaságot lejjebb, amikor hasraütve azt mondtam, hogy egy szónak minimum 30 féle ragozott alakja van. Mint látható, igencsak alábecsültem az édes anyanyelvünket.

Azért az angolt beprogramozni egy "társalkodórobotba" mégiscsak könnyebb valamivel. Ez volt a kiindulópontom.
© Kara kán2010. 09. 26.. 18:31||#17
© Kara kán2010. 09. 26.. 15:25||#16
Amit írsz, nagyjából helytálló, de arról megfeledkezel, hogy folyamatos a fejlesztés ezen a téren is.
Az angol is ragoz amúgy, csak nem olyan bonyolultan, mint a magyar. Ennek ellenére van már magyar szótõkeresõ és magyar ragozó program is.
© B0nFire2010. 09. 26.. 02:55||#15
Ahhoz képest, hogy szerinted baromságot írtam, úgy látszik nagyvonalakban egyetértesz vele. A Word példád ott vérzik el, hogy ha "kapa" helyett "papát", a "most" helyett "mos"-t írsz, a helyesírás ellenõrzõ modul lazán átsiklik fölötte, hiszen a szó helyes, a mondatot meg nem értelmezi. Még ha néha hajlamos is úgy tenni, mintha értené.

Azért egy hangyányival könnyebb azt a nyelvet megtanítani egy robotnak, ahol gyakorlatilag nem ragoznak semmit. Van néhány száz rendhagyó ige, amit bepötyögnek. A hangzókövetésre valóban vannak szabályok, de ott is ott van a rengeteg kivétel, ahogy említettem. És az csak egy része a nyelvnek. Mi van a szótõ-kereséssel? A "megszámlálhatatlan" szóból kitalálja, hogy a fõ szó benne a "számol"? Miért nem "számlál"? Merthogy mi nem csak egyszerûen ragozzuk a szót, de a ragokat halmozzuk, és ahogy egyre több ragot ragasztunk hozzá, úgy változik az elõtte lévõ rag hangalakja is. Plusz az igekötõk és a jelzõk. A "vödör" szót tárgyesetbe úgy teszi, hogy "vödört", mert van rá szabály, a "motor" szót pedig úgy, hogy "motrot", mert arra is van szabály. Az egyik miért így van, és a másik miért úgy? Úgy teszel, mintha nem ismernéd a saját anyanyelvedet!

Ha hiszed, ha nem, ismerem az Ankit. Használtam kábé egy fél évig és meguntam. Vannak jobb módszerek is, ha már nyelvet tanul az ember, de ez személye válogatja, kinek mi jön be. De mindentõl függetlenül hogy jön az Anki a cikkhez és a társalkodó robothoz? Azokról a problémákról amelyeket lentebb vázoltam, azokról mi a véleményed? Szerinted van értelme? A cikket kéne kommentálni, nem az én kommentemet, fõleg, ha szerinted baromság és újra baromság.

Nem muszáj válaszolni. Minden további válaszodat egyszerû flémelésnek veszem és ignorálom.
© okosan gyerekek2010. 09. 25.. 12:09||#14
Nem kevés baromságot hordtál össze barátom. Azt leszámítva, hogy egy a nyelvészetben használt szakszót bedobtál, a T9-es összefüggésed elég meredek. Úgy áll a dolog, hogy jelenleg a T9-ben szimplán van egy txt fájl, tele szavakkal, amik egymáshoz képest prioritást élvezhetnek a tulajdonos (nem felhasználó) és az elõreprogramozottságának megfelelõen. Ez mûködik az angolnál, az nem olyan, mint a magyar, vagy a legszélsõségesebb példa az eszkimó. Emiatt ugye már csak egy többesszámú alak is új szót képez, és egy hatákony T9 bázis simán rúghat 200.000-re is. Ami miatt már mûködésképtelen lenne ez a rendszer.
Viszont annyival a dolog fölé lehetne emelkedni, hogy meghatároznák a szavak szófaját, ami pedig elõre vetítené helybõl a lehetséges ragok tárházát. A képzõk esetében pedig azt, hogy a képzõ nyomán milyen szófajúvá válik egy adott szó, majd annak megfelelõen megint csak bizonyos ragok, toldalékok kerülhetnek a szó után. Nálunk még van annyi csavar - akárcsak az olaszban - vannak a nyelv zenéjét javító hangzó követések, amiket szintén lehetne programozni, hiszen egész pontos szabályunk van például a mély-, a magas- és a vegyeshangrendû szavaink toldalékolására, ragozására. Valószínûleg hasonló elven mûködik a Microsoft Word, a T9 sajnos nem. Az összes létezõ magyar szó, meg lassítaná az alkalmazás adatbázis keresését, úgy meg nem lehetne vele rendes tempóval írni.

Aztán az is egy baromság, amit leírtál az alapfokról, minthogy az csak egy közhiedelem. Én úgy kezdtem el olaszul tanulni, hogy abszolút a nulláról elindultam, és minden megtanult szót egy flash card alapelven mûködõ programba vezettem fel, az Ankiba. Jelenleg a szókincsem 1100 szóra terjed ki. Egy A2-es második szintû alapfokú nyelvvizsgát nem tudtam akadálymentesen venni, ha az alapfok alatt nem a közmegegyezésen alapuló jelentését érted, akkor rendben van, ha igen, akkor távol vagy a valóságtól. Ahhoz legalább 2000 szó kell. középfokhoz kell olyan 6000, a közhiedelmi 1500-hoz képest. Ugyanis a Rigót leszámítva már egyetlen nyelvvizsga központba sem lehet szótárat vinni.
© Szefmester2010. 09. 24.. 16:17||#13
hát ecsém.. tippre ezért kapsz eg yfincsi kis warn-t :)
© eaposztrof2010. 09. 24.. 15:56||#12
természetesen millió ilyen léteik, a windows 7 alapértelmezettje már többet tud mint ez, és tökéletesen mûködik a szerencsétlen magyar-angollal is, de nem ez a lényeg!

az tény h a cikk fogyatékossága, mivel nem hangsúlyozza eléggé, de a lényeget nem értitek: nyílt forráskódú program.

ha nem tudod h ez mit jelent: http://www.fsf.hu/index.php/
© Kisgaji19932010. 09. 24.. 15:04||#11
Szeretnél pénzt keresni, de nem szeretsz állásinterjúkra járni? Szeretnél szabad lenni, de szükséged van egy jó és stabil jövedelemre? Szeretnél otthon maradni úgy, hogy ez ne jelentsen jövedelem kiesést? Tanulsz vagy kismama vagy és jól jönne egy kis pénz? Akkor neked erre a munkára van szükséged. Nincs szükséged semmi kezdeti tõkére. Napi 3-4 óra munkával hetente kereshetsz 75-1000$-t, ha több szabadidõd van, akár többet is. Mire van szükséged? Internet elérésre, számítógépre, minimális számítógépes ismeretre…, a többi már csak azon múlik, mennyire gondolod komolyan. Nem MLM! Bõvebb információért küldj egy e-mailt a következõ címre: [email protected]! Tárgy: Pénzkeresés a neten 1.
© MsUser2010. 09. 24.. 09:08||#10
Szóval kb. 10.-év betanítási idõ, és szimulált élethelyzettel már gyerekszintre lehet programozni a beszélni képes intelligens robotot.
A hardver egy pár exabájt adatot kezelni képes PC.-vel és pár új 64magos CPU-val szerelt vezérléssel már mûködni is fog, na meg jó pár algoritmussal ami képes szimulálni és értelmezni az emberi hangulatokat.
Mondjuk 500 szó a ragozásaival "500 az 5-en" és nyelvtani buktatóival, egy "gyerek szinten" intelligens robotért, HAJRÁ megéri!
Hogy reggel érdeklõdjön az egészségünk iránt. <#taps>
Beszélni már tud, jöhet a járni, mozogni, és valami csoda folytán nem 6 ajtós szekrény méretûre zsugorítás, hogy ki is nézzen valahogy, ebbõl már MARS telepeseket lehet kilõni az ûrbe.