Berta Sándor

Beszédszoftver robotoknak és számítógépeknek

Az Astromobile európai uniós projekt célja egy olyan robot megalkotása, amely megérti a kapott parancsokat, felszolgálja az ebédet és még egy beszélgetésre is fogékony. Az ehhez szükséges kommunikációs programot a simon listens egyesület fejlesztette ki.

A szoftvert stílusosan Simonnak nevezték el. "Simon nem más, mint egy egér- és billentyűalternatíva. Eredetileg meg akartuk könnyíteni a fogyatékossággal rendelkező gyerekek számítógép-használatát. Az alkalmazással e-maileket diktálhatnak, szörfölhetnek az interneten vagy akár a Skype segítségével telefonálhatnak is" - tért ki az előzményekre Franz Stieger, a simon listens vezetője és projektfelelőse. A szakember hozzátette: a legnagyobb problémát a magas hibaarány jelenti, ráadásul nem mindegy az sem, hogy egy program hány szót ismer.

Az orvosi felhasználás, például egy diagnózis elkészítéséhez elég, ha az adatbázis 1000 szót tartalmaz. A Simon esetében nem ez volt a fő szempont, hiszen az idén júliusban indított Assistive SmarT RObotic platform for indoor environments: MOBILity and interaction (Astromobile) projektben a hangsúlyt a robotok önálló navigációs képességére és az emberekkel való intelligens kapcsolattartására helyezték. Utóbbi pedig elsősorban a verbális kommunikáción alapul.

Az Astromobile keretében kifejlesztett robotokat segítségre szorulók és nyugdíjasok házi ápolóiként alkalmaznák. A célok között szerepel, hogy az egységek alkalmasak legyenek ellenőrzési-felügyeleti feladatok végrehajtására és rendelkezzenek memóriafunkcióval, amelyben eltárolható, hogy az adott személynek mikor kell beszednie a gyógyszereit, kit és mikor kell felhívnia stb. Míg az olasz Scuola Superiore Sant'Anna Egyetem feladata a robot önálló mozgásának kutatása, a simon listens a beszédfelismeréssel foglalkozik. A távlati cél annak elérése, hogy a robotokkal a jövőben akár beszélgetni is lehessen. Stieger ugyanakkor elismerte, egyelőre kérdéses, hogy a Simon erre alkalmas lesz-e.


Maga a szoftver két részből áll: a Simon nevű kliensből, amely végrehajtja a kapott parancsokat és a Simond nevű szerverből. A kliens-szerver architektúrának köszönhetően a program elvileg okostelefononon át is használható és így a robot akár egy mobilról is irányítható lesz. A kutató kijelentette: Simonnak világosan meghatározott felhasználási területe van. Az alapvető feladat a kommunikációs és információs igények kielégítése. A parancsokat azonban főleg számok helyettesítik. Az alkalmazás jelenleg már együtt tud működni a különböző levelezőszoftverekkel, a Media Portal nevű nyílt forráskódú multimédiás programmal, a Skype VoIP-szolgáltatással és a Firefoxszal, ezen belül is a Mouseless Browsing kiegészítővel. Minden további alkalmazáshoz külön modult kell készíteni.

A Mouseless Browsing használatakor minden honlap hivatkozása egy külön számot kap, a szöveges adatok bevitelét egy virtuális billentyűzet könnyíti meg. A számvezérlés az Asztalon is alkalmazható, ekkor a felületet kilenc részre osztja fel a Simon és mindegyik részre rá lehet nagyítani, valamint további kilenc részt foglal magában. A megoldás előnye, hogy gyakorlatilag minden elterjedt nyelvvel használható, de akár egy saját nyelvi modell is készíthető hozzá. Az interfész úgy is kialakítható, hogy akár köhögéssel vagy nevetéssel is irányítható legyen. A program három beszédmodellt tartalmaz. Az első a statisztikai, amelyben a legalapvetőbb parancsok végrehajtására képes, míg a második már tanítható, a harmadik pedig az első kettő ötvözete, kiegészítve a beszédfogyatékossággal rendelkezők számára kialakított tanítómóddal.

A Simon további előnye, hogy akár a fényviszonyok, a fűtés és az ablakok vezérlésére is használható, hiszen a meglévő rendszerekkel ötvözhető és így akár nyugdíjas vagy szociális otthonokban is beválhat a személyzet tehermentesítésére. De a szakembereknek még nagyon sokat kell dolgozniuk, amíg ezt a szintet elérik. Stieger szerint minden egyes enber szavait többször is rögzítik, hogy így növeljék a szoftver felismerési arányát. A tapasztalatok azt mutatták, hogy egy szót legalább ötször kell elmondania a kísérletben részt vevőnek ahhoz, hogy a szoftver jó eredményt érjen el. A munka rendkívül időigényes, egy órányi felvétel feldolgozása akár 3-4 hetet is igénybe vehet.

Ha figyelembe vesszük, hogy mennyi munka van az alkalmazásban és később mekkora lehetőségek nyílnak majd meg a használók előtt, akkor szinte hihetetlennek tűnik, hogy a Simon szabadon elérhető mindenki számára, lévén nyílt forráskódú program. A szoftver egyaránt használható Windows XP és Windows Vista operációs rendszereken, különböző Linux disztribúciókon, valamint már készül a Windows 7-kompatibilis változata. Az alkalmazás gyakorlatilag a jelenleg kapható számítógépek és notebookok 90 százalékán futtatható, ugyanakkor még közel sem tökéletes.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Kara kán #19
    Persze, hogy nem beszéltél hülyeséget.
    Minden téren zakatol a vonat, hála istennek működik az evolúció. Én csak a kacskaringókat szeretném elkerülni.
  • B0nFire #18
    Természetesen én is ismerem az angol "ragozást". De igen ritka. Vannak hosszú toldalékos szavaik, azonban jobb szeretik élő beszédben megkerülni ezeket. Egy példa: conscious ~ öntudat; unconscious ~ öntudatlan; unconsciousness ~ öntudatlanság. Viszont ha egy mód van rá, ezt kifejezhetik így is: without conscious. Ebben az esetben már két rag nélküli szóról van szó, az egyik az elöljáró, ami meghatározza az utána következő viszonyát. Öntudat nélkül = öntudatlanság.

    És ezek is általában sokkal kevésbé rendhagyóak, mint a mi ragozott szavaink. Amit linkeltél az hatalmas munka lehetett. De a cikk is megjegyzi a végén, hogy a 266 ragozott szóalaknak csupán a negyedét öleli fel. Ezek szerint nem is beszéltem akkora marhaságot lejjebb, amikor hasraütve azt mondtam, hogy egy szónak minimum 30 féle ragozott alakja van. Mint látható, igencsak alábecsültem az édes anyanyelvünket.

    Azért az angolt beprogramozni egy "társalkodórobotba" mégiscsak könnyebb valamivel. Ez volt a kiindulópontom.
  • Kara kán #17
    Alapvetően: Többre vagy képes, mint gondolnád.
  • Kara kán #16
    Amit írsz, nagyjából helytálló, de arról megfeledkezel, hogy folyamatos a fejlesztés ezen a téren is.
    Az angol is ragoz amúgy, csak nem olyan bonyolultan, mint a magyar. Ennek ellenére van már magyar szótőkereső és magyar ragozó program is.
  • B0nFire #15
    Ahhoz képest, hogy szerinted baromságot írtam, úgy látszik nagyvonalakban egyetértesz vele. A Word példád ott vérzik el, hogy ha "kapa" helyett "papát", a "most" helyett "mos"-t írsz, a helyesírás ellenőrző modul lazán átsiklik fölötte, hiszen a szó helyes, a mondatot meg nem értelmezi. Még ha néha hajlamos is úgy tenni, mintha értené.

    Azért egy hangyányival könnyebb azt a nyelvet megtanítani egy robotnak, ahol gyakorlatilag nem ragoznak semmit. Van néhány száz rendhagyó ige, amit bepötyögnek. A hangzókövetésre valóban vannak szabályok, de ott is ott van a rengeteg kivétel, ahogy említettem. És az csak egy része a nyelvnek. Mi van a szótő-kereséssel? A "megszámlálhatatlan" szóból kitalálja, hogy a fő szó benne a "számol"? Miért nem "számlál"? Merthogy mi nem csak egyszerűen ragozzuk a szót, de a ragokat halmozzuk, és ahogy egyre több ragot ragasztunk hozzá, úgy változik az előtte lévő rag hangalakja is. Plusz az igekötők és a jelzők. A "vödör" szót tárgyesetbe úgy teszi, hogy "vödört", mert van rá szabály, a "motor" szót pedig úgy, hogy "motrot", mert arra is van szabály. Az egyik miért így van, és a másik miért úgy? Úgy teszel, mintha nem ismernéd a saját anyanyelvedet!

    Ha hiszed, ha nem, ismerem az Ankit. Használtam kábé egy fél évig és meguntam. Vannak jobb módszerek is, ha már nyelvet tanul az ember, de ez személye válogatja, kinek mi jön be. De mindentől függetlenül hogy jön az Anki a cikkhez és a társalkodó robothoz? Azokról a problémákról amelyeket lentebb vázoltam, azokról mi a véleményed? Szerinted van értelme? A cikket kéne kommentálni, nem az én kommentemet, főleg, ha szerinted baromság és újra baromság.

    Nem muszáj válaszolni. Minden további válaszodat egyszerű flémelésnek veszem és ignorálom.
  • okosan gyerekek #14
    Nem kevés baromságot hordtál össze barátom. Azt leszámítva, hogy egy a nyelvészetben használt szakszót bedobtál, a T9-es összefüggésed elég meredek. Úgy áll a dolog, hogy jelenleg a T9-ben szimplán van egy txt fájl, tele szavakkal, amik egymáshoz képest prioritást élvezhetnek a tulajdonos (nem felhasználó) és az előreprogramozottságának megfelelően. Ez működik az angolnál, az nem olyan, mint a magyar, vagy a legszélsőségesebb példa az eszkimó. Emiatt ugye már csak egy többesszámú alak is új szót képez, és egy hatákony T9 bázis simán rúghat 200.000-re is. Ami miatt már működésképtelen lenne ez a rendszer.
    Viszont annyival a dolog fölé lehetne emelkedni, hogy meghatároznák a szavak szófaját, ami pedig előre vetítené helyből a lehetséges ragok tárházát. A képzők esetében pedig azt, hogy a képző nyomán milyen szófajúvá válik egy adott szó, majd annak megfelelően megint csak bizonyos ragok, toldalékok kerülhetnek a szó után. Nálunk még van annyi csavar - akárcsak az olaszban - vannak a nyelv zenéjét javító hangzó követések, amiket szintén lehetne programozni, hiszen egész pontos szabályunk van például a mély-, a magas- és a vegyeshangrendű szavaink toldalékolására, ragozására. Valószínűleg hasonló elven működik a Microsoft Word, a T9 sajnos nem. Az összes létező magyar szó, meg lassítaná az alkalmazás adatbázis keresését, úgy meg nem lehetne vele rendes tempóval írni.

    Aztán az is egy baromság, amit leírtál az alapfokról, minthogy az csak egy közhiedelem. Én úgy kezdtem el olaszul tanulni, hogy abszolút a nulláról elindultam, és minden megtanult szót egy flash card alapelven működő programba vezettem fel, az Ankiba. Jelenleg a szókincsem 1100 szóra terjed ki. Egy A2-es második szintű alapfokú nyelvvizsgát nem tudtam akadálymentesen venni, ha az alapfok alatt nem a közmegegyezésen alapuló jelentését érted, akkor rendben van, ha igen, akkor távol vagy a valóságtól. Ahhoz legalább 2000 szó kell. középfokhoz kell olyan 6000, a közhiedelmi 1500-hoz képest. Ugyanis a Rigót leszámítva már egyetlen nyelvvizsga központba sem lehet szótárat vinni.
  • Szefmester #13
    hát ecsém.. tippre ezért kapsz eg yfincsi kis warn-t :)
  • eaposztrof #12
    természetesen millió ilyen léteik, a windows 7 alapértelmezettje már többet tud mint ez, és tökéletesen működik a szerencsétlen magyar-angollal is, de nem ez a lényeg!

    az tény h a cikk fogyatékossága, mivel nem hangsúlyozza eléggé, de a lényeget nem értitek: nyílt forráskódú program.

    ha nem tudod h ez mit jelent: http://www.fsf.hu/index.php/
  • Kisgaji1993 #11
    Szeretnél pénzt keresni, de nem szeretsz állásinterjúkra járni? Szeretnél szabad lenni, de szükséged van egy jó és stabil jövedelemre? Szeretnél otthon maradni úgy, hogy ez ne jelentsen jövedelem kiesést? Tanulsz vagy kismama vagy és jól jönne egy kis pénz? Akkor neked erre a munkára van szükséged. Nincs szükséged semmi kezdeti tőkére. Napi 3-4 óra munkával hetente kereshetsz 75-1000$-t, ha több szabadidőd van, akár többet is. Mire van szükséged? Internet elérésre, számítógépre, minimális számítógépes ismeretre…, a többi már csak azon múlik, mennyire gondolod komolyan. Nem MLM! Bővebb információért küldj egy e-mailt a következő címre: [email protected]! Tárgy: Pénzkeresés a neten 1.
  • MsUser #10
    Szóval kb. 10.-év betanítási idő, és szimulált élethelyzettel már gyerekszintre lehet programozni a beszélni képes intelligens robotot.
    A hardver egy pár exabájt adatot kezelni képes PC.-vel és pár új 64magos CPU-val szerelt vezérléssel már működni is fog, na meg jó pár algoritmussal ami képes szimulálni és értelmezni az emberi hangulatokat.
    Mondjuk 500 szó a ragozásaival "500 az 5-en" és nyelvtani buktatóival, egy "gyerek szinten" intelligens robotért, HAJRÁ megéri!
    Hogy reggel érdeklődjön az egészségünk iránt.
    Beszélni már tud, jöhet a járni, mozogni, és valami csoda folytán nem 6 ajtós szekrény méretűre zsugorítás, hogy ki is nézzen valahogy, ebből már MARS telepeseket lehet kilőni az űrbe.