Hunter
Tökéletesedik a hang-hang fordítógép
Elkészült egy kezdetleges, de működő kétirányú hangfelismerő fordító rendszer, ami angol és perzsa nyelv között tolmácsol.
A készüléket az egyetem orvosi karán tesztelik az orvosok és pácienseik közötti kommunikációra. Azért esett a perzsára a választás, mert az egyetemen számos iráni hallgató tanul, valamint Los Angelesben is szép számmal akadnak olyanok, akiknek ez az anyanyelvük. A Transonics névre keresztelt eszközt Shrinkanth Narayanan professzor vezetésével fejlesztették ki. A professzor szerint a folyékony kétirányú hangfordítás egyike a műszaki tudományok szent gráljainak, és kiemelte, hogy a tökéletességtől még ők is évekre vannak.
Narayanan a hibákat kicsinyítve ironikusan megjegyezte, hogy a Transonics nem csupán a számítástechnikára, hanem az emberek azon képességére is támaszkodik, hogy a félkész találmányokat is tudja használni. "A kétirányú fordítás legalább három igen hiányos diszciplínát foglal magába, melyek akár hatványozhatják is egymás hibáit" - magyarázta Narayanan.
Az első ilyen a szöveges fordítás, melyre ugyan már egész jó programok vannak, de a legjobbak is gyakran vétenek nyelvtani és egyéb hibákat. A következő a beszéd felismerés, ahol a szavak nagy száma mellett belépnek a képbe a különböző akcentusok, tájszólások, valamint egy esetleges zajos környezet, ami még nehezebbé teszi ezt a folyamatot. Végül pedig azt sem lehet figyelmen kívül hagyni, hogy az emberek nem csupán szavakkal, hanglejtésekkel is beszélnek. Ilyen például amikor egy kérdésnél felemeljük a hangszínünket a mondat végén, de ide sorolhatók a beszéd közbeni "ő, izé, á", a felkiáltások, ami az emberek számára könnyen megfejthetők vagy figyelmen kívül hagyhatók, a gépeket azonban jelentősen lelassítják. Pontosan ezért esett a választás az orvos-beteg párbeszédekre, mivel ezek természetükből adódóan jól strukturáltak, lényegre törők.
Amennyiben a gép teljesen félrefordítana, a felhasználó a saját vagy a partnere által mondott mondat több lehetséges értelmezését szövegesen is megtekintheti, hogy az alapján válassza ki a megfelelőt.
Maga a Transonics rendszer egy linuxos laptopon fut. Mind az orvos, mind a páciens egy-egy mikrofonos ellátott fülhallgatót visel. A számítógéphez egy külön kis billentyűzetet csatlakoztattak, ami felgyorsítja és leegyszerűsíti a különböző utasításokat, mint például a két nyelv közötti váltogatást. Az adatbázis körülbelül 23 000 angol és 9000 perzsa szót tartalmaz, de folyamatosan bővül, és más nyelvek integrálásán is dolgoznak. A kutatók reményei szerint a betegellátásban akár már két éven belül megjelenhet a Transonics egy fejlettebb változata.
Bemutató videó (mérete 35 MB, formátuma .mov)
A készüléket az egyetem orvosi karán tesztelik az orvosok és pácienseik közötti kommunikációra. Azért esett a perzsára a választás, mert az egyetemen számos iráni hallgató tanul, valamint Los Angelesben is szép számmal akadnak olyanok, akiknek ez az anyanyelvük. A Transonics névre keresztelt eszközt Shrinkanth Narayanan professzor vezetésével fejlesztették ki. A professzor szerint a folyékony kétirányú hangfordítás egyike a műszaki tudományok szent gráljainak, és kiemelte, hogy a tökéletességtől még ők is évekre vannak.
Narayanan a hibákat kicsinyítve ironikusan megjegyezte, hogy a Transonics nem csupán a számítástechnikára, hanem az emberek azon képességére is támaszkodik, hogy a félkész találmányokat is tudja használni. "A kétirányú fordítás legalább három igen hiányos diszciplínát foglal magába, melyek akár hatványozhatják is egymás hibáit" - magyarázta Narayanan.
Az első ilyen a szöveges fordítás, melyre ugyan már egész jó programok vannak, de a legjobbak is gyakran vétenek nyelvtani és egyéb hibákat. A következő a beszéd felismerés, ahol a szavak nagy száma mellett belépnek a képbe a különböző akcentusok, tájszólások, valamint egy esetleges zajos környezet, ami még nehezebbé teszi ezt a folyamatot. Végül pedig azt sem lehet figyelmen kívül hagyni, hogy az emberek nem csupán szavakkal, hanglejtésekkel is beszélnek. Ilyen például amikor egy kérdésnél felemeljük a hangszínünket a mondat végén, de ide sorolhatók a beszéd közbeni "ő, izé, á", a felkiáltások, ami az emberek számára könnyen megfejthetők vagy figyelmen kívül hagyhatók, a gépeket azonban jelentősen lelassítják. Pontosan ezért esett a választás az orvos-beteg párbeszédekre, mivel ezek természetükből adódóan jól strukturáltak, lényegre törők.
Amennyiben a gép teljesen félrefordítana, a felhasználó a saját vagy a partnere által mondott mondat több lehetséges értelmezését szövegesen is megtekintheti, hogy az alapján válassza ki a megfelelőt.
Maga a Transonics rendszer egy linuxos laptopon fut. Mind az orvos, mind a páciens egy-egy mikrofonos ellátott fülhallgatót visel. A számítógéphez egy külön kis billentyűzetet csatlakoztattak, ami felgyorsítja és leegyszerűsíti a különböző utasításokat, mint például a két nyelv közötti váltogatást. Az adatbázis körülbelül 23 000 angol és 9000 perzsa szót tartalmaz, de folyamatosan bővül, és más nyelvek integrálásán is dolgoznak. A kutatók reményei szerint a betegellátásban akár már két éven belül megjelenhet a Transonics egy fejlettebb változata.
Bemutató videó (mérete 35 MB, formátuma .mov)