Berta Sándor

Beszédsebesség-rekordot értek el egy agy-számítógép interfésszel

Egy ALS-beteg minden eddiginél gyorsabban tud kommunikálni az agyi implantátumával.

Nyolc éve már, hogy egy amiotrófiás laterálszklerózisban (ALS) szenvedő páciens elvesztette a beszédképességét. Az ALS miatt csak hangokat tud kiadni, a szavai érthetetlenné váltak. A kommunikációhoz eddig egy írótáblára vagy egy iPadre volt szüksége. A helyzet megváltozott, miután az Amerikai Egyesült Államokban élő nő önként jelentkezett egy új típusú agy-számítógép interfész (BCI) kifejlesztésére. Most már olyan rövid mondatokat is tud közölni, mint "A házam nem az enyém" vagy "Csak nehéz", ráadásul a szavakat a normál beszédhez közeli tempóban képes kiejteni. Ez az eredménye annak a tanulmánynak, amelyet a Stanford Egyetem egy csapata nemrég hozott nyilvánosságra. Bár az anyagot még nem bírálták el, de a tudósok azt állítják, hogy a csak "T12"-ként emlegetett tesztalanyuk korábbi rekordokat döntött meg a beültetett interfésszel. A tanulmány szerint az implantátum 62 szó/perc sebességű kommunikációt tesz lehetővé, ami háromszor gyorsabb a korábbi legjobbnál.

Philip Sabes, a San Franciscó-i Kaliforniai Egyetem (UCSF) kutatója "nagy áttörésnek" nevezte a tanulmányt és úgy vélte, hogy az ilyen kísérleti eljárások hamarosan elhagyják a laboratóriumokat és szerinte elképzelhető a kereskedelmi forgalomba hozatal. A szakember mindezt azzal egészítette ki, hogy az előadás olyan szintű, amilyet sok, már beszélni nem tudó érintett szeretne. A beszédhiba nélküli emberek általában körülbelül 160 szót beszélnek percenként és még a billentyűzetek, a mobiltelefonok gyorsgépelése, az emodzsik és a rövidítések korában is a közvetlen beszéd marad a személyközi kommunikáció leggyorsabb formája.

A tanulmány nagy érdeklődést váltott ki a Twitteren és más közösségi médiumokban - többek között azért is, mert az egyik vezető szerző, Krishna Shenoy az előzetes publikáció megjelenésének napján hasnyálmirigyrákban elhunyt. Shenoy karrierje egy részét az agyi interfészeken keresztüli kommunikáció sebességének javításának szentelte és maga is gyűjtötte az aktuális rekordokat a világhálón. 2019-ben egy másik alany, akivel Shenoy dolgozott, percenként 18 szót tudott "begépelni" az agyi interfészen keresztül, ami akkor rekordnak számított.

Az agy-számítógép interfészek, amelyekkel Shenoy csapata dolgozik, egy kis, hegyes elektródákból álló, az adott személy agyi motoros kérgébe, a főleg a mozgásban részt vevő régióba ágyazott párnából állnak. A rendszer lehetővé teszi a kutatók számára, hogy egyszerre több tucat neuron aktivitását rögzítsék és olyan mintákat találjanak, amelyek tükrözik, hogy milyen mozgásokra gondol valaki, még akkor is, ha az illető lebénult. Ezek apró, finom mozdulatok. Sabes kiemelte, hogy a stanfordi csapat egyik legfontosabb felfedezése, hogy mindössze néhány idegsejt elegendő információt szolgáltat ahhoz, hogy egy számítógépes program jó pontossággal megjósolja milyen szavakat próbál mondani a beteg. Shenoy csapata ezt követően ezeket az információkat egy számítógép képernyőjére vitte át, amiket egy számítógépes hang felolvas.


A tudós és társai a San Franciscó-i Kaliforniai Egyetemen dolgozó Edward Chang korábbi munkájára támaszkodnak, aki szerint a beszéd az ember által végezhető legösszetettebb mozgássorozat. A szavakat a szájjal, az ajkakkal és a nyelvvel képezzük, a levegővel és a rezgéssel dolgozva. Chang korábban csak az agyra helyezett elektródákat használt arra, hogy az alany egy számítógépen keresztül beszéljen, de a Stanford munkatársai azt állítják, hogy a rendszerük pontosabb és háromszor-négyszer gyorsabb. "Az eredményeink arra utalnak, hogy a bénulásban szenvedő emberek számára lehetővé válik a normális sebességű kommunikáció" - írták a szakemberek, akik között ott volt a néhai Shenoy és Jaimie Henderson idegsebész is.

David Moses, aki Chang csapatával dolgozik együtt az UCSF-en, azt nyilatkozta, hogy a munka "lenyűgöző új teljesítményértékeket" ért el. De még ha több rekord is dől meg, Moses szerint "egyre fontosabbá válik, hogy több éven keresztül stabil és megbízható teljesítményt mutassunk". Az adatok minősége idővel romlik, például azért, mert az agyban hegesedés alakulhat ki. Azt, hogy a szabályozó hatóságok engedélyezik-e az ilyen implantátum kereskedelmi célú használatát, egyelőre nem lehet tudni.

A jövő útja valószínűleg kifinomultabb implantátumokat és a mesterséges intelligenciával való szorosabb integrációt is eredményez majd. A jelenlegi rendszer már alkalmazza a gépi tanulás bizonyos típusait. A pontosság javítása érdekében a stanfordi csapat olyan szoftvert használt, amely megjósolta, hogy egy mondatban általában melyik szó következett. Így például az angol nyelvben az "I" után gyakrabban következik az "am", mint a "ham", annak ellenére, hogy ezek a szavak hasonlóan hangzanak, és hasonló mintákat hozhatnak létre az emberi agyban. A szóelőrejelző rendszer hozzáadásával az alany gyorsabban és kevesebb hibával tudott beszélni.

Az újabb nagy nyelvi modellek, mint például a GPT-3, már képesek teljes esszék írására és kérdések megválaszolására. Amennyiben ezeket a modelleket agyi interfészekhez kapcsolják, az emberek még gyorsabban beszélhetnek, mert a rendszer a részinformációk alapján jobban ki tudja találni, hogy mit akarnak mondani. "A nagy beszédmodellek sikere az elmúlt években arra enged következtetni, hogy egy ilyen beszédprotézis elérhető közelségben van, mert a beszéd felolvasásához talán már nincs szükség ilyen lenyűgözően jó bemeneti adatokra" - taglalta Sabes.

Bár a szkeptikusok még mindig megkérdőjelezik, hogy a több neuron egyidejű mérése számít-e, de az új tanulmány azt sugallja, hogy igen - különösen, ha olyan összetett dolgok kiolvasásáról van szó, mint a beszéd az agyban. A stanfordi tudósok megállapították, hogy minél több neuront tudtak egyszerre kiolvasni, annál kevesebb hibát vétettek a "T12" alany megértésében. "Ez egy fontos eredmény, mert azt sugallja, hogy az olyan cégek, mint a Neuralink erőfeszítései, amelyek 1000 elektródát helyeznek el az agyban, akkor is eredményesek lesznek, ha a feladat kiterjedt" - szögezte le Sabes, aki korábban maga is a Neuralink vezető tudósaként dolgozott.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
Nem érkezett még hozzászólás. Legyél Te az első!