Berta Sándor

Beszédhibák esetén segít a Google

Egy új fejlesztéssel a nehézen beszélők szövege érthetővé válik.

A Google Relate projektjének keretében megalkotott mesterséges intelligencia rendszer interpretálja és lefordítja azoknak az embereknek a beszédét, akik egy betegség vagy más dolog miatt alig érthetően tudnak csak beszélni. A megoldás fejlesztése 2018-ban kezdődött, azóta több millió beszédpróbát rögzítettek, majd azokat a gépi tanulás és a mesterséges intelligencia segítségével lefordították.

Az alig érthetően beszélő személyek három lehetőség közül választhatnak, azok a listen, a repeat és az assistant. Amennyiben valakit a listen funkciót választja, akkor a Relate írott szövegre fordítja le a beszédét. A repeat funkció választása esetén egy gépi hang mondja vissza az elhangzottakat, míg az assistant választásakor az egyes felhasználók közvetlenül a Google Asszisztenssel léphetnek kapcsolatba.

A rendszert a kiválasztott személyek bevonásával először angol nyelven fogják tesztelni és utána a tapasztalatok figyelembevételével továbbfejleszteni. Ehhez a cég az Amerikai Egyesült Államokban, Ausztráliában, Kanadában és Új-Zélandon keres tesztelőket. Az érdeklődőknek egy külön oldalon lévő nyomtatványt kell kitölteniük, majd ezután egy alkalmazást kaphatnak a fejlesztés kipróbálására. A projektet később kiterjesztenék más nyelvekre is.

A Relate fejlesztésében és használatában kulcsfontosságú szerepet játszott Dimitrij Kanyevszkij és Aubrie Lee. Utóbbi izomdisztrófiában szenved, ezért a beszédét más emberek és alkalmazások is alig vagy egyáltalán nem értik meg. Julie Cattiau, a Google Research termékmenedzsere a blogbejegyzésében azt írta, hogy tudják, hogy számos beszédprobléma létezik, ezért tesztelik a szoftvert számos ember bevonásával, hogy kiderítsék, mennyire pontos a Relate. Csak e szakasz lezárása után akarják a programot mindenki számára hozzáférhetővé tenni.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • kvp #1
    Az assistant mod a legjobb: Mond valamit a user es a masik azt hallja amit a gep hallott. Ez az alapja a valos ideju foditorendszereknek is, csak itt nehezen erthetorol forditanak konnyen erthetore, azonos nyelven belul.

    Ennel mar csak az lenne a jobb, ha ezt transzparensen vezetnek be, tehat mondjuk egy online beszelgetesben nem a hang, hanem csak a szoveg utazna. Majd a masik oldalon az eredeti beszelo hangzasaval ujra osszeraknak hangga. Kozben meg lehetne automatikusan es elsore hallhato nyom nelkul cenzurazni amit mondanak.