SG.hu

MI-re cserélte le hangos­bemondó színészét a skót vasúttársaság

A ScotRail vonatainak utasai egy új hangot vettek észre, amely az állomásokra érkező vonatokon szól. Az új bemondót Iona-nak hívják, és nemrégiben kezdte meg munkáját néhány útvonalon. Elődeivel ellentétben azonban ő nem valódi.

Korábban a bemondást egy skót hangművész szólaltatta meg, Iona azonban egy szintetikus hang, amely egy mesterséges intelligenciamodell segítségével "skót akcentussal" adja elő a gépelt üzeneteket. A ScotRail arra kérte az utasokat, hogy "adjanak neki időt, és talán a szívükhöz nő". Bár a technológia még nem került teljes körűen bevezetésre, néhány utas máris hangot adott elégedetlenségének a változással kapcsolatban. "Furcsa volt. Tudtam, hogy mesterséges intelligencia, mert olyan robotikusan hangzott". - mondta az egyik utas a BBC Skóciának. Egy másik az X-en azt írta, hogy a hang bizonytalannak hangzik, és mindent kérdésként hangsúlyoz. Egy harmadik szerint "szörnyű és természetellenes".

Az új bemondót a ReadSpeaker nevű cég fejlesztette ki, amely több mint 50 nyelvi változatát értékesíti szöveg-beszéd szoftverének. Használata egyszerű: az üzemeltetők személyre szabott közleményeket kell beírjanak egy számítógépbe, és Iona felolvassa azokat. A vonattársaság az olyan trükkös helységneveket, mint Milngavie és Achnasheen fonetikusan "Mill-guy"-ként és "Akna-sheen"-ként adja meg számára, hogy a szoftver elkerülje a kínos hibákat. A csapat mesterséges intelligenciával generált egy az Iona névhez illő képet is. A végeredmény egy vörös hajú, narancssárga gyapjúsálat és zöld kabátot viselő nő, aki egy skót szurdok közepén áll.


A cég a szolgáltatást 2024 júliusában kezdte el tesztelni, de csak mostanában vezették be nagyobb állomásoknál, ezért veszi észre egyre több utas a változást. Jelenleg csak bizonyos glasgow-i pályaudvarokról induló járatokon működik a technológia: a Glasgow Queen Streetről az Inverness, Dundee és Aberdeen felé tartó vonatokon hallható, illetve az Ayr, Largs, Ardorssan, Barrhead és Paisley felé közlekedő Glasgow Central járatokon. A rendszer csak a ScotRail vonatokon használatos, és nem terjed ki az állomásokra.

Rachel Nicholson, egy Edinburgh-ban élő egykori színésznő szerint az emberi bemondók mesterséges intelligencia hangokkal való helyettesítése mind a munkahelyeket, mind az identitást érinti. "Nagyon szomorú, hogy valódi embereket akarnak helyettesíteni és munkanélkülivé teszik őket" - mondta. "Csak azért, mert ezzel pénzt takarítanak meg, még nem jelenti azt, hogy ez helyes dolog". Nicholson több mint 15 éve dolgozik a kreatív iparágban, és elmondta, hogy az MI-hangok témája kényes kérdés. "Őszintén szólva egy kicsit tabu" - mondta. "Ez egy valódi hang, egy emberi hang, amelyet lecserélnek, annak ellenére, hogy tökéletes munkát végzett."

Nicholson szerint a ScotRail új hangja világos és könnyen érthető, de megkérdőjelezte, hogy elég egyértelmű-e. "Küzd néhány egyedi nevünkkel, mint például a "ch" a "loch"-ban. Ha valaki Skóciába utazik, nem azt akarná, hogy úgy hallja ezeket a neveket, ahogyan mi mondjuk őket?" - mondta. Számára ez túlmutat a beszéden - lokálpatriótizmusról van szó. "Büszkének kell lennünk a nyelvünkre és a helységneveinkre. Ezzel talán felhígítjuk azt, ahogyan ezekre a nevekre emlékszünk, és szerintem ez nagy kár." Nicholson egyben akcentustanár is, és gyakran kérik fel arra, hogy tanítson "átlagos skót" akcentust - amit saját bevallása szerint kissé furcsának talál. "Nem ismerek olyan skótot, aki 'átlagosnak' mondaná magát. Úgy érzem, mintha valami semlegesre törekednének, de a végén két szék között a pad alá esnek. Miért ne lehetne Iona regionális? Nem hiszem, hogy az akcentusát egy térképen meg tudnám határozni."


Peter Bell professzor, az Edinburgh-i Egyetem beszédtechnológiai szakértője szerint a mesterséges intelligencia növekvő ereje jelentősen megkönnyítette és olcsóbbá tette a szintetikus hangok létrehozását. "Ma már elég néhány mondatot adni egy rendszernek valakinek a hangjából, és az azonnal elkezdhet úgy beszélni, mint az adott személy" - mondta. A technológia ma már képes meggyőzően emberi hangzású beszédet előállítani, és a vállalatok a korábbi rendszerek költségeinek töredékéért képesek hangokat generálni - mondta.

A fejlődés ellenére azonban néhány szintetikus hang nem mindig talál pozitív visszhangra a hallgatók körében. "Az embereket nagyon érdekli egy akcentus vagy egy beszélő személyisége, ezért gyakran másképp kezelik, mint az egyéb típusú mesterséges intelligenciákat, mivel nem akarják, hogy ilyen módon becsapják őket" - mondta. "Még ha egy hang nagyon jó is, akkor is van ez a hátborzongató érzés - vajon ez egy valódi hang, vagy nem az?" Bell professzor úgy véli, hogy a költségmegtakarítás az egyik fő motivációja annak, hogy a vállalatok az új technológia használatára térjenek át a "drága" szinkronszínészek korábbi alkalmazása helyett.


A ReadSpeaker szerint a ScotRail három évvel ezelőtt érdeklődött először a technológiájuk átvételéről. "A mesterséges intelligenciát csak a hang betanításához használjuk, de az alap egy valódi emberi beszélő. Ez fontos számunkra" - mondta Roy Lindemann, a ReadSpeaker társalapítója. Elmondta, hogy a szövegről beszédre történő szöveges átvétel korai változataihoz hasonlóan ők is hangtehetségekkel dolgoztak együtt, hogy megalkossák szintetikus skót karakterüket. A cég szerint a jövőben a technológia lehetővé teheti a „regionális” és „helyi” hangok használatát bármilyen rendszerben. „Ez mindenképpen egy előre vezető út” - mondta Lindemann.

Phil Campbell, a ScotRail ügyfélszolgálati igazgatója szerint az új rendszer „rugalmasságot” és „következetességet” tesz lehetővé az egész hálózaton. "A ScotRail mindig is automatizált bejelentéseket használt az ügyféltájékoztatásban. A gép nem helyettesíti az emberi interakciót sem az előre felvett hangfelvételek, sem a vonatokon lévő személyzet terén.”

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • Tetsuo #3
    A MÁV-nál ma már a legtöbb nagyállomáson olyan rendszer van, amit kvp említ. Nyilván a kiindulás eredeti emberi hangminták, ahogy az MI-nek is.

    https://www.magyarbeszed.hu/alk_tts/mav_05/
    Utoljára szerkesztette: Tetsuo, 2025.05.28. 07:54:46
  • Cat #2
    1. Magyarországon nem generált a hang, hanem eredeti hang van összevágva. Nagyon nem ugyanaz.
    2. Szerintem inkább a skót akcentus utánzása lehet a gáz. Olyan, mintha valaki szögediesen akarna beszélni.
  • kvp #1
    Mivel a MAV-os bemondasok tobb helyen mar a 70-es evek ota generaltak, ezert mi mar megszoktuk. Az emberi hang attol meg kellemesebb. Az elso magyar prototipus a regi nagyon egyszeru beszedszintetizatorbol meg 2001-ben ki volt allitva a millenarison. Egyebkent egyertelmu visszalepes minosegben a fixen rogzitett emberi hangokhoz kepest, viszont sokkal flexibilisebb, mivel gyakorlatilag barmit be tud mondani. A magyarokat azert nem zavarja annyira, mert a regi technologia miatt a hangrol egyertelmuen meg lehet mondani, hogy geppel osszeallitott. A cikkben emlitett skot esetben ha jol ertem az a zavaro, hogy nem egyertelmu elsore, hogy egy ember vagy egy szoftver beszel.

    Ahogy a robotokat is jobban el tudja fogadni az ember ha nem probalnak meg embernek kinezni, de meg ember formajunak sem, hanem latszik hogy robotok, ugy az MI generalta hangokat is jobban elfogadjak az emberek ha egyertelmuen mestersegesnek hangzanak. (feltetel, hogy jol erthetonek kell lenniuk)