SG.hu
MI-re cserélte le hangosbemondó színészét a skót vasúttársaság
A ScotRail vonatainak utasai egy új hangot vettek észre, amely az állomásokra érkező vonatokon szól. Az új bemondót Iona-nak hívják, és nemrégiben kezdte meg munkáját néhány útvonalon. Elődeivel ellentétben azonban ő nem valódi.
Korábban a bemondást egy skót hangművész szólaltatta meg, Iona azonban egy szintetikus hang, amely egy mesterséges intelligenciamodell segítségével "skót akcentussal" adja elő a gépelt üzeneteket. A ScotRail arra kérte az utasokat, hogy "adjanak neki időt, és talán a szívükhöz nő". Bár a technológia még nem került teljes körűen bevezetésre, néhány utas máris hangot adott elégedetlenségének a változással kapcsolatban. "Furcsa volt. Tudtam, hogy mesterséges intelligencia, mert olyan robotikusan hangzott". - mondta az egyik utas a BBC Skóciának. Egy másik az X-en azt írta, hogy a hang bizonytalannak hangzik, és mindent kérdésként hangsúlyoz. Egy harmadik szerint "szörnyű és természetellenes".
Az új bemondót a ReadSpeaker nevű cég fejlesztette ki, amely több mint 50 nyelvi változatát értékesíti szöveg-beszéd szoftverének. Használata egyszerű: az üzemeltetők személyre szabott közleményeket kell beírjanak egy számítógépbe, és Iona felolvassa azokat. A vonattársaság az olyan trükkös helységneveket, mint Milngavie és Achnasheen fonetikusan "Mill-guy"-ként és "Akna-sheen"-ként adja meg számára, hogy a szoftver elkerülje a kínos hibákat. A csapat mesterséges intelligenciával generált egy az Iona névhez illő képet is. A végeredmény egy vörös hajú, narancssárga gyapjúsálat és zöld kabátot viselő nő, aki egy skót szurdok közepén áll.
A cég a szolgáltatást 2024 júliusában kezdte el tesztelni, de csak mostanában vezették be nagyobb állomásoknál, ezért veszi észre egyre több utas a változást. Jelenleg csak bizonyos glasgow-i pályaudvarokról induló járatokon működik a technológia: a Glasgow Queen Streetről az Inverness, Dundee és Aberdeen felé tartó vonatokon hallható, illetve az Ayr, Largs, Ardorssan, Barrhead és Paisley felé közlekedő Glasgow Central járatokon. A rendszer csak a ScotRail vonatokon használatos, és nem terjed ki az állomásokra.
Rachel Nicholson, egy Edinburgh-ban élő egykori színésznő szerint az emberi bemondók mesterséges intelligencia hangokkal való helyettesítése mind a munkahelyeket, mind az identitást érinti. "Nagyon szomorú, hogy valódi embereket akarnak helyettesíteni és munkanélkülivé teszik őket" - mondta. "Csak azért, mert ezzel pénzt takarítanak meg, még nem jelenti azt, hogy ez helyes dolog". Nicholson több mint 15 éve dolgozik a kreatív iparágban, és elmondta, hogy az MI-hangok témája kényes kérdés. "Őszintén szólva egy kicsit tabu" - mondta. "Ez egy valódi hang, egy emberi hang, amelyet lecserélnek, annak ellenére, hogy tökéletes munkát végzett."
Nicholson szerint a ScotRail új hangja világos és könnyen érthető, de megkérdőjelezte, hogy elég egyértelmű-e. "Küzd néhány egyedi nevünkkel, mint például a "ch" a "loch"-ban. Ha valaki Skóciába utazik, nem azt akarná, hogy úgy hallja ezeket a neveket, ahogyan mi mondjuk őket?" - mondta. Számára ez túlmutat a beszéden - lokálpatriótizmusról van szó. "Büszkének kell lennünk a nyelvünkre és a helységneveinkre. Ezzel talán felhígítjuk azt, ahogyan ezekre a nevekre emlékszünk, és szerintem ez nagy kár." Nicholson egyben akcentustanár is, és gyakran kérik fel arra, hogy tanítson "átlagos skót" akcentust - amit saját bevallása szerint kissé furcsának talál. "Nem ismerek olyan skótot, aki 'átlagosnak' mondaná magát. Úgy érzem, mintha valami semlegesre törekednének, de a végén két szék között a pad alá esnek. Miért ne lehetne Iona regionális? Nem hiszem, hogy az akcentusát egy térképen meg tudnám határozni."
Peter Bell professzor, az Edinburgh-i Egyetem beszédtechnológiai szakértője szerint a mesterséges intelligencia növekvő ereje jelentősen megkönnyítette és olcsóbbá tette a szintetikus hangok létrehozását. "Ma már elég néhány mondatot adni egy rendszernek valakinek a hangjából, és az azonnal elkezdhet úgy beszélni, mint az adott személy" - mondta. A technológia ma már képes meggyőzően emberi hangzású beszédet előállítani, és a vállalatok a korábbi rendszerek költségeinek töredékéért képesek hangokat generálni - mondta.
A fejlődés ellenére azonban néhány szintetikus hang nem mindig talál pozitív visszhangra a hallgatók körében. "Az embereket nagyon érdekli egy akcentus vagy egy beszélő személyisége, ezért gyakran másképp kezelik, mint az egyéb típusú mesterséges intelligenciákat, mivel nem akarják, hogy ilyen módon becsapják őket" - mondta. "Még ha egy hang nagyon jó is, akkor is van ez a hátborzongató érzés - vajon ez egy valódi hang, vagy nem az?" Bell professzor úgy véli, hogy a költségmegtakarítás az egyik fő motivációja annak, hogy a vállalatok az új technológia használatára térjenek át a "drága" szinkronszínészek korábbi alkalmazása helyett.
A ReadSpeaker szerint a ScotRail három évvel ezelőtt érdeklődött először a technológiájuk átvételéről. "A mesterséges intelligenciát csak a hang betanításához használjuk, de az alap egy valódi emberi beszélő. Ez fontos számunkra" - mondta Roy Lindemann, a ReadSpeaker társalapítója. Elmondta, hogy a szövegről beszédre történő szöveges átvétel korai változataihoz hasonlóan ők is hangtehetségekkel dolgoztak együtt, hogy megalkossák szintetikus skót karakterüket. A cég szerint a jövőben a technológia lehetővé teheti a „regionális” és „helyi” hangok használatát bármilyen rendszerben. „Ez mindenképpen egy előre vezető út” - mondta Lindemann.
Phil Campbell, a ScotRail ügyfélszolgálati igazgatója szerint az új rendszer „rugalmasságot” és „következetességet” tesz lehetővé az egész hálózaton. "A ScotRail mindig is automatizált bejelentéseket használt az ügyféltájékoztatásban. A gép nem helyettesíti az emberi interakciót sem az előre felvett hangfelvételek, sem a vonatokon lévő személyzet terén.”
Korábban a bemondást egy skót hangművész szólaltatta meg, Iona azonban egy szintetikus hang, amely egy mesterséges intelligenciamodell segítségével "skót akcentussal" adja elő a gépelt üzeneteket. A ScotRail arra kérte az utasokat, hogy "adjanak neki időt, és talán a szívükhöz nő". Bár a technológia még nem került teljes körűen bevezetésre, néhány utas máris hangot adott elégedetlenségének a változással kapcsolatban. "Furcsa volt. Tudtam, hogy mesterséges intelligencia, mert olyan robotikusan hangzott". - mondta az egyik utas a BBC Skóciának. Egy másik az X-en azt írta, hogy a hang bizonytalannak hangzik, és mindent kérdésként hangsúlyoz. Egy harmadik szerint "szörnyű és természetellenes".
Az új bemondót a ReadSpeaker nevű cég fejlesztette ki, amely több mint 50 nyelvi változatát értékesíti szöveg-beszéd szoftverének. Használata egyszerű: az üzemeltetők személyre szabott közleményeket kell beírjanak egy számítógépbe, és Iona felolvassa azokat. A vonattársaság az olyan trükkös helységneveket, mint Milngavie és Achnasheen fonetikusan "Mill-guy"-ként és "Akna-sheen"-ként adja meg számára, hogy a szoftver elkerülje a kínos hibákat. A csapat mesterséges intelligenciával generált egy az Iona névhez illő képet is. A végeredmény egy vörös hajú, narancssárga gyapjúsálat és zöld kabátot viselő nő, aki egy skót szurdok közepén áll.
A cég a szolgáltatást 2024 júliusában kezdte el tesztelni, de csak mostanában vezették be nagyobb állomásoknál, ezért veszi észre egyre több utas a változást. Jelenleg csak bizonyos glasgow-i pályaudvarokról induló járatokon működik a technológia: a Glasgow Queen Streetről az Inverness, Dundee és Aberdeen felé tartó vonatokon hallható, illetve az Ayr, Largs, Ardorssan, Barrhead és Paisley felé közlekedő Glasgow Central járatokon. A rendszer csak a ScotRail vonatokon használatos, és nem terjed ki az állomásokra.
Rachel Nicholson, egy Edinburgh-ban élő egykori színésznő szerint az emberi bemondók mesterséges intelligencia hangokkal való helyettesítése mind a munkahelyeket, mind az identitást érinti. "Nagyon szomorú, hogy valódi embereket akarnak helyettesíteni és munkanélkülivé teszik őket" - mondta. "Csak azért, mert ezzel pénzt takarítanak meg, még nem jelenti azt, hogy ez helyes dolog". Nicholson több mint 15 éve dolgozik a kreatív iparágban, és elmondta, hogy az MI-hangok témája kényes kérdés. "Őszintén szólva egy kicsit tabu" - mondta. "Ez egy valódi hang, egy emberi hang, amelyet lecserélnek, annak ellenére, hogy tökéletes munkát végzett."
Nicholson szerint a ScotRail új hangja világos és könnyen érthető, de megkérdőjelezte, hogy elég egyértelmű-e. "Küzd néhány egyedi nevünkkel, mint például a "ch" a "loch"-ban. Ha valaki Skóciába utazik, nem azt akarná, hogy úgy hallja ezeket a neveket, ahogyan mi mondjuk őket?" - mondta. Számára ez túlmutat a beszéden - lokálpatriótizmusról van szó. "Büszkének kell lennünk a nyelvünkre és a helységneveinkre. Ezzel talán felhígítjuk azt, ahogyan ezekre a nevekre emlékszünk, és szerintem ez nagy kár." Nicholson egyben akcentustanár is, és gyakran kérik fel arra, hogy tanítson "átlagos skót" akcentust - amit saját bevallása szerint kissé furcsának talál. "Nem ismerek olyan skótot, aki 'átlagosnak' mondaná magát. Úgy érzem, mintha valami semlegesre törekednének, de a végén két szék között a pad alá esnek. Miért ne lehetne Iona regionális? Nem hiszem, hogy az akcentusát egy térképen meg tudnám határozni."
Peter Bell professzor, az Edinburgh-i Egyetem beszédtechnológiai szakértője szerint a mesterséges intelligencia növekvő ereje jelentősen megkönnyítette és olcsóbbá tette a szintetikus hangok létrehozását. "Ma már elég néhány mondatot adni egy rendszernek valakinek a hangjából, és az azonnal elkezdhet úgy beszélni, mint az adott személy" - mondta. A technológia ma már képes meggyőzően emberi hangzású beszédet előállítani, és a vállalatok a korábbi rendszerek költségeinek töredékéért képesek hangokat generálni - mondta.
A fejlődés ellenére azonban néhány szintetikus hang nem mindig talál pozitív visszhangra a hallgatók körében. "Az embereket nagyon érdekli egy akcentus vagy egy beszélő személyisége, ezért gyakran másképp kezelik, mint az egyéb típusú mesterséges intelligenciákat, mivel nem akarják, hogy ilyen módon becsapják őket" - mondta. "Még ha egy hang nagyon jó is, akkor is van ez a hátborzongató érzés - vajon ez egy valódi hang, vagy nem az?" Bell professzor úgy véli, hogy a költségmegtakarítás az egyik fő motivációja annak, hogy a vállalatok az új technológia használatára térjenek át a "drága" szinkronszínészek korábbi alkalmazása helyett.
A ReadSpeaker szerint a ScotRail három évvel ezelőtt érdeklődött először a technológiájuk átvételéről. "A mesterséges intelligenciát csak a hang betanításához használjuk, de az alap egy valódi emberi beszélő. Ez fontos számunkra" - mondta Roy Lindemann, a ReadSpeaker társalapítója. Elmondta, hogy a szövegről beszédre történő szöveges átvétel korai változataihoz hasonlóan ők is hangtehetségekkel dolgoztak együtt, hogy megalkossák szintetikus skót karakterüket. A cég szerint a jövőben a technológia lehetővé teheti a „regionális” és „helyi” hangok használatát bármilyen rendszerben. „Ez mindenképpen egy előre vezető út” - mondta Lindemann.
Phil Campbell, a ScotRail ügyfélszolgálati igazgatója szerint az új rendszer „rugalmasságot” és „következetességet” tesz lehetővé az egész hálózaton. "A ScotRail mindig is automatizált bejelentéseket használt az ügyféltájékoztatásban. A gép nem helyettesíti az emberi interakciót sem az előre felvett hangfelvételek, sem a vonatokon lévő személyzet terén.”