SG.hu
Kezdhetnek állást keresni a hangjukból élő színészek
Soknak élnek a rajzfilmhősök és az idegen nyelven beszélő filmsztárok megszemélyesítéséből. Ők most bajban vannak.
A mesterséges intelligencia fejlődése lehetővé tette, hogy a szoftverek hátborzongató pontossággal teremtsék újra a hangokat. A Revoicer.com ügyfelei szerény havidíj ellenében több száz különböző hanghoz férhetnek hozzá, és egy mesterséges intelligenciával támogatott eszköz segítségével úgy alakíthatják át őket, hogy bármit mondhassanak - reklámok hangjaként, vállalati tréningek felolvasójaként vagy könyvek narrátoraként.
A generatív mesterséges intelligencia fejlődése lehetővé tette, hogy a szoftverek hátborzongató pontossággal újraalkossák az emberek hangját. Ezek az algoritmusok az internetről származó eszméletlen mennyiségű adat alapján szövegeket, képeket vagy hangokat formálnak és gyorsan felismerik a mintákat. Egy több millió hangot tartalmazó adatbázis betöltése után lehetővé teszik a felhasználók számára, hogy egyszerű szövegből beszéddé alakító eszközökkel úgy módosítsák a hangot, hogy azt mondja, amit beírnak. A technológia a zeneipar világát is felforgatja, gondoljunk csak a Drake és The Weeknd hangjának mesterséges intelligencia-változatából készült új számra, a "Heart on My Sleeve"-re.
Ártó szándékkal is lehet használni, több híresség is megtapasztalta már ezeket a verbális deepfake-eket. Emma Watson klónozott hangja Adolf Hitler Mein Kampf című művének részleteit szavalta, az amerikai elnök, Joe Biden pedig egy hamis felvételen arról beszél, hogy a gyenge minőségű marihuánát részesíti előnyben.
A technológia azonban különösen bizonytalan helyzetbe hozza a hangszínészeket, a hangoskönyveket, videojátékokat és reklámokat narráló, gyakran névtelen szakembereket. Bár hangjukat sokan ismerik, valós ismertségük csekély. A törvény kevés menedéket kínál, mivel a szerzői jogi rendelkezések eddig nem foglalkoztak a mesterséges intelligencia azon képességével, hogy emberi beszédet, szöveget vagy fotókat hozzon létre. Szakértők szerint a szerződések inkább tartalmaznak olyan apróbetűs rendelkezéseket, amelyek lehetővé teszik a vállalat számára, hogy a színész hangját más variációkban használja fel, vagy akár el is adhatja azt más feleknek.
De miért is fizetne egy cég egy színésznek hatalmas kalap pénzt, amikor havi 27 dollárért hozzájuthat egy élethű klónhoz?
David Attenborough mindenki által ismert hangja, amint a Warhammer 40k játék tiranida invázióját narrálja
A hanggeneráló szoftverek rengeteget profitálnak a generatív mesterséges intelligencia fellendüléséből, amely a ChatGPT-hez hasonló chatbotok és a DALL-E-hez hasonló képgenerátorok mögött áll. Bár a gépek már évtizedek óta tudnak beszélni, eddig robotikus, irreális hangokat produkáltak. De a szoftver mögöttes architektúrájában és számítási teljesítményében bekövetkezett fejlesztések megtették a hatásukat, most már hangok millióit képes gyorsan elemezni, és felismerik a beszéd elemi egységei, az úgynevezett fonémák közötti mintázatokat. A szoftver összehasonlítja az eredeti hangmintát a könyvtárában található hasonló hangminták halmazával, és megtalálja az egyedi jellemzőket, hogy egy valósághűen hangzó klónt hozzon létre.
Mielőtt ez a fejlett mintafelismerés lehetővé vált volna, a hanggeneráló szoftvereknek több ezer mondatra volt szükségük egy hang lemásolásához. Most ezek az eszközök mindössze néhány percnyi rögzített beszéddel dolgoznak. Ez a fejlődés egyesek számára áldás, például a bénult, degeneratív betegségekben szenvedő emberek mesterséges intelligencia segítségével "eltárolhatják" a hangjukat. A hangklónozó szoftver tette lehetővé Val Kilmer számára, aki egy torokrák miatt végzett műtét után elvesztette a hangját, hogy megszólaljon a Top Gun Maverick című filmben.
De egyúttal romboló hatása is van. A Magyarországon régóta futó unokázós csalás, melyben telefonon kérnek segítséget a nagymamától, valószínűleg még több áldozatot fog szedni. Olyan start-up cégek jelentek meg, amelyek az internetről származó jó minőségű beszédmintákat keresnek, hangok százait gyűjtik könyvtárakba, majd eladják őket cégeknek reklámok, belső tréningek, videojátékok demóinak és hangoskönyvek számára, alig néhány dollárt kérve értük havonta. Ez nagyon jövedelmező ajánlat a vállalatoknak: élethű hangok, amelyek képesek elmondani, amire szükség van, anélkül, hogy az emberi szakemberekkel járó magasabb költségekkel kellene foglalkozniuk.
A generatív MI hatása még csak most jelent meg, de már most ijesztő hatása van a szinkronszínészekre. Ha az egyik ilyen adatbázisból sikerül is töröltetniük magukat, a megélhetésük komoly veszélyben van, mert más, harmadik fél által üzemeltetett oldalak továbbértékesíthetik a hangjukat és kevés jogorvoslati lehetőség áll rendelkezésükre. A közelmúltig a mesterséges intelligencia nem jelentett nagy veszélyt a szakmájukra és a szerzői jogi szabályozás sem érett meg arra, hogy eldöntse, mi történik akkor, ha egy személy hangját profitszerzés céljából utánozzák. Európában könnyebb egy hangfelvételt szerzői jogvédelem alá vonni, és az ilyen tartalmak kereskedelmi célú felhasználásához a felvétel tulajdonosának engedélye szükséges. Az Európai Unió is határozottabb álláspontot vázolt fel a mesterséges intelligenciával szemben: olyan törvényjavaslatokat terjesztett elő, amelyek minősítenék egy mesterséges intelligencia rendszer kockázatait.
A mesterséges intelligencia fejlődése lehetővé tette, hogy a szoftverek hátborzongató pontossággal teremtsék újra a hangokat. A Revoicer.com ügyfelei szerény havidíj ellenében több száz különböző hanghoz férhetnek hozzá, és egy mesterséges intelligenciával támogatott eszköz segítségével úgy alakíthatják át őket, hogy bármit mondhassanak - reklámok hangjaként, vállalati tréningek felolvasójaként vagy könyvek narrátoraként.
A generatív mesterséges intelligencia fejlődése lehetővé tette, hogy a szoftverek hátborzongató pontossággal újraalkossák az emberek hangját. Ezek az algoritmusok az internetről származó eszméletlen mennyiségű adat alapján szövegeket, képeket vagy hangokat formálnak és gyorsan felismerik a mintákat. Egy több millió hangot tartalmazó adatbázis betöltése után lehetővé teszik a felhasználók számára, hogy egyszerű szövegből beszéddé alakító eszközökkel úgy módosítsák a hangot, hogy azt mondja, amit beírnak. A technológia a zeneipar világát is felforgatja, gondoljunk csak a Drake és The Weeknd hangjának mesterséges intelligencia-változatából készült új számra, a "Heart on My Sleeve"-re.
Ártó szándékkal is lehet használni, több híresség is megtapasztalta már ezeket a verbális deepfake-eket. Emma Watson klónozott hangja Adolf Hitler Mein Kampf című művének részleteit szavalta, az amerikai elnök, Joe Biden pedig egy hamis felvételen arról beszél, hogy a gyenge minőségű marihuánát részesíti előnyben.
A technológia azonban különösen bizonytalan helyzetbe hozza a hangszínészeket, a hangoskönyveket, videojátékokat és reklámokat narráló, gyakran névtelen szakembereket. Bár hangjukat sokan ismerik, valós ismertségük csekély. A törvény kevés menedéket kínál, mivel a szerzői jogi rendelkezések eddig nem foglalkoztak a mesterséges intelligencia azon képességével, hogy emberi beszédet, szöveget vagy fotókat hozzon létre. Szakértők szerint a szerződések inkább tartalmaznak olyan apróbetűs rendelkezéseket, amelyek lehetővé teszik a vállalat számára, hogy a színész hangját más variációkban használja fel, vagy akár el is adhatja azt más feleknek.
De miért is fizetne egy cég egy színésznek hatalmas kalap pénzt, amikor havi 27 dollárért hozzájuthat egy élethű klónhoz?
David Attenborough mindenki által ismert hangja, amint a Warhammer 40k játék tiranida invázióját narrálja
A hanggeneráló szoftverek rengeteget profitálnak a generatív mesterséges intelligencia fellendüléséből, amely a ChatGPT-hez hasonló chatbotok és a DALL-E-hez hasonló képgenerátorok mögött áll. Bár a gépek már évtizedek óta tudnak beszélni, eddig robotikus, irreális hangokat produkáltak. De a szoftver mögöttes architektúrájában és számítási teljesítményében bekövetkezett fejlesztések megtették a hatásukat, most már hangok millióit képes gyorsan elemezni, és felismerik a beszéd elemi egységei, az úgynevezett fonémák közötti mintázatokat. A szoftver összehasonlítja az eredeti hangmintát a könyvtárában található hasonló hangminták halmazával, és megtalálja az egyedi jellemzőket, hogy egy valósághűen hangzó klónt hozzon létre.
Mielőtt ez a fejlett mintafelismerés lehetővé vált volna, a hanggeneráló szoftvereknek több ezer mondatra volt szükségük egy hang lemásolásához. Most ezek az eszközök mindössze néhány percnyi rögzített beszéddel dolgoznak. Ez a fejlődés egyesek számára áldás, például a bénult, degeneratív betegségekben szenvedő emberek mesterséges intelligencia segítségével "eltárolhatják" a hangjukat. A hangklónozó szoftver tette lehetővé Val Kilmer számára, aki egy torokrák miatt végzett műtét után elvesztette a hangját, hogy megszólaljon a Top Gun Maverick című filmben.
De egyúttal romboló hatása is van. A Magyarországon régóta futó unokázós csalás, melyben telefonon kérnek segítséget a nagymamától, valószínűleg még több áldozatot fog szedni. Olyan start-up cégek jelentek meg, amelyek az internetről származó jó minőségű beszédmintákat keresnek, hangok százait gyűjtik könyvtárakba, majd eladják őket cégeknek reklámok, belső tréningek, videojátékok demóinak és hangoskönyvek számára, alig néhány dollárt kérve értük havonta. Ez nagyon jövedelmező ajánlat a vállalatoknak: élethű hangok, amelyek képesek elmondani, amire szükség van, anélkül, hogy az emberi szakemberekkel járó magasabb költségekkel kellene foglalkozniuk.
A generatív MI hatása még csak most jelent meg, de már most ijesztő hatása van a szinkronszínészekre. Ha az egyik ilyen adatbázisból sikerül is töröltetniük magukat, a megélhetésük komoly veszélyben van, mert más, harmadik fél által üzemeltetett oldalak továbbértékesíthetik a hangjukat és kevés jogorvoslati lehetőség áll rendelkezésükre. A közelmúltig a mesterséges intelligencia nem jelentett nagy veszélyt a szakmájukra és a szerzői jogi szabályozás sem érett meg arra, hogy eldöntse, mi történik akkor, ha egy személy hangját profitszerzés céljából utánozzák. Európában könnyebb egy hangfelvételt szerzői jogvédelem alá vonni, és az ilyen tartalmak kereskedelmi célú felhasználásához a felvétel tulajdonosának engedélye szükséges. Az Európai Unió is határozottabb álláspontot vázolt fel a mesterséges intelligenciával szemben: olyan törvényjavaslatokat terjesztett elő, amelyek minősítenék egy mesterséges intelligencia rendszer kockázatait.