SG.hu
MI-vel generált dalok árasztják el a YouTube-ot és a Spotify-t

A mesterséges intelligencia által generált dalok bekerültek a streaming szolgáltatásokba, és nem csak ambient vagy elektronikus zene szekciókban, hanem komplett rock, salsa és jazz zenekarok is bőven találhatók.
A YouTube-ra feltöltött Rumba Congo (1973) album leírása elmeséli a felvételét készítő zenészek élettörténetét. A zenekar neve Concubanas. A csoportot 1971-ben Havannában alapították, és kubai és kongói zene egyedülálló fúzióját játszotta. 1992-ben feloszlott, de mielőtt ez megtörtént, számtalan zenei gyöngyszemet hagyott maga után. A YouTube-videó leírásának legalsó részén egy megjegyzés található, miszerint a tartalom „módosított vagy szintetikus”. Ez a kifejezés eufemizmus, amely nem fejezi ki kellőképpen, hogy a videóban hallható zene mesterséges intelligencia segítségével készült. A zenekar nem létezik. A Rumba Congo albumon salsa, rumba vagy son cubano („kubai hangzás”) műfajra emlékeztető dallamok hallhatók. A képzetlen fül számára nehéz felismerni, hogy ez a zene néhány utasítás alapján készült.
Az MI-t ma már nem csak ambient témákhoz használják, amelyek csupán a hallgatók relaxációját segítő hangokat vagy a koncentrációt és a tanulást elősegítő hangulatot teremtenek. Az olyan platformok, mint a Suno, a Boomy vagy az Udio viszonylag bonyolult jazz- vagy rockkompozíciók létrehozását teszik lehetővé. A Nemzetközi Szerzői és Zeneszerzői Társaságok Szövetsége (CISAC) egy tanulmánya szerint az MI által generált zene bevételei 2023-ban 100 millió dollárról 2028-ra körülbelül 4 milliárd dollárra nőnek. A szervezet becslése szerint addigra a streaming platformok bevételeinek 20%-a ebből a zenei műfajból fog származni.
Ennek a tendenciának az egyik legnagyobb problémája a átláthatóság hiánya. María Teresa Llano, a Sussex Egyetem docense, aki a kreativitás, a művészet és az MI metszéspontját tanulmányozza ezt a szempontot hangsúlyozza: "Az embereknek nincs módjuk megtudni, hogy valami MI-generált-e vagy sem. Jelenleg ez a teher a hallgatóra nehezedik, pedig a másik oldalon kellene lennie a felelősségnek, hogy biztosítsa az átláthatóságot, hogy egyértelművé tegye, hogy valami mesterséges intelligencia vagy ember által generált-e.” Egyesek máris az ilyen típusú, mesterséges intelligencia által generált zene térnyeréséről beszélnek. A témával kapcsolatos Reddit-szálak, valamint a FastCompany egyik cikke a mesterséges intelligencia által generált dalok Spotify-ra való beáramlására figyelmeztet.
A Spotify Community-n - a szolgáltatás felhasználóinak fórumán - petíció kering, amely az MI által generált zene egyértelmű jelölését, valamint a felhasználók számára azt a lehetőséget kéri, hogy blokkolhassák az ilyen típusú dalok megjelenését a feedjeikben. Ezeken a fórumokon az MI által generált zene elutasítása érezhető. Llano kiemeli a hallgatók által esetlegesen érzett csalódást vagy árulást, de szerinte ez személyes ügy: lesznek, akik így érzik, és lesznek, akik csodálják a technológia képességeit. "Nekem, aki kolumbiai vagyok, és nyilvánvalóan a salsa zenével nőttem fel amikor meghallottam a Rumba Congo albumot, azt gondoltam, hogy rendben van. Amikor rájöttem, hogy MI-vel készült, azt gondoltam, hogy elképesztő, de ez elvette a varázsát” - vallja be.
Egyesek viccként fogják fel, és az internetes trollok klasszikus szarkazmusát alkalmazzák. Az egyik hamis kubai zenekar dalához fűzött kommentben ez áll: "Emlékszem, hogy ez a zenekar élőben játszott, amikor 1972-ben egy havannai kávézóban összefutottam egy CIA-ügynökkel. Micsoda idők voltak!” Valaki erre így válaszol: „Én voltam az a CIA-ügynök.” Egy másik felhasználó - aki vagy elhitte a beszélgetést, vagy egyszerűen csak folytatta a trollkodást - mindkettőjüknek így válaszol: „Hihetetlen, hogy ti ketten itt, a YouTube-on újra találkoztatok.” Ez valóban teljesen hihetetlen...
Viccet félretéve, komoly következményei vannak annak, hogy nem tudjuk egy zenét emberek vagy egy MI program készítette. "Úgy gondolom, hogy a jövőben, amikor valaki valami újat hallgat, nem lehet biztos abban, hogy azt MI generálta-e vagy sem. És ez a bizonytalanság frusztrációt okoz. Nem tudni, hogy amit hallok, az valódi-e vagy sem” - sóhajt Llano. Emellett megemlíti a hamis hírek témáját is: "A híreknek nagyon közvetlen hatása van, ami azzal kapcsolatos, hogy valami valóban megtörténik-e vagy sem. A művészet esetében a hatás más, inkább ahhoz hasonlít, ahogyan az ember azt megéli” - reflektál.
Egyes tartalomalkotók feltöltenek mesterséges intelligenciával generált zenét, miközben ezt egyértelműen jelzik. Az egyik legnépszerűbb forrás az AI Music Puppy. Ez a YouTube-csatorna elektronikus zenét kínál egy DJ kiskutyával a videó vizuális elemeként. Meglehetősen átlátható, tekintve a nevét és a videók leírásának elején szereplő nyilatkozatot. De nem jellemző ez a őszinteség. Tehát a probléma megoldásának egyik kulcsa az MI által generált dalokhoz egy figyelmeztetés hozzáadása. A YouTube ezt meg is követeli, azaz a tartalomkészítőknek „közölniük kell a nézőkkel, ha a tartalom módosított vagy szintetikus média, beleértve a generatív MI-t is”. A felhasználók ezt láthatják, ha ránéznek a leírásra. De ez csak az alkalmazás használata esetén lehetséges, mert számítógépen le kell görgetniük a leírás legvégéig, hogy megkapják a figyelmeztetést.
A Google - a YouTube tulajdonosa - elismeri, hogy az MI használatának elhallgatása csalódásérzetet kelthet. "Megtévesztő lehet, ha a nézők azt hiszik, hogy egy videó valós, miközben valójában jelentősen módosították vagy szintetikusan generálták, hogy valóságosnak tűnjön” - olvasható a YouTube irányelveiben. Így, ha a tartalomkészítők nem ismerik el az MI használatát, a platform „intézkedéseket hozhat a nézők károsodása kockázatának csökkentése érdekében, proaktív módon olyan címkét alkalmazva, amelyet a tartalomkészítők nem tudnak eltávolítani”. A YouTube fenntartja magának a jogot, hogy ezeket a csatornákat szankcionálja, például a tartalmuk eltávolításával.
A Spotify viszont nem tette közzé az MI-alapú tartalmak címkézésére vonatkozó irányelvét. Gustav Söderström, a Spotify társelnöke és termék- és technológiai igazgatója egy interjúban azt hangsúlyozta, hogy az MI „növeli az emberek kreativitását”, mert több ember lehet kreatív, köszönhetően annak, hogy „nem kell finom motorikus képességekkel rendelkezni a zongorán”. Különbséget tett továbbá a teljes egészében MI-val generált zene és az olyan zene között, amelyben a technológiát csak részben használják. Azonban az egyetlen korlátozást, amelyet a mesterséges zene moderálásával kapcsolatban említett, a szerzői jogok megsértése volt - ami már évek óta vörös vonal minden streaming szolgáltatás számára. És egy ilyen jogsértést nagyon nehéz jogilag bizonyítani, ha mesterséges intelligencia is szerepet játszik benne.
Llano olyan intézkedéseket támogat, amelyek egyértelműen jelölik a tartalmakat. "Kell lennie egy jelölésnek, amely jelzi, hogy valami mesterséges intelligenciával készült-e. Ez nagyobb átláthatóságot biztosítana a felhasználók számára.” A Sussex Egyetem professzora kiemeli az egyik immateriális értéket, amely indokolja a tartalmak jelölését: „A művészetekben kapcsolatot tudunk létesíteni a művésszel; megismerhetjük az életét és azt, mi befolyásolta, hogy jobban megértsük a karrierjét. A mesterséges intelligenciával ez a kapcsolat már nem létezik.”
A Concubanas Rumba Congo című albuma 1,3 millió megtekintést ért el a YouTube-on. Nem ez az egyetlen fiktív zenekar, és nem is az egyetlen, amelynek háttértörténete van. A Phantasia zenekar (szintén egy nem valódi zenekar) fuvolák, elektronikus hangok és elektromos gitárok ötvözetét kínálja, amelyet egy leírás „japán progresszív jazz fúzióként” definiál. Hamis albumai több ezer lejátszást értek el. A mesterséges intelligencia által létrehozott zenekarnak még saját kitalált múltja is van. „Kobayashi Ryo 1976-os távozása után a Phantasia csendbe burkolózott” - olvasható az egyik videó leírásában. „Két évvel később a csoport a Divine Incarnation című albummal bukkant fel a sötétségből, ami a rajongók számára a zenekar „aranykorának” kezdetét jelentette.”
Mindkét hamis zenekar ugyanazon a csatornán, a Zarureten van, amelynek legrégebbi videói mindössze hét hónaposak. Ez idő alatt a csatorna 141 zenei videót tett közzé, amelyek közül sok több mint 30 perc hosszú. Nincsenek mozgóképek, csak borítóképek és MI által generált zene, melyet hosszú, MI által generált szöveg kísér. Minden videó leírásának végén található egy nyilatkozat a „módosított vagy szintetikus tartalomról”. A csatorna több millió megtekintést és 40 ezer feliratkozót gyűjtött.
A YouTube-ra feltöltött Rumba Congo (1973) album leírása elmeséli a felvételét készítő zenészek élettörténetét. A zenekar neve Concubanas. A csoportot 1971-ben Havannában alapították, és kubai és kongói zene egyedülálló fúzióját játszotta. 1992-ben feloszlott, de mielőtt ez megtörtént, számtalan zenei gyöngyszemet hagyott maga után. A YouTube-videó leírásának legalsó részén egy megjegyzés található, miszerint a tartalom „módosított vagy szintetikus”. Ez a kifejezés eufemizmus, amely nem fejezi ki kellőképpen, hogy a videóban hallható zene mesterséges intelligencia segítségével készült. A zenekar nem létezik. A Rumba Congo albumon salsa, rumba vagy son cubano („kubai hangzás”) műfajra emlékeztető dallamok hallhatók. A képzetlen fül számára nehéz felismerni, hogy ez a zene néhány utasítás alapján készült.
Az MI-t ma már nem csak ambient témákhoz használják, amelyek csupán a hallgatók relaxációját segítő hangokat vagy a koncentrációt és a tanulást elősegítő hangulatot teremtenek. Az olyan platformok, mint a Suno, a Boomy vagy az Udio viszonylag bonyolult jazz- vagy rockkompozíciók létrehozását teszik lehetővé. A Nemzetközi Szerzői és Zeneszerzői Társaságok Szövetsége (CISAC) egy tanulmánya szerint az MI által generált zene bevételei 2023-ban 100 millió dollárról 2028-ra körülbelül 4 milliárd dollárra nőnek. A szervezet becslése szerint addigra a streaming platformok bevételeinek 20%-a ebből a zenei műfajból fog származni.
Ennek a tendenciának az egyik legnagyobb problémája a átláthatóság hiánya. María Teresa Llano, a Sussex Egyetem docense, aki a kreativitás, a művészet és az MI metszéspontját tanulmányozza ezt a szempontot hangsúlyozza: "Az embereknek nincs módjuk megtudni, hogy valami MI-generált-e vagy sem. Jelenleg ez a teher a hallgatóra nehezedik, pedig a másik oldalon kellene lennie a felelősségnek, hogy biztosítsa az átláthatóságot, hogy egyértelművé tegye, hogy valami mesterséges intelligencia vagy ember által generált-e.” Egyesek máris az ilyen típusú, mesterséges intelligencia által generált zene térnyeréséről beszélnek. A témával kapcsolatos Reddit-szálak, valamint a FastCompany egyik cikke a mesterséges intelligencia által generált dalok Spotify-ra való beáramlására figyelmeztet.
A Spotify Community-n - a szolgáltatás felhasználóinak fórumán - petíció kering, amely az MI által generált zene egyértelmű jelölését, valamint a felhasználók számára azt a lehetőséget kéri, hogy blokkolhassák az ilyen típusú dalok megjelenését a feedjeikben. Ezeken a fórumokon az MI által generált zene elutasítása érezhető. Llano kiemeli a hallgatók által esetlegesen érzett csalódást vagy árulást, de szerinte ez személyes ügy: lesznek, akik így érzik, és lesznek, akik csodálják a technológia képességeit. "Nekem, aki kolumbiai vagyok, és nyilvánvalóan a salsa zenével nőttem fel amikor meghallottam a Rumba Congo albumot, azt gondoltam, hogy rendben van. Amikor rájöttem, hogy MI-vel készült, azt gondoltam, hogy elképesztő, de ez elvette a varázsát” - vallja be.
Egyesek viccként fogják fel, és az internetes trollok klasszikus szarkazmusát alkalmazzák. Az egyik hamis kubai zenekar dalához fűzött kommentben ez áll: "Emlékszem, hogy ez a zenekar élőben játszott, amikor 1972-ben egy havannai kávézóban összefutottam egy CIA-ügynökkel. Micsoda idők voltak!” Valaki erre így válaszol: „Én voltam az a CIA-ügynök.” Egy másik felhasználó - aki vagy elhitte a beszélgetést, vagy egyszerűen csak folytatta a trollkodást - mindkettőjüknek így válaszol: „Hihetetlen, hogy ti ketten itt, a YouTube-on újra találkoztatok.” Ez valóban teljesen hihetetlen...
Viccet félretéve, komoly következményei vannak annak, hogy nem tudjuk egy zenét emberek vagy egy MI program készítette. "Úgy gondolom, hogy a jövőben, amikor valaki valami újat hallgat, nem lehet biztos abban, hogy azt MI generálta-e vagy sem. És ez a bizonytalanság frusztrációt okoz. Nem tudni, hogy amit hallok, az valódi-e vagy sem” - sóhajt Llano. Emellett megemlíti a hamis hírek témáját is: "A híreknek nagyon közvetlen hatása van, ami azzal kapcsolatos, hogy valami valóban megtörténik-e vagy sem. A művészet esetében a hatás más, inkább ahhoz hasonlít, ahogyan az ember azt megéli” - reflektál.
Egyes tartalomalkotók feltöltenek mesterséges intelligenciával generált zenét, miközben ezt egyértelműen jelzik. Az egyik legnépszerűbb forrás az AI Music Puppy. Ez a YouTube-csatorna elektronikus zenét kínál egy DJ kiskutyával a videó vizuális elemeként. Meglehetősen átlátható, tekintve a nevét és a videók leírásának elején szereplő nyilatkozatot. De nem jellemző ez a őszinteség. Tehát a probléma megoldásának egyik kulcsa az MI által generált dalokhoz egy figyelmeztetés hozzáadása. A YouTube ezt meg is követeli, azaz a tartalomkészítőknek „közölniük kell a nézőkkel, ha a tartalom módosított vagy szintetikus média, beleértve a generatív MI-t is”. A felhasználók ezt láthatják, ha ránéznek a leírásra. De ez csak az alkalmazás használata esetén lehetséges, mert számítógépen le kell görgetniük a leírás legvégéig, hogy megkapják a figyelmeztetést.
A Google - a YouTube tulajdonosa - elismeri, hogy az MI használatának elhallgatása csalódásérzetet kelthet. "Megtévesztő lehet, ha a nézők azt hiszik, hogy egy videó valós, miközben valójában jelentősen módosították vagy szintetikusan generálták, hogy valóságosnak tűnjön” - olvasható a YouTube irányelveiben. Így, ha a tartalomkészítők nem ismerik el az MI használatát, a platform „intézkedéseket hozhat a nézők károsodása kockázatának csökkentése érdekében, proaktív módon olyan címkét alkalmazva, amelyet a tartalomkészítők nem tudnak eltávolítani”. A YouTube fenntartja magának a jogot, hogy ezeket a csatornákat szankcionálja, például a tartalmuk eltávolításával.
A Spotify viszont nem tette közzé az MI-alapú tartalmak címkézésére vonatkozó irányelvét. Gustav Söderström, a Spotify társelnöke és termék- és technológiai igazgatója egy interjúban azt hangsúlyozta, hogy az MI „növeli az emberek kreativitását”, mert több ember lehet kreatív, köszönhetően annak, hogy „nem kell finom motorikus képességekkel rendelkezni a zongorán”. Különbséget tett továbbá a teljes egészében MI-val generált zene és az olyan zene között, amelyben a technológiát csak részben használják. Azonban az egyetlen korlátozást, amelyet a mesterséges zene moderálásával kapcsolatban említett, a szerzői jogok megsértése volt - ami már évek óta vörös vonal minden streaming szolgáltatás számára. És egy ilyen jogsértést nagyon nehéz jogilag bizonyítani, ha mesterséges intelligencia is szerepet játszik benne.
Llano olyan intézkedéseket támogat, amelyek egyértelműen jelölik a tartalmakat. "Kell lennie egy jelölésnek, amely jelzi, hogy valami mesterséges intelligenciával készült-e. Ez nagyobb átláthatóságot biztosítana a felhasználók számára.” A Sussex Egyetem professzora kiemeli az egyik immateriális értéket, amely indokolja a tartalmak jelölését: „A művészetekben kapcsolatot tudunk létesíteni a művésszel; megismerhetjük az életét és azt, mi befolyásolta, hogy jobban megértsük a karrierjét. A mesterséges intelligenciával ez a kapcsolat már nem létezik.”
A Concubanas Rumba Congo című albuma 1,3 millió megtekintést ért el a YouTube-on. Nem ez az egyetlen fiktív zenekar, és nem is az egyetlen, amelynek háttértörténete van. A Phantasia zenekar (szintén egy nem valódi zenekar) fuvolák, elektronikus hangok és elektromos gitárok ötvözetét kínálja, amelyet egy leírás „japán progresszív jazz fúzióként” definiál. Hamis albumai több ezer lejátszást értek el. A mesterséges intelligencia által létrehozott zenekarnak még saját kitalált múltja is van. „Kobayashi Ryo 1976-os távozása után a Phantasia csendbe burkolózott” - olvasható az egyik videó leírásában. „Két évvel később a csoport a Divine Incarnation című albummal bukkant fel a sötétségből, ami a rajongók számára a zenekar „aranykorának” kezdetét jelentette.”
Mindkét hamis zenekar ugyanazon a csatornán, a Zarureten van, amelynek legrégebbi videói mindössze hét hónaposak. Ez idő alatt a csatorna 141 zenei videót tett közzé, amelyek közül sok több mint 30 perc hosszú. Nincsenek mozgóképek, csak borítóképek és MI által generált zene, melyet hosszú, MI által generált szöveg kísér. Minden videó leírásának végén található egy nyilatkozat a „módosított vagy szintetikus tartalomról”. A csatorna több millió megtekintést és 40 ezer feliratkozót gyűjtött.