SG.hu
Egy bíró szerint az MI eltörölheti az eredeti művek piacát

Most kerülnek a bíróságok elé az évekkel ezelőtt benyújtott, az MI cégeket lopással megvádoló szerzői jogi keresetek, és elsőként a Metának kell bíróság előtt megküzdenie szerzők egy csoportjával. A San Franciscóban zajló per első napján a szövetségi bíró máris megkérdőjelezte a Meta érvelését, miszerint jogszerűen használhat engedély nélkül szerzői jogvédelem alatt álló műveket mesterséges intelligenciamodelljei betanításához.
Az ügy, amelyet mintegy tucatnyi szerző, köztük Ta-Nehisi Coates és Richard Kadrey indított, arra irányul, hogy az 1,4 billió dolláros közösségi médiaóriás a Llama MI-modellek betanítására használta a LibGen-t, egy több millió könyvet, tudományos cikket és képregényt tartalmazó úgynevezett árnyékkönyvtárat. Az ítéletnek széleskörű következményei lesznek a művészek és az MI-cégek között folyó ádáz szerzői jogi harcban, és egyike a világszerte folyó számos olyan pernek, amelyek azt állítják, hogy a technológiai csoportok engedély nélkül használnak fel tartalmakat. A Microsoft, az OpenAI és az Anthropic is hasonló jogi kihívásokkal néz szembe a népszerű mesterséges intelligencia chatbotjaik - például a ChatGPT és a Claude - mögött álló nagyméretű nyelvi modellek betanításához használt adatok miatt.
A mesterséges intelligencia ipar számára kulcsfontosságú kérdés első bírósági meghallgatásán Vince Chhabria amerikai kerületi bíró mindkét fél jogászait a Meta azon érveléséről faggatta, miszerint a társaság "tisztességesen használta fel” Junot Diaz, Sarah Silverman komikus és mások könyveit a Llama nevű nagy nyelvi modelljének betanításához. "A vállalatok szerzői jogvédelem alatt álló anyagokat használnak egy olyan termék létrehozására, amely végtelen számú konkurens termék előállítására alkalmas” - mondta Chhabria a Meta ügyvédeinek. "A cége drámaian megváltoztatja, mondhatni, eltörli az adott személy munkájának piacát, és azt mondja, hogy még csak licencet sem kell fizetniük az adott személynek. Egyszerűen nem értem, hogyan lehet ez tisztességes felhasználás” - mondta Chhabria.
A tisztességes felhasználás jogi doktrínája bizonyos körülmények között lehetővé teszi a szerzői joggal védett művek felhasználását a szerzői jog tulajdonosának engedélye nélkül. A Meta-ügyben a szerzők 2023-ban nyújtottak be keresetet, azzal érvelve, hogy a vállalat engedély vagy kártérítés nélkül használta fel könyveik kalózváltozatait a Llama kiképzéséhez. A LibGen a tartalom nagy részét a jogtulajdonosok engedélye nélkül tárolja. A jogi beadványokban a Meta megjegyzi, hogy „a felhasználás a megszerzés módjától függetlenül tisztességes volt”.
A technológiai vállalatok szerint ha a szerzői jogtulajdonosok számára fizetniük kellene a tartalmukért, hátráltathatja a fejlődő, több milliárd dolláros mesterséges intelligencia-ipart. Az alperesek szerint rendszereik tisztességesen használják a szerzői jogvédelem alatt álló anyagokat, mivel azokat tanulmányozva megtanulnak új tartalmakat létrehozni. A felperesek ellenvetése szerint viszont a mesterséges intelligenciával foglalkozó vállalatok jogellenesen másolják a munkájukat, hogy olyan konkurens tartalmakat hozzanak létre, amelyek veszélyeztetik a megélhetésüket.
Chhabria elismerte, hogy a Meta felhasználása lehet, hogy átalakító jellegű volt, de szerinte ezzel együtt még mindig nem biztos, hogy egyben tisztességes is. "Ez egy nagyon szokatlan esetnek tűnik abban az értelemben, hogy bár a másolás átalakító célt szolgál, a végeredmény nagy valószínűséggel a szerzői jogvédelem alatt álló művek piacának elárasztásához vezet” - mondta Chhabria. Megkérdezte Meta ügyvédjeit: "Mi lesz a következő Taylor Swifttel?" Ha a mesterséges intelligencia megkönnyíti a fiatal énekesnő hangzásának koppintását, hogyan tudna valaha is versenyezni, ha a mesterséges intelligencia "egymilliárd popdalt” gyárt az ő stílusában? Kannon Shanmugam, a Meta ügyvédje szerint a szerzői jogok tulajdonosai nem jogosultak „az ötletek piacán folyó versennyel szembeni védelemre”. "De ha én ellopok dolgokat az ötletek piacáról, hogy a saját ötleteimet fejlesszem, az szerzői jog megsértése, nem igaz?” - válaszolt kérdéssel Chhabria.
Chhabria azt is elmondta a felperesek ügyvédjének, David Boiesnak, hogy a perben talán nem foglalkoztak megfelelően a Meta magatartásának lehetséges piaci hatásaival. "Úgy gondolom, hogy a tisztességes felhasználás ezt elveszi, hacsak a felperes nem tudja bizonyítani, hogy a szerzői joggal védett művének piaca drámai mértékben sérül” - mondta Chhabria. A bíró bizonyítékot kért Boies-tól arra vonatkozóan, hogy a Llama alkotásai konkrétan miként befolyásolják a szerzők könyveinek piacát. "Úgy tűnik, mintha azt kérné tőlem, hogy találgassak, hogy Sarah Silverman könyveinek piacára milyen hatással lesz az a több milliárd dolog, amit a Llama végül képes lesz előállítani” - mondta Chhabria.
A per másik vitatott pontja az a módszer, amelyet a felperesek szerint a társaság a LibGen adatbázisának megszerzéséhez használt: a fájlokat torrenten töltötték le, amely technológia az anyagok letöltése közben a tartalmat más letöltőknek is feltölti. A bírósági dokumentumokban az áll, hogy a Meta megpróbálta korlátozni annak terjesztését, arról azonban még nem nyújtott biztosítékot, hogy ezt teljes mértékben megakadályozta, és a kimenő adatokkal kapcsolatos bizonyítékok egy részét törölték. A Meta azzal érvelt, hogy a szerzők „bevallottan nem rendelkeznek bizonyítékokkal arra vonatkozóan, hogy a cég valaha is feltöltötte volna bármelyik művüket, vagy e művek bármely azonosítható részét", ehelyett a torrentezés működésére alapozott szakértői becslésekre támaszkodnak. Chhabria szerint a torrentezés "eléggé zavarosnak tűnik”, de „a kérdés nem az, hogy valami zavaros-e, hanem az, hogy az szerzői jogok megsértése-e” - mondta Chhabria.
A bírósági beadványok szerint a Meta tárgyalásokat folytatott könyvkiadókkal a modellek betanításához szükséges anyagok licencelésének lehetőségeiről. A felperesek azt állítják, hogy a Meta elállt ettől, mivel a művek a LibGen-en keresztül is elérhetők voltak, ami a szerzők számára a kifizetések és az ellenőrzés elvesztéséhez vezetett. A bírósági felkészülési eljárás során előkerült e-mailek azonban azt mutatják, hogy a Meta alkalmazottai azt sugallják, hogy jogi szürke zónába léptek, és a keresetlevél szerint úgy tűnik, hogy megvitatták, hogyan kerüljék el a LibGen használatakor a vizsgálatot. Az egyik tavaly januári e-mailben Joelle Pineau, a Meta nemrég távozott vezetője, a FAIR mesterséges intelligencia-kutató laboratórium vezetője a LibGen adatkészlet használatát ajánlotta. E-mailje szerint "ha egyetlen könyvet is licencelünk, akkor nem tudunk a tisztességes felhasználási stratégiára támaszkodni”.
Egy későbbi e-mailben Sony Theakanath, a Meta termékigazgatója azt írta, hogy „semmiképpen sem hoznánk nyilvánosságra, hogy a libgenen képeztük ki magunkat”. Az e-mail alcíme az volt, hogy "jogi kockázat”, valamint egy másik alcíme „politikai kockázatok”, amely a „szerzői jog és szellemi tulajdonjog” kifejezést tartalmazta. Az e-mail olyan enyhítő intézkedéseket javasolt, mint például „távolítsuk el az egyértelműen kalózként/lopottként megjelölt adatokat”.
"A Meta olyan átalakító, nyílt forráskódú mesterséges intelligencia modelleket fejlesztett ki, amelyek hihetetlen innovációt, termelékenységet és kreativitást biztosítanak az egyének és a vállalatok számára. Ehhez elengedhetetlen a szerzői jogvédelem alatt álló anyagok tisztességes felhasználása” - áll a Meta közleményében. „Nem értünk egyet a felperesek állításaival, és a teljes jegyzőkönyv másról árulkodik. Továbbra is erőteljesen védekezni fogunk, és megvédjük a GenAI fejlesztését mindenki javára.”
Az ügy, amelyet mintegy tucatnyi szerző, köztük Ta-Nehisi Coates és Richard Kadrey indított, arra irányul, hogy az 1,4 billió dolláros közösségi médiaóriás a Llama MI-modellek betanítására használta a LibGen-t, egy több millió könyvet, tudományos cikket és képregényt tartalmazó úgynevezett árnyékkönyvtárat. Az ítéletnek széleskörű következményei lesznek a művészek és az MI-cégek között folyó ádáz szerzői jogi harcban, és egyike a világszerte folyó számos olyan pernek, amelyek azt állítják, hogy a technológiai csoportok engedély nélkül használnak fel tartalmakat. A Microsoft, az OpenAI és az Anthropic is hasonló jogi kihívásokkal néz szembe a népszerű mesterséges intelligencia chatbotjaik - például a ChatGPT és a Claude - mögött álló nagyméretű nyelvi modellek betanításához használt adatok miatt.
A mesterséges intelligencia ipar számára kulcsfontosságú kérdés első bírósági meghallgatásán Vince Chhabria amerikai kerületi bíró mindkét fél jogászait a Meta azon érveléséről faggatta, miszerint a társaság "tisztességesen használta fel” Junot Diaz, Sarah Silverman komikus és mások könyveit a Llama nevű nagy nyelvi modelljének betanításához. "A vállalatok szerzői jogvédelem alatt álló anyagokat használnak egy olyan termék létrehozására, amely végtelen számú konkurens termék előállítására alkalmas” - mondta Chhabria a Meta ügyvédeinek. "A cége drámaian megváltoztatja, mondhatni, eltörli az adott személy munkájának piacát, és azt mondja, hogy még csak licencet sem kell fizetniük az adott személynek. Egyszerűen nem értem, hogyan lehet ez tisztességes felhasználás” - mondta Chhabria.
A tisztességes felhasználás jogi doktrínája bizonyos körülmények között lehetővé teszi a szerzői joggal védett művek felhasználását a szerzői jog tulajdonosának engedélye nélkül. A Meta-ügyben a szerzők 2023-ban nyújtottak be keresetet, azzal érvelve, hogy a vállalat engedély vagy kártérítés nélkül használta fel könyveik kalózváltozatait a Llama kiképzéséhez. A LibGen a tartalom nagy részét a jogtulajdonosok engedélye nélkül tárolja. A jogi beadványokban a Meta megjegyzi, hogy „a felhasználás a megszerzés módjától függetlenül tisztességes volt”.
A technológiai vállalatok szerint ha a szerzői jogtulajdonosok számára fizetniük kellene a tartalmukért, hátráltathatja a fejlődő, több milliárd dolláros mesterséges intelligencia-ipart. Az alperesek szerint rendszereik tisztességesen használják a szerzői jogvédelem alatt álló anyagokat, mivel azokat tanulmányozva megtanulnak új tartalmakat létrehozni. A felperesek ellenvetése szerint viszont a mesterséges intelligenciával foglalkozó vállalatok jogellenesen másolják a munkájukat, hogy olyan konkurens tartalmakat hozzanak létre, amelyek veszélyeztetik a megélhetésüket.
Chhabria elismerte, hogy a Meta felhasználása lehet, hogy átalakító jellegű volt, de szerinte ezzel együtt még mindig nem biztos, hogy egyben tisztességes is. "Ez egy nagyon szokatlan esetnek tűnik abban az értelemben, hogy bár a másolás átalakító célt szolgál, a végeredmény nagy valószínűséggel a szerzői jogvédelem alatt álló művek piacának elárasztásához vezet” - mondta Chhabria. Megkérdezte Meta ügyvédjeit: "Mi lesz a következő Taylor Swifttel?" Ha a mesterséges intelligencia megkönnyíti a fiatal énekesnő hangzásának koppintását, hogyan tudna valaha is versenyezni, ha a mesterséges intelligencia "egymilliárd popdalt” gyárt az ő stílusában? Kannon Shanmugam, a Meta ügyvédje szerint a szerzői jogok tulajdonosai nem jogosultak „az ötletek piacán folyó versennyel szembeni védelemre”. "De ha én ellopok dolgokat az ötletek piacáról, hogy a saját ötleteimet fejlesszem, az szerzői jog megsértése, nem igaz?” - válaszolt kérdéssel Chhabria.
Chhabria azt is elmondta a felperesek ügyvédjének, David Boiesnak, hogy a perben talán nem foglalkoztak megfelelően a Meta magatartásának lehetséges piaci hatásaival. "Úgy gondolom, hogy a tisztességes felhasználás ezt elveszi, hacsak a felperes nem tudja bizonyítani, hogy a szerzői joggal védett művének piaca drámai mértékben sérül” - mondta Chhabria. A bíró bizonyítékot kért Boies-tól arra vonatkozóan, hogy a Llama alkotásai konkrétan miként befolyásolják a szerzők könyveinek piacát. "Úgy tűnik, mintha azt kérné tőlem, hogy találgassak, hogy Sarah Silverman könyveinek piacára milyen hatással lesz az a több milliárd dolog, amit a Llama végül képes lesz előállítani” - mondta Chhabria.

A per másik vitatott pontja az a módszer, amelyet a felperesek szerint a társaság a LibGen adatbázisának megszerzéséhez használt: a fájlokat torrenten töltötték le, amely technológia az anyagok letöltése közben a tartalmat más letöltőknek is feltölti. A bírósági dokumentumokban az áll, hogy a Meta megpróbálta korlátozni annak terjesztését, arról azonban még nem nyújtott biztosítékot, hogy ezt teljes mértékben megakadályozta, és a kimenő adatokkal kapcsolatos bizonyítékok egy részét törölték. A Meta azzal érvelt, hogy a szerzők „bevallottan nem rendelkeznek bizonyítékokkal arra vonatkozóan, hogy a cég valaha is feltöltötte volna bármelyik művüket, vagy e művek bármely azonosítható részét", ehelyett a torrentezés működésére alapozott szakértői becslésekre támaszkodnak. Chhabria szerint a torrentezés "eléggé zavarosnak tűnik”, de „a kérdés nem az, hogy valami zavaros-e, hanem az, hogy az szerzői jogok megsértése-e” - mondta Chhabria.
A bírósági beadványok szerint a Meta tárgyalásokat folytatott könyvkiadókkal a modellek betanításához szükséges anyagok licencelésének lehetőségeiről. A felperesek azt állítják, hogy a Meta elállt ettől, mivel a művek a LibGen-en keresztül is elérhetők voltak, ami a szerzők számára a kifizetések és az ellenőrzés elvesztéséhez vezetett. A bírósági felkészülési eljárás során előkerült e-mailek azonban azt mutatják, hogy a Meta alkalmazottai azt sugallják, hogy jogi szürke zónába léptek, és a keresetlevél szerint úgy tűnik, hogy megvitatták, hogyan kerüljék el a LibGen használatakor a vizsgálatot. Az egyik tavaly januári e-mailben Joelle Pineau, a Meta nemrég távozott vezetője, a FAIR mesterséges intelligencia-kutató laboratórium vezetője a LibGen adatkészlet használatát ajánlotta. E-mailje szerint "ha egyetlen könyvet is licencelünk, akkor nem tudunk a tisztességes felhasználási stratégiára támaszkodni”.
Egy későbbi e-mailben Sony Theakanath, a Meta termékigazgatója azt írta, hogy „semmiképpen sem hoznánk nyilvánosságra, hogy a libgenen képeztük ki magunkat”. Az e-mail alcíme az volt, hogy "jogi kockázat”, valamint egy másik alcíme „politikai kockázatok”, amely a „szerzői jog és szellemi tulajdonjog” kifejezést tartalmazta. Az e-mail olyan enyhítő intézkedéseket javasolt, mint például „távolítsuk el az egyértelműen kalózként/lopottként megjelölt adatokat”.
"A Meta olyan átalakító, nyílt forráskódú mesterséges intelligencia modelleket fejlesztett ki, amelyek hihetetlen innovációt, termelékenységet és kreativitást biztosítanak az egyének és a vállalatok számára. Ehhez elengedhetetlen a szerzői jogvédelem alatt álló anyagok tisztességes felhasználása” - áll a Meta közleményében. „Nem értünk egyet a felperesek állításaival, és a teljes jegyzőkönyv másról árulkodik. Továbbra is erőteljesen védekezni fogunk, és megvédjük a GenAI fejlesztését mindenki javára.”