SG.hu
Az OpenAI szerzői jogi rémálmot vett a nyakába a GPT Store-ral
Egy kiadó szerint az OpenAI GPT Store-ban található néhány chatbotot az ő szerzői jogvédett tankönyvei felhasználásával hoztak létre. Az OpenAI már eltávolított néhány botot, de számos jogtulajdonos nem elégedett a helyzettel.
Az OpenAI "szoftverboltjában", a GPT Store-ban kínált chatbotok ugyanazon a technológián alapulnak, mint a cég saját ChatGPT-je, de külső fejlesztők készítik őket meghatározott funkciókhoz. A fejlesztő a saját botjának testreszabásához további információkat tölthet fel, amelyeket az OpenAI technológiájába épített tudás kiegészítésére használhat fel. Azt a folyamatot, amelynek során ezeket a kiegészítő információkat a személy kérdéseire való válaszadáshoz lekérdezik, retrieval-augmented generationnek, azaz RAG-nak nevezik. A probléma az, hogy aGPT Store-ban található botok mögött lévő RAG-fájlok a szerzői joggal védett, engedély nélkül feltöltött anyagok melegágyai.
A Praxis nevű dán tankönyvgyártó kiadó igazgatója, Morten Blichfeldt Andersen az elmúlt hónapokban sok órát töltött az OpenAI boltjának átvizsgálásával. A januárban indult, testreszabott robotok piactere hasznos és néha furcsa MI-eszközök garmadáját tartalmazza. A rajzfilmgenerátorok New Yorker-stílusú illusztrációkat és anime stílusú rajzokat gyártanak, a programozási és írási asszisztensek gyorsbillentyűket kínálnak a kódok és az esszék elkészítéséhez. Van színelemző robot, pókazonosító és RizzGPT nevű társkereső edző is. Blichfeldt Andersen mégis csak egy nagyon speciális típusú botra vadászik: azokra, amelyek cége szerzői jogvédelem alatt álló tankönyveire épülnek.
"Személyesen keresem a jogsértéseket és jelentem őket" - mondja Blichfeldt Andersen. "Folyamatosan jönnek újabbak." Gyanúja szerint a bűnösök elsősorban fiatalok, akik tankönyvekből töltik fel az anyagot, hogy egyéni botokat hozzanak létre, amelyeket osztálytársaikkal osztanak meg. Véleménye szerint a GPT Store-ban található jogsértő botok csak egy apró töredékét fedezte fel. "A jéghegy csúcsa" - mondja Blichfeldt Andersen.
Morten Blichfeldt Andersen
A GPT Store-ban könnyű olyan botokat találni, amelyek leírása arra utal, hogy valamilyen módon szerzői jogvédett tartalmakat csapolnak meg. A szerzői jogi védelem alatt álló anyagok engedély nélküli felhasználása bizonyos kontextusokban megengedett, más esetekben azonban a tulajdonosok jogi lépéseket tehetnek. Van benne Westeros Writer nevű GPT-t, amely azt állítja, hogy "úgy ír, mint George R. R. Martin", a Trónok harca alkotója. Egy másik, az Atwood hangja azt állítja, hogy Margaret Atwood írónőt utánozza, a Write Like Stephen pedig Stephen Kinget hivatott utánozni. Ez utóbbi képes szó szerint reprodukálni részleteket az író On Writing című memoárjából, még azt is megjegyezve, hogy melyik oldalról származik az anyag.
Kayla Wood, az OpenAI szóvivője szerint a cég foglalkozik a szerzői jogvédelem alatt álló tartalmakkal készült GPT-k elleni törlési kérelmekre és azt is elmondta, hogy a vállalat proaktívan keresi a problémás GPT-ket. "Automatizált rendszerek, emberi felülvizsgálat és felhasználói jelentések kombinációját használjuk arra, hogy megtaláljuk és értékeljük az olyan GPT-ket, amelyek potenciálisan sértik az irányelveinket, beleértve a harmadik féltől származó tartalmak szükséges engedély nélküli felhasználását" - mondja Wood.
A GPT áruház szerzői jogi problémái tovább növelik az OpenAI meglévő jogi problémáit. A vállalatnak számos nagy horderejű perrel kell szembenéznie, amelyekben szerzői jogok megsértését kérik rajta számon. Ezek között van egy a The New York Times által indított per, valamint több olyan per, amelyet különböző szépirodalmi és nem szépirodalmi szerzők csoportjai indítottak, köztük olyan nagy nevek, mint George R.R. Martin. Az OpenAI feltételei a GPT Store-ra vonatkozóan kifejezetten tiltják "a harmadik féltől származó tartalom felhasználását a szükséges engedélyek nélkül", de jelenleg nincs mód arra, hogy a kívülállók ellenőrizhessék, hogy a GPT-ket létrehozó fejlesztők feltöltöttek-e szerzői joggal védett anyagokat. Ez azt jelenti, hogy az érintett jogtulajdonosoknak vadászniuk kell.
Blichfeldt Andersen kulcsszavak segítségével fésüli át a GPT Store-t olyan chatbotok után, amelyek esetleg az ő cégének könyveiből származó anyagot használnak. Ezután minden egyes bottal, amelyet talál, beszélgetnie kell, hogy megpróbálja kideríteni, vajon a Praxis-könyvek alapján képezték-e ki. Ez fárasztó munka, de eredményes: több robotot is sikeresen rávett, hogy reprodukáljon bizonyos részeket a Praxis tankönyvekből. "Be kell csapni a nyelvi modellt, hogy felfedje magát" - mondja.
A perek, amelyekben az OpenAI-t azzal vádolják, hogy szerzői jogvédelem alatt álló anyagokat szerzett be engedély nélkül a rendszerei képzése céljából, évekig tarthatnak, de a GPT Store-ba feltöltött anyagokkal kapcsolatos vitáknak közvetlenebb következményei lehetnek. "A GPT-k a szerzői jog szempontjából fontos módon változtatják meg az OpenAI és a felhasználók közötti kapcsolatot" - mondja James Grimmelmann, a Cornell Egyetem jogászprofesszora.
Amikor az online platformok lehetővé teszik a felhasználók számára, hogy saját tartalmakat töltsenek fel - például a YouTube lehetővé teszi a hétköznapi emberek számára, hogy személyes videókat tegyenek közzé -, akkor a Digital Millennium Copyright Act (DMCA) hatálya alá tartoznak, amely az amerikai szerzői jogi törvény része, és amely lehetővé teszi a szerzői jogtulajdonosok számára, hogy panaszt tegyenek, ha szellemi tulajdonukat az engedélyük nélkül terjesztik. Ha tehát mondjuk egy YouTuber olyan klipet tesz közzé, amelynek hátterében olyan zene van, amelyet nem engedélyezett, a zenei kiadók néha panaszt tesznek és a videókat eltávolíttatják. Mivel a GPT Store lehetővé teszi a fejlesztők számára, hogy feltöltsék munkáikat, ezekre a szabályokra is vonatkoznak ezek a szabályok.
A kalózkodás elleni törvénynek szánt Digital Millennium Copyright Act nagy jelentőséggel bír a szerzői jogok érvényesítésében, mivel a szerzői jogtulajdonosok számára egy viszonylag gyors módszert biztosít arra, hogy követelhessék munkájuk eltávolítását, ha az emberek engedélyük nélkül teszik fel azt az internetre. Miután Blichfeldt Andersen megtalálta az első néhány példát a Praxis tankönyvekből a GPT Store-ban, DMCA letiltási értesítéseket küldött az OpenAI-nak. Elmondása szerint a vállalat nem válaszolt, amíg meg nem kérte a dániai kreatív munkavállalók érdekeit képviselő jogi szövetséget, a DRA-t, hogy segítsen. A DRA keményen fellép a tagok szerzői jogainak védelme érdekében: tavaly DMCA letiltási értesítések benyújtásával elérte, hogy egy több mint 196 000 könyvből álló, a generatív mesterséges intelligencia képzéséhez használt gyűjteményt ideiglenesen offline állapotba helyezzenek.
Thomas Heldrup, a DRA tartalomvédelemért és jogérvényesítésért felelős vezetője gyakran vezet a mesterséges intelligenciával kapcsolatos keresztes hadjáratokat. A GPT Store elleni küzdelemben is központi szerepet játszott, mivel a Praxis nevében panaszt nyújtott be, aminek eredményeképpen az OpenAI eltávolította a kiadó által jogsértőnek ítélt robotokat. "Elég gyorsan eltávolították a jogsértő GPT-ket, amelyeket jelentettünk nekik" - mondja Heldrup. Ennek ellenére szeretné, ha a vállalat változtatásokat eszközölne. "Jobb eszközökre van szükség a jogtulajdonosok rendelkezésére, hogy felkutathassák ezeket a jogsértő GPT-ket" - mondja Heldrup.
Blichfeldt Andersen szerint a Praxis be fogja perelni az OpenAI-t, ha a GPT Store helyzete nem javul. Szeretné, ha a vállalat és más MI-fejlesztők olyan robusztusabb rendszereket építenének, amelyek a feltöltött RAG-tartalmakban a szerzői jogvédett anyagokat keresik, hasonlóan a Content ID rendszerhez, amely a YouTube-on megjelenő szerzői jogvédett anyagok védelmét szolgálja. Már most megjelentek olyan startupok, amelyek felajánlják, hogy segítenek az MI-cégeknek a jogsértő kimenetek átvizsgálásában. Anand Kannappan, a Patronus AI vezérigazgatója és alapítója szerint a nemrégiben indított Copyright Catcher szolgáltatásuk, amelyet a szerzői jogi védelem alatt álló szövegek felismerésére terveztek, "abszolút" képes felismerni a potenciális jogsértést az egyéni GPT-kben.
Sam Altman a 32. percben mutatja be a GPT-k működését
De bár az OpenAI eleget tett néhány, a GPT Store-ra irányuló DMCA letiltási kérelemnek, néhány szellemi tulajdonjogi szakértő úgy véli, hogy a vállalat azzal érvelhet, hogy a tisztességes felhasználás fogalma védi a szerzői jogvédelem alatt álló művekre támaszkodó egyes GPT-ket. "Szerintem nagyon elhamarkodott lenne azt mondani, hogy ezekbe az eszközökbe nem lehet engedély nélkül feltölteni semmit, ami szerzői jogvédelem alatt áll, mert ez kizárja a rendkívül fontos oktatási és kutatási funkciókat" - mondja Meredith Jacob, az American University Washington College of Law szerzői joggal és nyílt licenceléssel foglalkozó projektigazgatója. Úgy látja, hogy a diákoknak a tankönyvek megértését segítő GPT-k létrehozása olyan dolog, amelyet könnyen védhet a tisztességes felhasználás.
Mivel a kívülállók számára nincs egyszerű módja annak, hogy lássák, mit töltöttek fel a GPT Store botok kiegészítő fájljaiba, a jogsértések miatt aggódó szerzői jogi jogosultaknak vagy abban kell bízniuk, hogy az OpenAI automatizált rendszerei észlelik a jogsértéseket - vagy pedig időigényes módon minden egyes gyanús botot külön-külön ki kell vizsgálniuk. "Olyan ez, mint tűt találni a szénakazalban" - mondja Blichfeldt Andersen.
Az OpenAI "szoftverboltjában", a GPT Store-ban kínált chatbotok ugyanazon a technológián alapulnak, mint a cég saját ChatGPT-je, de külső fejlesztők készítik őket meghatározott funkciókhoz. A fejlesztő a saját botjának testreszabásához további információkat tölthet fel, amelyeket az OpenAI technológiájába épített tudás kiegészítésére használhat fel. Azt a folyamatot, amelynek során ezeket a kiegészítő információkat a személy kérdéseire való válaszadáshoz lekérdezik, retrieval-augmented generationnek, azaz RAG-nak nevezik. A probléma az, hogy aGPT Store-ban található botok mögött lévő RAG-fájlok a szerzői joggal védett, engedély nélkül feltöltött anyagok melegágyai.
A Praxis nevű dán tankönyvgyártó kiadó igazgatója, Morten Blichfeldt Andersen az elmúlt hónapokban sok órát töltött az OpenAI boltjának átvizsgálásával. A januárban indult, testreszabott robotok piactere hasznos és néha furcsa MI-eszközök garmadáját tartalmazza. A rajzfilmgenerátorok New Yorker-stílusú illusztrációkat és anime stílusú rajzokat gyártanak, a programozási és írási asszisztensek gyorsbillentyűket kínálnak a kódok és az esszék elkészítéséhez. Van színelemző robot, pókazonosító és RizzGPT nevű társkereső edző is. Blichfeldt Andersen mégis csak egy nagyon speciális típusú botra vadászik: azokra, amelyek cége szerzői jogvédelem alatt álló tankönyveire épülnek.
"Személyesen keresem a jogsértéseket és jelentem őket" - mondja Blichfeldt Andersen. "Folyamatosan jönnek újabbak." Gyanúja szerint a bűnösök elsősorban fiatalok, akik tankönyvekből töltik fel az anyagot, hogy egyéni botokat hozzanak létre, amelyeket osztálytársaikkal osztanak meg. Véleménye szerint a GPT Store-ban található jogsértő botok csak egy apró töredékét fedezte fel. "A jéghegy csúcsa" - mondja Blichfeldt Andersen.
Morten Blichfeldt Andersen
A GPT Store-ban könnyű olyan botokat találni, amelyek leírása arra utal, hogy valamilyen módon szerzői jogvédett tartalmakat csapolnak meg. A szerzői jogi védelem alatt álló anyagok engedély nélküli felhasználása bizonyos kontextusokban megengedett, más esetekben azonban a tulajdonosok jogi lépéseket tehetnek. Van benne Westeros Writer nevű GPT-t, amely azt állítja, hogy "úgy ír, mint George R. R. Martin", a Trónok harca alkotója. Egy másik, az Atwood hangja azt állítja, hogy Margaret Atwood írónőt utánozza, a Write Like Stephen pedig Stephen Kinget hivatott utánozni. Ez utóbbi képes szó szerint reprodukálni részleteket az író On Writing című memoárjából, még azt is megjegyezve, hogy melyik oldalról származik az anyag.
Kayla Wood, az OpenAI szóvivője szerint a cég foglalkozik a szerzői jogvédelem alatt álló tartalmakkal készült GPT-k elleni törlési kérelmekre és azt is elmondta, hogy a vállalat proaktívan keresi a problémás GPT-ket. "Automatizált rendszerek, emberi felülvizsgálat és felhasználói jelentések kombinációját használjuk arra, hogy megtaláljuk és értékeljük az olyan GPT-ket, amelyek potenciálisan sértik az irányelveinket, beleértve a harmadik féltől származó tartalmak szükséges engedély nélküli felhasználását" - mondja Wood.
A GPT áruház szerzői jogi problémái tovább növelik az OpenAI meglévő jogi problémáit. A vállalatnak számos nagy horderejű perrel kell szembenéznie, amelyekben szerzői jogok megsértését kérik rajta számon. Ezek között van egy a The New York Times által indított per, valamint több olyan per, amelyet különböző szépirodalmi és nem szépirodalmi szerzők csoportjai indítottak, köztük olyan nagy nevek, mint George R.R. Martin. Az OpenAI feltételei a GPT Store-ra vonatkozóan kifejezetten tiltják "a harmadik féltől származó tartalom felhasználását a szükséges engedélyek nélkül", de jelenleg nincs mód arra, hogy a kívülállók ellenőrizhessék, hogy a GPT-ket létrehozó fejlesztők feltöltöttek-e szerzői joggal védett anyagokat. Ez azt jelenti, hogy az érintett jogtulajdonosoknak vadászniuk kell.
Blichfeldt Andersen kulcsszavak segítségével fésüli át a GPT Store-t olyan chatbotok után, amelyek esetleg az ő cégének könyveiből származó anyagot használnak. Ezután minden egyes bottal, amelyet talál, beszélgetnie kell, hogy megpróbálja kideríteni, vajon a Praxis-könyvek alapján képezték-e ki. Ez fárasztó munka, de eredményes: több robotot is sikeresen rávett, hogy reprodukáljon bizonyos részeket a Praxis tankönyvekből. "Be kell csapni a nyelvi modellt, hogy felfedje magát" - mondja.
A perek, amelyekben az OpenAI-t azzal vádolják, hogy szerzői jogvédelem alatt álló anyagokat szerzett be engedély nélkül a rendszerei képzése céljából, évekig tarthatnak, de a GPT Store-ba feltöltött anyagokkal kapcsolatos vitáknak közvetlenebb következményei lehetnek. "A GPT-k a szerzői jog szempontjából fontos módon változtatják meg az OpenAI és a felhasználók közötti kapcsolatot" - mondja James Grimmelmann, a Cornell Egyetem jogászprofesszora.
Amikor az online platformok lehetővé teszik a felhasználók számára, hogy saját tartalmakat töltsenek fel - például a YouTube lehetővé teszi a hétköznapi emberek számára, hogy személyes videókat tegyenek közzé -, akkor a Digital Millennium Copyright Act (DMCA) hatálya alá tartoznak, amely az amerikai szerzői jogi törvény része, és amely lehetővé teszi a szerzői jogtulajdonosok számára, hogy panaszt tegyenek, ha szellemi tulajdonukat az engedélyük nélkül terjesztik. Ha tehát mondjuk egy YouTuber olyan klipet tesz közzé, amelynek hátterében olyan zene van, amelyet nem engedélyezett, a zenei kiadók néha panaszt tesznek és a videókat eltávolíttatják. Mivel a GPT Store lehetővé teszi a fejlesztők számára, hogy feltöltsék munkáikat, ezekre a szabályokra is vonatkoznak ezek a szabályok.
A kalózkodás elleni törvénynek szánt Digital Millennium Copyright Act nagy jelentőséggel bír a szerzői jogok érvényesítésében, mivel a szerzői jogtulajdonosok számára egy viszonylag gyors módszert biztosít arra, hogy követelhessék munkájuk eltávolítását, ha az emberek engedélyük nélkül teszik fel azt az internetre. Miután Blichfeldt Andersen megtalálta az első néhány példát a Praxis tankönyvekből a GPT Store-ban, DMCA letiltási értesítéseket küldött az OpenAI-nak. Elmondása szerint a vállalat nem válaszolt, amíg meg nem kérte a dániai kreatív munkavállalók érdekeit képviselő jogi szövetséget, a DRA-t, hogy segítsen. A DRA keményen fellép a tagok szerzői jogainak védelme érdekében: tavaly DMCA letiltási értesítések benyújtásával elérte, hogy egy több mint 196 000 könyvből álló, a generatív mesterséges intelligencia képzéséhez használt gyűjteményt ideiglenesen offline állapotba helyezzenek.
Thomas Heldrup, a DRA tartalomvédelemért és jogérvényesítésért felelős vezetője gyakran vezet a mesterséges intelligenciával kapcsolatos keresztes hadjáratokat. A GPT Store elleni küzdelemben is központi szerepet játszott, mivel a Praxis nevében panaszt nyújtott be, aminek eredményeképpen az OpenAI eltávolította a kiadó által jogsértőnek ítélt robotokat. "Elég gyorsan eltávolították a jogsértő GPT-ket, amelyeket jelentettünk nekik" - mondja Heldrup. Ennek ellenére szeretné, ha a vállalat változtatásokat eszközölne. "Jobb eszközökre van szükség a jogtulajdonosok rendelkezésére, hogy felkutathassák ezeket a jogsértő GPT-ket" - mondja Heldrup.
Blichfeldt Andersen szerint a Praxis be fogja perelni az OpenAI-t, ha a GPT Store helyzete nem javul. Szeretné, ha a vállalat és más MI-fejlesztők olyan robusztusabb rendszereket építenének, amelyek a feltöltött RAG-tartalmakban a szerzői jogvédett anyagokat keresik, hasonlóan a Content ID rendszerhez, amely a YouTube-on megjelenő szerzői jogvédett anyagok védelmét szolgálja. Már most megjelentek olyan startupok, amelyek felajánlják, hogy segítenek az MI-cégeknek a jogsértő kimenetek átvizsgálásában. Anand Kannappan, a Patronus AI vezérigazgatója és alapítója szerint a nemrégiben indított Copyright Catcher szolgáltatásuk, amelyet a szerzői jogi védelem alatt álló szövegek felismerésére terveztek, "abszolút" képes felismerni a potenciális jogsértést az egyéni GPT-kben.
Sam Altman a 32. percben mutatja be a GPT-k működését
De bár az OpenAI eleget tett néhány, a GPT Store-ra irányuló DMCA letiltási kérelemnek, néhány szellemi tulajdonjogi szakértő úgy véli, hogy a vállalat azzal érvelhet, hogy a tisztességes felhasználás fogalma védi a szerzői jogvédelem alatt álló művekre támaszkodó egyes GPT-ket. "Szerintem nagyon elhamarkodott lenne azt mondani, hogy ezekbe az eszközökbe nem lehet engedély nélkül feltölteni semmit, ami szerzői jogvédelem alatt áll, mert ez kizárja a rendkívül fontos oktatási és kutatási funkciókat" - mondja Meredith Jacob, az American University Washington College of Law szerzői joggal és nyílt licenceléssel foglalkozó projektigazgatója. Úgy látja, hogy a diákoknak a tankönyvek megértését segítő GPT-k létrehozása olyan dolog, amelyet könnyen védhet a tisztességes felhasználás.
Mivel a kívülállók számára nincs egyszerű módja annak, hogy lássák, mit töltöttek fel a GPT Store botok kiegészítő fájljaiba, a jogsértések miatt aggódó szerzői jogi jogosultaknak vagy abban kell bízniuk, hogy az OpenAI automatizált rendszerei észlelik a jogsértéseket - vagy pedig időigényes módon minden egyes gyanús botot külön-külön ki kell vizsgálniuk. "Olyan ez, mint tűt találni a szénakazalban" - mondja Blichfeldt Andersen.