SG.hu
Nagyon népszerű a Github Copilot, de jogot sérthet
A bíró szerint valóban megkérdőjelezhető a programozókat segítő mesterséges intelligencia-szolgáltatás jogszerűsége.
A GitHub Copilot hatalmas népszerűségnek örvend, jórészt ennek köszönhető, hogy a GitHub éves bevétele mostanra elérte az 1 milliárd dollárt. Jelenleg 90 millió aktív felhasználóval büszkélkedhet a platform, és az előfizetők számának ugrásszerű növekedése nagyrészt a Copilotnak köszönhető. A szolgáltatás gépi tanulási modelljét több milliárd nyilvánosan elérhető forráskódsoron képezték ki - beleértve a GitHub nyilvánosan elérhető kódjait is. Ez többek között magában foglalta az Apache Foundation számos projektjének összes kódját. Így nem meglepő, hogy Matthew Butterick ügyvéd, designer és fejlesztő a Joseph Saveri Ügyvédi Irodával együttműködve tavaly november 3-án csoportos keresetet nyújtottak be a Microsoft és partnerei ellen Kalifornia egyik kerületi bíróságán.
Követelésük szerint a Copilot mesterséges intelligencia alapú rendszert nyilvánosan hozzáférhető nyílt forráskódú, licencelt kódon képeztek ki, és bár a GitHub azt állítja, hogy a programozók számára előállított kód nem puszta másolat, a valóságban - a kereset szerint - pontosan erről van szó. "Az alperesek azt állítják, hogy a Codex és a Copilot nem tartanak meg másolatokat azokról az anyagokról, amelyeken képzik őket. A gyakorlatban azonban a kimenet gyakran a képzési adatokból származó kód közel azonos reprodukciója. A Codex nem azonosítja a végeredmény szerzői jogának tulajdonosát, nem tartalmaz sem szerzői jogi közleményt, sem a kimenethez csatolt licencfeltételeket." Röviden tehát azt állítják, hogy a Copilot csak egy szerzői jogokat sértő másoló.
A Microsoft nem vitathatja a tényeket, hiszen a Copilot nyílt forráskódon alapul. Az igazi kérdés az, hogy a tevékenységükkel sértettek-e szerzői jogokat, azaz ez "tisztességes felhasználás" vagy szellemi tulajdon lopás? "Ez az első lépés egy hosszú út során. Tudomásunk szerint ez az első csoportos kereset az Egyesült Államokban, amely az MI-rendszerek képzését és kimenetét támadja meg. Nem ez lesz az utolsó. Az MI-rendszerek nem mentesülnek a törvény alól. Azokat, akik ezeket a rendszereket létrehozzák és működtetik, felelősségre kell vonni." - nyilatkozta Butterick.
A Microsoftot, annak GitHub leányvállalatát és az OpenAI-t képviselő ügyvédek arra kérték a bírót, hogy utasítsa el a per befogadását azzal az indokkal, hogy az ellenük benyújtott kereset nem állja meg a helyét. Érvelésük szerint csak akkor fordulhatna a felperes a bírósághoz, ha valamilyen kárt szenvedett volna el. A védekező cégek ügyvédei szerint a felperesek nem említettek konkrét példákat arra, hogy a Copilot reprodukálta volna a saját kódjukat, és nem tudtak konkrét példákat megnevezni a másolásra a tankönyvekből vett példákon túl. A kereset a védelem szerint azért is hiányos, mert nem sorolja fel a törvény által előírt konkrét sérelmeket a perben megnevezett maroknyi vállalkozással szemben.
A Microsoft által beadott másik elutasítási indítvány hasonló érveket hoz fel. "A Copilot semmit sem von el a nyilvánosság számára elérhető nyílt forráskódú kódok közül, inkább segíti a fejlesztőket a kód megírásában azáltal, hogy javaslatokat generál az alapján, amit a nyilvános kódokból összegyűjtött teljes tudásanyagból tanult. Ezzel a Copilot a tanulás, a megértés és az együttműködés értékeit támogatja, amelyek a nyílt forráskódú etika alapját képezik. Azzal, hogy a felperesek a jogsértés megszüntetését és több milliárd dolláros kártérítést követelnek éppen a felperesek igyekeznek aláásni ezeket a nyílt forráskódú elveket, és megállítani az együttműködés és a fejlődés jelentős előrelépését."
Ezen a "nem mi vagyunk haszonlesők, hanem ők" érvelésen túl a Microsoft jogi csapata ragaszkodik ahhoz, hogy a GitHub felhasználói tudják, mire szerződnek, amikor elfogadják a kódot tároló cég szolgáltatási feltételeit, amelyek engedélyezik a nyilvános kód elemzését, indexelését és elemzését. "Minden GitHub-felhasználó tudatában van, hogy a nyilvános adattárban elhelyezett kód valóban nyilvános" - áll a Microsoft indítványában. "Bárki szabadon megvizsgálhatja, megtanulhatja és megértheti ezt a kódot, valamint különböző módokon újrahasznosíthatja. És ezzel a nyílt forráskód etikával összhangban sem a GitHub ÁSZF-je, sem pedig az általános nyílt forráskódú licencek egyike sem tiltja meg sem az embereknek, sem a számítógépeknek, hogy nyilvánosan elérhető kódot olvassanak és tanuljanak belőle."
A pert felügyelő bíró a felperes állításainak jórészét visszaküldte felülvizsgálatra. A Jon Tigar kerületi bíró által tegnap kiadott végzés rövid haladékként értelmezhető a GitHub, az anyavállalat Microsoft és annak több milliárd dolláros partnere, az OpenAI számára. A végzés azonban érintetlenül hagyja az ügy legjelentősebb aspektusait, miközben lehetővé teszi, hogy más állításokat jobban alátámasszanak egy felülvizsgált panaszban. A bíró elutasította a védelem azon kérelmét, hogy utasítsák el a felperesek azon állítását, miszerint a Codex kód reprodukálására való képessége a szoftverlicenc-használati feltételek megsértését jelenti. Elutasította továbbá a védelem azon törekvését, miszerint rendben volna, hogy a Copilot és a Codex a szerzői joggal védett kódot a szükséges szerzői jogkezelési információk - szerző, cím, tulajdonos, feltételek és így tovább - nélkül reprodukálja. Így a pereskedés legalábbis várhatóan folytatódni fog ezen állítások alapján.
A nyílt forráskód vezetői még mérlegelik a per következményeit. Az Open Source Initiative (OSI) veteránja, Simon Phipps szerint "az egyetlen dolog, amire a Copilottal kapcsolatban jelenleg biztonsággal lehet következtetni, hogy a jogi bizonytalanság miatt nem alkalmas a nyílt forráskódú projektekben való használatra". A veszélyek potenciálisan nagyok a Copilot-felhasználók számára is. Ha a GitHub ellen indított per győz, akkor a segítségével készített kód minden egyes darabkája nyílt forráskódú licencek hatálya alá kerülhet.
A GitHub Copilot hatalmas népszerűségnek örvend, jórészt ennek köszönhető, hogy a GitHub éves bevétele mostanra elérte az 1 milliárd dollárt. Jelenleg 90 millió aktív felhasználóval büszkélkedhet a platform, és az előfizetők számának ugrásszerű növekedése nagyrészt a Copilotnak köszönhető. A szolgáltatás gépi tanulási modelljét több milliárd nyilvánosan elérhető forráskódsoron képezték ki - beleértve a GitHub nyilvánosan elérhető kódjait is. Ez többek között magában foglalta az Apache Foundation számos projektjének összes kódját. Így nem meglepő, hogy Matthew Butterick ügyvéd, designer és fejlesztő a Joseph Saveri Ügyvédi Irodával együttműködve tavaly november 3-án csoportos keresetet nyújtottak be a Microsoft és partnerei ellen Kalifornia egyik kerületi bíróságán.
Követelésük szerint a Copilot mesterséges intelligencia alapú rendszert nyilvánosan hozzáférhető nyílt forráskódú, licencelt kódon képeztek ki, és bár a GitHub azt állítja, hogy a programozók számára előállított kód nem puszta másolat, a valóságban - a kereset szerint - pontosan erről van szó. "Az alperesek azt állítják, hogy a Codex és a Copilot nem tartanak meg másolatokat azokról az anyagokról, amelyeken képzik őket. A gyakorlatban azonban a kimenet gyakran a képzési adatokból származó kód közel azonos reprodukciója. A Codex nem azonosítja a végeredmény szerzői jogának tulajdonosát, nem tartalmaz sem szerzői jogi közleményt, sem a kimenethez csatolt licencfeltételeket." Röviden tehát azt állítják, hogy a Copilot csak egy szerzői jogokat sértő másoló.
A Microsoft nem vitathatja a tényeket, hiszen a Copilot nyílt forráskódon alapul. Az igazi kérdés az, hogy a tevékenységükkel sértettek-e szerzői jogokat, azaz ez "tisztességes felhasználás" vagy szellemi tulajdon lopás? "Ez az első lépés egy hosszú út során. Tudomásunk szerint ez az első csoportos kereset az Egyesült Államokban, amely az MI-rendszerek képzését és kimenetét támadja meg. Nem ez lesz az utolsó. Az MI-rendszerek nem mentesülnek a törvény alól. Azokat, akik ezeket a rendszereket létrehozzák és működtetik, felelősségre kell vonni." - nyilatkozta Butterick.
A Microsoftot, annak GitHub leányvállalatát és az OpenAI-t képviselő ügyvédek arra kérték a bírót, hogy utasítsa el a per befogadását azzal az indokkal, hogy az ellenük benyújtott kereset nem állja meg a helyét. Érvelésük szerint csak akkor fordulhatna a felperes a bírósághoz, ha valamilyen kárt szenvedett volna el. A védekező cégek ügyvédei szerint a felperesek nem említettek konkrét példákat arra, hogy a Copilot reprodukálta volna a saját kódjukat, és nem tudtak konkrét példákat megnevezni a másolásra a tankönyvekből vett példákon túl. A kereset a védelem szerint azért is hiányos, mert nem sorolja fel a törvény által előírt konkrét sérelmeket a perben megnevezett maroknyi vállalkozással szemben.
A Microsoft által beadott másik elutasítási indítvány hasonló érveket hoz fel. "A Copilot semmit sem von el a nyilvánosság számára elérhető nyílt forráskódú kódok közül, inkább segíti a fejlesztőket a kód megírásában azáltal, hogy javaslatokat generál az alapján, amit a nyilvános kódokból összegyűjtött teljes tudásanyagból tanult. Ezzel a Copilot a tanulás, a megértés és az együttműködés értékeit támogatja, amelyek a nyílt forráskódú etika alapját képezik. Azzal, hogy a felperesek a jogsértés megszüntetését és több milliárd dolláros kártérítést követelnek éppen a felperesek igyekeznek aláásni ezeket a nyílt forráskódú elveket, és megállítani az együttműködés és a fejlődés jelentős előrelépését."
Ezen a "nem mi vagyunk haszonlesők, hanem ők" érvelésen túl a Microsoft jogi csapata ragaszkodik ahhoz, hogy a GitHub felhasználói tudják, mire szerződnek, amikor elfogadják a kódot tároló cég szolgáltatási feltételeit, amelyek engedélyezik a nyilvános kód elemzését, indexelését és elemzését. "Minden GitHub-felhasználó tudatában van, hogy a nyilvános adattárban elhelyezett kód valóban nyilvános" - áll a Microsoft indítványában. "Bárki szabadon megvizsgálhatja, megtanulhatja és megértheti ezt a kódot, valamint különböző módokon újrahasznosíthatja. És ezzel a nyílt forráskód etikával összhangban sem a GitHub ÁSZF-je, sem pedig az általános nyílt forráskódú licencek egyike sem tiltja meg sem az embereknek, sem a számítógépeknek, hogy nyilvánosan elérhető kódot olvassanak és tanuljanak belőle."
A pert felügyelő bíró a felperes állításainak jórészét visszaküldte felülvizsgálatra. A Jon Tigar kerületi bíró által tegnap kiadott végzés rövid haladékként értelmezhető a GitHub, az anyavállalat Microsoft és annak több milliárd dolláros partnere, az OpenAI számára. A végzés azonban érintetlenül hagyja az ügy legjelentősebb aspektusait, miközben lehetővé teszi, hogy más állításokat jobban alátámasszanak egy felülvizsgált panaszban. A bíró elutasította a védelem azon kérelmét, hogy utasítsák el a felperesek azon állítását, miszerint a Codex kód reprodukálására való képessége a szoftverlicenc-használati feltételek megsértését jelenti. Elutasította továbbá a védelem azon törekvését, miszerint rendben volna, hogy a Copilot és a Codex a szerzői joggal védett kódot a szükséges szerzői jogkezelési információk - szerző, cím, tulajdonos, feltételek és így tovább - nélkül reprodukálja. Így a pereskedés legalábbis várhatóan folytatódni fog ezen állítások alapján.
A nyílt forráskód vezetői még mérlegelik a per következményeit. Az Open Source Initiative (OSI) veteránja, Simon Phipps szerint "az egyetlen dolog, amire a Copilottal kapcsolatban jelenleg biztonsággal lehet következtetni, hogy a jogi bizonytalanság miatt nem alkalmas a nyílt forráskódú projektekben való használatra". A veszélyek potenciálisan nagyok a Copilot-felhasználók számára is. Ha a GitHub ellen indított per győz, akkor a segítségével készített kód minden egyes darabkája nyílt forráskódú licencek hatálya alá kerülhet.