Berta Sándor
Diploma a Wikipedia segítségével
Egyre több diák egyre gyakrabban használja fel az interneten található anyagokat, dokumentumokat, összefoglaló írásokat házi dolgozata vagy disszertációja elkészítéséhez.
Kijelölés, másolás, beillesztés. Ennyire egyszerű az interneten megtalált anyagok felhasználása és befűzése a házi dolgozatokba vagy tudományos munkába. A szakemberek évek óta megpróbálnak fellépni a rohamosan terjedő plágiumdivat ellen, kevés sikerrel. A Lipcsei Egyetem munkatársai által készített felmérésben a diákok 23 százaléka ismerte el, hogy a házi dolgozatok elkészítésekor felhasznált a világhálóról letöltött adatokat anélkül, hogy később megjelölte volna azok forrását. Voltak, akik a doktori munkájuk megalkotásakor is ezt a megoldást választották.
A weimari Bauhaus Egyetem kutatói egy olyan számítógépes programot fejlesztettek ki, amely minden eddiginél gyorsabban képes megállapítani egy adott szövegről, hogy az plágium-e vagy sem. "Immár tíz éve vannak hasonló szoftverek" - jelentette ki Martin Potthast, az egyetem informatikusa. Ő és a kollégái hozták létre a Picapica nevű alkalmazást, amely még arra is képes, hogy megmondja, ki módosította az adott anyagot.
A szoftver először digitális formába alakítja át a szöveget, majd keresni kezdi az interneten, hogy egy bekezdés vagy szövegrész honnan származhat. A kutatásnál a szöveg a leggyakrabban előforduló szavakat veszi figyelembe, ezek például egy autómotorokról szóló írásnál az autó, a motor, a benzin és a dízel. A tíz leggyakoribb szóra a szoftver a Google, a Yahoo és más programok segítségével rákeres. A vizsgált mű tartalmát a Picapica azonnal összehasonlítja a talált hasonló dokumentumokkal és jelöli az azonos részeket.
A program vizsgálja azt is, hogy a Wikipediában előfordulnak-e hasonló tartalmú írások. Ez csak úgy lehetséges, hogy a kutatók először az online lexikon minden angol és német nyelvű anyagát egyenként kiértékelték és az eredményeket eltárolták. Így maga az eljárás csupán néhány másodpercet vesz igénybe. Mivel az ellenőrzések és az értékelések során az úgynevezett Hash-értéket használják, ezért az sem jelent problémát, ha egyes Wikipedia-cikkek megváltoznak.
A szoftver minden szöveget száz szavas részekké vagdal szét, majd ezeket egy 30 statisztikai módszerből álló szűrővel vizsgálja át. Így kiderül például, hogy a leggyakrabban melyik betűvel kezdődnek a szavak. Az sem segít, ha valaki módosítja például a mondatrendet, az alkalmazás ugyanis ezt is felismeri. Végül a szakemberek kiértékelik a kapott eredményeket. A Picapica egyetlen hátránya, hogy kizárólag online forrásokat tud felhasználni, ennek ellenére igen hasznos.
"Már az a tény is, hogy a hallgatóink tudják, hogy plágium-kiszűrő programot használunk, sokakat elriaszt a szövegek bemásolásától" - mondta Niels Taubert, a Bielefeldi Egyetem szociológusa. Az intézményben a Turnitin nevű szoftvert használják. A szűrő alkalmazása előtt minden negyedik diák próbálkozott plágiummal, jelenleg már csak az öt százalékuk kíséreli meg a dolgot.
Kijelölés, másolás, beillesztés. Ennyire egyszerű az interneten megtalált anyagok felhasználása és befűzése a házi dolgozatokba vagy tudományos munkába. A szakemberek évek óta megpróbálnak fellépni a rohamosan terjedő plágiumdivat ellen, kevés sikerrel. A Lipcsei Egyetem munkatársai által készített felmérésben a diákok 23 százaléka ismerte el, hogy a házi dolgozatok elkészítésekor felhasznált a világhálóról letöltött adatokat anélkül, hogy később megjelölte volna azok forrását. Voltak, akik a doktori munkájuk megalkotásakor is ezt a megoldást választották.
A weimari Bauhaus Egyetem kutatói egy olyan számítógépes programot fejlesztettek ki, amely minden eddiginél gyorsabban képes megállapítani egy adott szövegről, hogy az plágium-e vagy sem. "Immár tíz éve vannak hasonló szoftverek" - jelentette ki Martin Potthast, az egyetem informatikusa. Ő és a kollégái hozták létre a Picapica nevű alkalmazást, amely még arra is képes, hogy megmondja, ki módosította az adott anyagot.
A szoftver először digitális formába alakítja át a szöveget, majd keresni kezdi az interneten, hogy egy bekezdés vagy szövegrész honnan származhat. A kutatásnál a szöveg a leggyakrabban előforduló szavakat veszi figyelembe, ezek például egy autómotorokról szóló írásnál az autó, a motor, a benzin és a dízel. A tíz leggyakoribb szóra a szoftver a Google, a Yahoo és más programok segítségével rákeres. A vizsgált mű tartalmát a Picapica azonnal összehasonlítja a talált hasonló dokumentumokkal és jelöli az azonos részeket.
A program vizsgálja azt is, hogy a Wikipediában előfordulnak-e hasonló tartalmú írások. Ez csak úgy lehetséges, hogy a kutatók először az online lexikon minden angol és német nyelvű anyagát egyenként kiértékelték és az eredményeket eltárolták. Így maga az eljárás csupán néhány másodpercet vesz igénybe. Mivel az ellenőrzések és az értékelések során az úgynevezett Hash-értéket használják, ezért az sem jelent problémát, ha egyes Wikipedia-cikkek megváltoznak.
A szoftver minden szöveget száz szavas részekké vagdal szét, majd ezeket egy 30 statisztikai módszerből álló szűrővel vizsgálja át. Így kiderül például, hogy a leggyakrabban melyik betűvel kezdődnek a szavak. Az sem segít, ha valaki módosítja például a mondatrendet, az alkalmazás ugyanis ezt is felismeri. Végül a szakemberek kiértékelik a kapott eredményeket. A Picapica egyetlen hátránya, hogy kizárólag online forrásokat tud felhasználni, ennek ellenére igen hasznos.
"Már az a tény is, hogy a hallgatóink tudják, hogy plágium-kiszűrő programot használunk, sokakat elriaszt a szövegek bemásolásától" - mondta Niels Taubert, a Bielefeldi Egyetem szociológusa. Az intézményben a Turnitin nevű szoftvert használják. A szűrő alkalmazása előtt minden negyedik diák próbálkozott plágiummal, jelenleg már csak az öt százalékuk kíséreli meg a dolgot.