SG.hu

Reprodukálhatósági problémákat okoz az MI a tudományban

A brit Királyi Természettudományos Társaság, azaz a nagy presztízsű Royal Society tudósai arra figyelmeztetnek, hogy a mesterséges intelligencia alkalmazása a tudományban növeli a fontos eredmények megismételhetőségének problémáit. Az MI-modellek fekete dobozos jellege, a dokumentáció hiánya és a korlátozott hozzáférés a számítástechnikához akadályozza az eredmények megértésére irányuló erőfeszítéseket.

A 350 éves intézmény „A tudomány a mesterséges intelligencia korában” című jelentésében úgy érvel, hogy a mesterséges intelligencia bevezetése a tudományos kutatásba akadályozza a reprodukálhatóságot - vagyis azt, hogy egy adott eredményt a világ egy másik részén egy másik kutatócsoport megismételhessen - a dokumentáció hiánya, az alapvető számítástechnikai infrastruktúrákhoz és erőforrásokhoz való korlátozott hozzáférés, valamint a mesterséges intelligencia eszközök következtetései megértésének nehézségei miatt.

Eddig a technológiai ipar lelkesen hirdette azt az elképzelést, hogy a mesterséges intelligencia segíthet a tudományban. Tavaly decemberben kutatók azt állították, hogy a világ első tudományos felfedezését tették meg nagyméretű nyelvi modellek segítségével - ez az áttörés azt sugallta, hogy a ChatGPT-hez hasonló LLM-ek gyorsabban előremozdíthatják a kutatásokat, mint az emberek önmagukban. Alison Noble professzor, a Royal Society "Science in the Age of AI" munkacsoportjának elnöke azonban aggódik amiatt, hogy a mesterséges intelligencia gyors elterjedése a tudományban kihívások elé állítja a biztonságos és szigorú felhasználást. "Az eszközök szabadalmaztatott jellege miatt megismételhetetlen tanulmányok egyre növekvő száma aggályokat vet fel az MI-alapú felfedezések robusztusságával kapcsolatban” - jelentette ki.

A dokumentum figyelmeztet arra, hogy a mesterséges intelligenciára való támaszkodás a kutatásban „túlzott elvárásokhoz, eltúlzott pontossági állításokhoz vagy hamis összefüggéseken alapuló kutatási eredményekhez vezethet. A mesterséges intelligencián alapuló kutatások esetében egy vizsgálat reprodukálhatósága nemcsak a módszer megismétlését jelenti, hanem azt is, hogy képesek vagyunk reprodukálni a kódot, az adatokat és a környezeti feltételeket, amelyek mellett a kísérletet elvégezték (pl. számítástechnika, hardver, szoftver).”


A Royal Society-t 1660-ban alapították, és olyan tudósok tartoznak a korábbi elnökei közé, mint Isaac Newton, Humphry Davy vegyész vagy Ernest Rutherford, az atommag felfedezője. Dokumentumában a társaság arra figyelmeztet, hogy a reprodukálhatósági hibák nemcsak az egyes tanulmányok érvényességét veszélyeztetik, hanem a későbbi kutatásokat is torzíthatják. A Princeton Egyetem Statisztikai és Gépi Tanulás Központja által vezetett tanulmány szerint egyetlen kutatási projektben bekövetkező „adatszivárgás” - amely a gépi tanulási (machine learning) alkalmazásokban előforduló hibák egyik fő oka - 17 tudományterület 294 tanulmányát érintheti, köztük olyan nagy jelentőségű területeket, mint az orvostudomány.

A kereskedelmi környezetben kifejlesztett modellek tovább fokozhatják a problémát. „A legtöbb vezető LLM-et olyan nagy technológiai vállalatok fejlesztik, mint a Google, a Microsoft, a Meta és az OpenAI. Ezek a modellek szabadalmaztatott rendszerek, és mint ilyenek, korlátozott információkat tárnak fel a modellarchitektúrájukról, a képzési adatokról és a döntéshozatali folyamatokról, amelyek javítanák a megértést”. E kihívások kezelése érdekében a tudósoknak nyílt tudományos elveket kellene elfogadniuk - például az UNESCO nyílt tudományról szóló ajánlását. A tanulmány azt is javasolja, hogy a nagy kihívások - mint például az ML Reprodukálhatósági Kihívás, amely 11 vezető ML-konferencián megjelent publikációk reprodukálására szólítja fel a résztvevőket - segíthetnek.

Tavaly augusztusban a kutatók arra figyelmeztettek, hogy a gyenge adatminőség a mesterséges intelligencia alapú kutatásokban is problémát jelent, míg a mesterséges intelligencia által segített eredmények reprodukálásának nehézségei a mélytanulási modellek képzésének véletlenszerű vagy sztochasztikus megközelítéséből adódnak. A Stanford informatikai csoportja azzal érvelt, hogy a szabványosított benchmarkok és a kísérleti tervezés enyhítheti ezeket a problémákat. "A reprodukálhatóság javításának másik iránya a nyílt forráskódú kezdeményezések, amelyek nyílt modelleket, adatkészleteket és oktatási programokat tesznek közzé” - teszi hozzá a Royal Society kutatási tanulmánya.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • inkvisitor1978 #7
    Te talán még túl fiatal vagy hozzá, de a 2000-es évek elején volt egy Intel CPU, ami a sokadik tizedesben vétett egy apró számolási hibát.
    Ez nem tűnik komoly gondnak, amíg fel nem kezdett tűnni, hogy a körök nem körök, az iterációs számítások meg furcsa eredményeket hoznak.
    Végül vissza kellett hívni a szériát.
    Ha egy kutatási eredmény nem megismételhető máshol, akkor azt hamisnak kell tekinteni, mint az ED hajtóművet, amiről kiderült, hogy csak azért produkált egy laborban mérhető hajtóerőt látszólag reakciómentes működéssel, mert a falban futó kábelt használta ellenpontnak.
    Utoljára szerkesztette: inkvisitor1978, 2024.06.14. 10:36:13
  • ZenMillitia #6
    A fegyveriparos kerdesed pedig meg kemenyebb, nem latod, hanyszor provokalnak ki konflikutust, ill. huznak el,hogy jobban porogjon az ipar?
    Nezz mar korul neha a vilagban. Ukrajna mond valamit? Szerinted kinek kedvez,hogy felment az olaj ara? vagy hogy porog a fegyverbiznisz?
    Ja varj tudom, ez is kamu, igazabol a fegyveripar csak a laposfoldhivok altal kitalalt szervezet.
  • ZenMillitia #5
    nezz utana egy nagyon egyszeru kerdesnek:
    "hany millio dollart fizetett mar ki a pfizer csalasert?"
    Mert ha te ellopsz egy taskat, felfuggesztettet kapsz a masodiknal esetleg bortont.
    Ok meg csak annyi penzbuntetest, amit lazan ki tudnak fizetni.
    Tehat amikor hoznak egy dontest egy ilyen cegnel, nem azt nezik, Neked jobb lesz e, tulelsz e, vagy a csaladod tulel e, hanem azt,hogy a csalas soran, az adatok meghamisitasaert stb, a birsagot meghaladja e a profit.
    De persze hivhatod ezt maffia helyett, jotekonysagi szervezetnek, igazabol en lesz.rom, de nyugodtan keress ra, mennyi buntetest kapott mar. ;) bar nyilvan eletedben nem neztel meg utana semminek, es csak egy alufoliasapkasnak nezed azt, aki matekot szamol, de huzd ki a burokbol a fejed, es nezz korul kicsit, mielott ilyen kerdeseket teszel, fel, es ugy csinalnal, mintha NEM ERTENED.
    Utoljára szerkesztette: ZenMillitia, 2024.06.13. 15:42:26
  • csulok0000 #4
    Mi az a vakcinamaffia? És a másik?
  • ZenMillitia #3
    Pontosan. Kifejleszt egy uj anyagot, ami kemenyebb,mint a gyemant. letesztelik pont. kit erdekel,hogy a sok pokhendi vakcinamaffianak dolgozo, meg fegyverbizniszmaffianak nyalo idiota mit gondol a gombnyi agyaval?
  • Supra-III #2
    Hát, ja.
    Meg talán ki kellene próbálni a gyakorlatban: ha valami igaz, akkor kb mindegy, milyen útvonal vezetett a felfedezéséhez.
    Egészen pontosan hogyan akarnak érteni egy százezres vagy millió paraméteres algoritmust? Nekem még ez sem világos.

    Amúgy a sok modell pont alkalmas lehet arra, hogy egy problémát sokféleképpen próbáljunk megoldani - ami szerintem előny.

  • kvp #1
    Ha barmilyen allitast vagy kovetkeztetest elfogadnak pontos levezetes es indoklas nelkul, akkor ertheto a problema. Erdemes lenne raallni arra, hogy amit nem tud pontosan megindokolni egy MI (vagy ember), az max. sejtes lehet. A bizonyitas pedig nem hasznalhat MI-t es semmilyen nem publikus informaciot vagy eszkozt.