SG.hu

MI által generált béna bizonyítások lepik el a matematikai fórumokat

Zseniális áttörések helyett zaj a matematika online tereiben, a szakmai közösségek a türelmük határára érkeztek.

A mesterséges intelligencia az elmúlt időszakban látványos sikereket ért el a matematikában, elég csak arra gondolni, hogy júliusban az International Mathematical Olympiad szintjén aranyéremnek megfelelő teljesítményt produkált. Ez a bravúr azonban nem kizárólag pozitív következményekkel járt. Egyre több matematikai szakfórumon tapasztalható, hogy az MI által generált tartalmak valósággal elárasztják a felületeket, és ezzel komoly gondokat okoznak a közösségeknek.

A jelenség nem teljesen új, inkább egy régi probléma felerősödése. Régóta létező gyakorlat, hogy amatőrök különféle fórumokon bejelentik, hogy megoldottak híres, évtizedek vagy akár évszázadok óta nyitott matematikai problémákat. Ilyen például a prímszámok eloszlásához kapcsolódó Riemann-sejtés, a bonyolultságelmélet egyik alapkérdéseként ismert P = NP probléma, vagy akár a Goldbach-sejtés és a Syracuse-sejtés, más néven a Collatz-probléma, amely az egész számok tulajdonságait vizsgálja. A Riemann-sejtés és a P = NP kérdés különösen híres, mivel a Clay Mathematics Institute 2000 óta egymillió dolláros, azaz körülbelül 850 ezer eurós jutalmat ajánl fel azoknak, akik bizonyítani tudják őket.

Minden hivatásos matematikus kapott már pályafutása során ilyen jellegű amatőr bizonyításokat, de az MI megjelenésével a helyzet új szintre lépett. Patrick Massot, a Paris-Saclay Egyetem professzora egy november 18-án, az Institut Henri-Poincaré-ban tartott, az MI és a matematika kapcsolatával foglalkozó kollokviumon így panaszkodott: „Most már szinte heti egy van belőlük!”. A professzor szerint ez az úgynevezett MI slop egyszerűen „időpocsékolás”. Massot egy olyan fórumot látogat rendszeresen, amely különösen vonzza azokat az amatőröket, akik hírnévre vágynak. A felület a Lean nevű szoftver köré szerveződik, amelyet úgynevezett bizonyításasszisztensként használnak, és egyben formális nyelv is, amely képes a logikai lépések hitelesítésére. Az MI-k tanulásuk során ezt a formális nyelvet is elsajátították, így első ránézésre helyesnek tűnő szövegeket tudnak előállítani, amelyek azonban szakmailag teljesen hibásak.

Erre jó példa egy október 11-i eset, amikor Poorla Hassanpour, aki független kutatóként mutatkozott be, közzétett egy állítólagos bizonyítást a Riemann-sejtésre, és kategorikusan kijelentette, hogy az „többé nem sejtés”. Az üzenetet gyorsan spamként kezelték, mivel a mellékelt kód még géppel sem volt olvasható, azaz nem lehetett lefordítani. Egy hónappal később az illető újra próbálkozott, de a szöveg továbbra is ugyanolyan hibás volt. Eközben egy másik független szerző, Serge Durand bejelentése is hasonló sorsra jutott, mivel a szerző nem tömte be azokat a logikai réseket, amelyek egy chatbot javaslatának egyszerű bemásolásából adódtak.

A helyzet ennél is kellemetlenebbé vált, amikor egy vita több napon át zajlott a terület elismert szakértői és egy újabb amatőr között, aki szemmel láthatóan chatbotot használt az érvelés fenntartására anélkül, hogy értette volna, miről van szó. Ez végül még a legtürelmesebb résztvevőket is felbosszantotta, és a moderátorok kénytelenek voltak törölni néhány különösen kemény hangvételű hozzászólást. Egy szakértő végül világosan elmagyarázta a meggondolatlan chatbotfelhasználónak, hogy „meg kell értened, hogy az MI legutóbbi fejlődése óta nincs olyan nap, hogy ne próbálna valaki chatbotkimeneteket zseniális áttörésként feltüntetni”.

Patrick Massot egy másik, szintén bosszantó példát is megemlített előadásában. Egy kezdő felhasználó tanácsot kért tőle a Lean használatához, mire a professzor egy könyvet ajánlott. Az „diák” azonban azzal válaszolt, hogy inkább promptokat és MI-t használna. Ez a hozzáállás jól mutatja, mennyire megváltozott a tanuláshoz és a tudás megszerzéséhez való viszony az MI térnyerésével.

Joel Riou, Massot egyik kollégája a Paris-Saclay Egyetemen - aki szintén moderátor és aktív hozzájáruló a fórumon - egy másik problémára hívta fel a figyelmet. A szoftver vagy annak dokumentációja javítására egyre több olyan hozzájárulás érkezik, amelyeket valószínűleg MI generált, és amelyek gyakran kevés valódi értéket hordoznak. Ahogy ő fogalmazott: „jó szándékúak, de energiafaló a moderátor csapat számára, az időnket valószínűleg máshol jobban fel lehetne használni”. Ez a helyzet nem egyedi, hanem sok más szabad szoftver esetében is megfigyelhető, amelyek fejlesztése önkéntes közösségeken alapul.

Ezekben a közösségekben sokan azért járulnak hozzá a munkához, hogy szebbé tegyék az önéletrajzukat. Vannak tapasztalt fejlesztők is, akik MI segítségével dolgoznak, de ezt nyíltan vállalják. A probléma ott kezdődik, amikor az MI használata rejtve marad, és a közösségnek kell viselnie az ebből fakadó terheket. A matematikai fórumok példája jól mutatja, mennyire kényes egyensúlyt kell találni az új technológiák kihasználása és a szakmai minőség megőrzése között.

Hozzászólások

A témához csak regisztrált és bejelentkezett látogatók szólhatnak hozzá!
Bejelentkezéshez klikk ide
(Regisztráció a fórum nyitóoldalán)
  • _svd_ #3
    Ehhez képest Erdős Pál matematikus problémái közül kettőt oldott meg a chatGPT.
    Január 10.-én, a 205. számút. Ez már korábban megoldott volt.
    Január 17.-én a GPT 2.5 Pro teljes megoldást talált a 652. számú problémára. Ennek külön jelentősége van. Ezt eddig nem volt képes megoldani ember és eszköz.

    https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems#2-fully-ai-generated-solutions-to-problems-for-which-subsequent-literature-review-found-full-or-partial-solutions
    https://zeyu-zheng.github.io/blog/erd%C5%91sConjectures.html
  • kvp #2
    Azert mar volt ilyen helyzet, amikor a szabadalmi hivatalhoz erkeztek nagy mennyisegben az orokmozgokrol szolo talalmanyok. Erre ket modon lehet valaszolni, vagy csak a mukodo talalmanyokat fogadjuk el vagy a legnagyobb hulyesegeket is, ha azok egyediek. A tudomanyos eletben az utobbi megkozelites ki van zarva. Gyakorlatilag az MI lehetove tette, hogy nagyon kis koltseggel DOS-oljanak teljes tudomanyos kozossegeket es jelenleg nincs jo megoldas a tenyleges tudosok es a generalt szemet megkulonboztetesere. (a white list elv kivetelevel, de az mas problemakat vet fel)
  • coolbboy83 #1
    Igen... és amikor egyetemi vizsgán a táblánál kell megoldani a feladatot, akkor "geci a tanár" mert nem lehet puskázni a GPT_vel...