Sg.hu - Lassan bedobjuk lapjainkat az MI ellen

2008. december 02. 6:35, kedd

Hunter

Lassan bedobjuk lapjainkat az MI ellen

Idén újabb lépcsőfokhoz érkezett a mesterséges intelligencia. A helyszín kissé szokatlan ugyanakkor stílszerű volt, a Las Vegas-i Rio All-Suite Hotel & Casino pókerasztala, ahol egy számítógépes program, a Polaris először győzte le az embert egy olyan játékban, ahol nem a nyers számítási erő a döntő. A géppel egy asztalhoz ülők dörzsölt pókerezők, akik mindegyike 1 millió dollár feletti nyereményekkel büszkélkedett.

Többen csak úgy tekintettek a gép diadalára, mint a szilícium újabb előrenyomulására, amivel idővel felsőbbrendűvé válhat az emberekkel szemben. Bosszantó. Vannak azonban olyanok is, akik az MI egy izgalmas előrelépéseként tekintenek az eseményre - egy kis kóstolóként azokba a kifinomult feladatokba, aminek elvégzésére a számítógépek a közeli jövőben képesek lesznek.

1997-ben az IBM Deep Blue szuperszámítógépe volt az első gép, ami egy teljes mérkőzésben térdre kényszerített egy hús-vér sakk-világbajnokot, név szerint Gari Kaszparovot, tavaly pedig a malom játékban tökéletesre hangolt, gyakorlatilag verhetetlen programról számoltunk be. Ezeknek a játékoknak azonban van egy közös vonásuk: a jó matematikai képességű játékoknak kedveznek, márpedig a számítógépek ilyen téren elég jó helyzetben vannak. A póker azonban egészen más világ. Ez a ravaszság, a blöff és a csalás játéka, ami elég távol áll azoktól a dolgoktól, amivel eddig az alaplapokat és a processzorokat összefüggésbe hoztuk, ezért is értékes a Polaris győzelme az MI számára.

A diadal azonban nem nevezhető teljesnek, nem szabad leírni az emberi játékosokat, mivel a Polaris a Texas hold'em egy egyszerűsített változatában, az egy-egy elleni limit hold'emben fejlesztette tökélyre magát. Aki nincs benne annyira a póker világában annak leírjuk: a Texas hold'em a játék egyik legnépszerűbb változata, amiben a játékosok először csak két lapot kapnak a kezükbe. Ezek mellett, (három játékfázisban: 3 + 1 + 1) 5 db "közös" lap kerül az asztal közepére, amiket mindenki láthat és felhasználhat. Tehát, mindegyik játékos azt az ötöt tekintheti sajátjának a rendelkezésre álló 7 lapból, amelyek a legerősebb kombinációt adják.

A játékosok meghatározott osztási és licitálási szabályokat követve (pl. limit/no-limit) fogadásokat kötnek arra, kinek a kezébe került a legerősebb 5 lapból álló kombináció. Azt, hogy ki viheti el a fogadások összegyűlt tétjeit az is nagyban befolyásolja, hogy a licitálás során ki győzi meg versenytársait arról, az ő kezében lévő figura a nyerő, azaz a többiek még a lapok megmutatása előtt kiszállnak a versenyből, ezzel persze veszni hagyva korábban befizetett fogadási tétjeiket.

A limit a játék nevében azt jelzi, hogy a játékosok csak adott, fix összegeket rakhatnak fel tétként, röviden ez egy egyszerűsített változata a játéknak kevesebb permutációval, mint amit a no-limit rejt magában. A számítógépek az összetettebb játékban még nem olyan ütőképesek, azonban a Polaris fejlesztői, a kanadai Alberta Egyetem kutatói szerint csak idő kérdése, hogy a gép itt is felül kerekedjen. Nemrég megkezdték legújabb szoftver verziójuk tesztelését, ami már egy az egy elleni no-limit hold'emet játszik. Ha a program elég jól teljesít, akkor jövőre megmérkőzhet a világ legjobbjaival.

"Ha megrögzött szerencsejátékos lennék - ami nem vagyok - akkor lefogadnám, hogy két éven belül születik olyan póker program, ami képes lesz felülmúlni az embereket a no-limit változatban is" - nyilatkozott Darse Billings, az egyetem Számítógépes Póker Kutató Csoportjának alapítótagja a New Scientist magazinnak. A fejlesztő csapatot vezető Michael Bowling kissé óvatosabban pakolássza az MI póker győzelmével kapcsolatos tétjeit. "Még az én életemben be fog következni, ami lehet 5 év, de akár 50 is."

A pókerben a játékosoknak úgy kell döntést hozniuk a következő lépésükről, hogy nem látják a többiek lapjait, ami jóval nagyobb kihívást jelent a számítógépnek, mint a sakk vagy a malom, ahol a játék összes darabja a táblán van a döntéshozáskor. Utóbbi esetben megfelelő számítási teljesítménnyel kidolgozható egy optimális stratégia, egy "döntésfa", amivel minden mozzanat lebontható szabályozható szakaszokra és kiértékelhető a siker esélye.

A póker esetében ez a megközelítés már koránt sem ilyen kézenfekvő, és nem csak a lapok és a tétek számtalan permutációja miatt. A pókerben a legjobb stratégia nagyban függ az ellenfél játékstílusától. "Jól tudjuk, hogy a számítógépek nagyon gyorsak és kiválóak az előre definiált számítások elvégzésében" - mondta Billings. "Itt viszont olyan vizekre evezünk ahol az információ megbízhatatlan, elégtelen, vagy szándékosan megtévesztő lehet."

Minél nagyobb a lehetséges játékállapotok száma, annál nagyobb memóriára van szüksége a számítógépnek a számítások futtatásához. 2005-ben az Alberta csoport egy új, 10 milliárd állapot kezelésére alkalmas algoritmust fejlesztett ki, felváltva a korábbi 100 milliós csúcstartóját. A jelenleg tesztelés alatt álló legfrissebb változat 1000 milliárd állapotot kezel. Bár a felsorolt számok elképesztőnek tűnnek, mégis eltörpülnek az egyszerűnek tartott limit hold'em permutációinak száma mellett, ami eléri az egymilliárd milliárdot.

A kutatók tehát kénytelenek voltak egyszerűsíteni a számítógépen elvégzendő kalkulációkon, ezért bizonyos kártya és játékállapot kombinációkat összekapcsoltak, a jelek szerint teljes sikerrel. Márpedig az algoritmusok fejlődésével egyre kevesebb állapotot kell majd összecsoportosítani, így csökken a hibalehetőségek száma is, ami a bonyolultabb játékokban is sikerre viheti a gépet.

Az online pókeroldalak is tudatában vannak a veszélynek, hiszen jelenleg is akadnak jónéhányan, akik pókerrobotok bevetésével kacsintgatnak a könnyű pénzszerzés felé. Alkalmazásukat természetesen az oldalak szabályzata szigorúan tiltja, felfedezésüket a játékos kizárásával szankcionálják. A jelenleg elérhető szoftverek tudása főként a virtuális pókerasztalok ellenőrző rendszerének kijátszására korlátozódik, arra törekednek hogy ne fedezzék fel, hogy egy "botról" van szó. Pókertudásuk erősen megkérdőjelezhető, sikereket legfeljebb a kis téteken folyó játékokban érnek el, többnyire azonban csak elszórják gazdáik pénzét. Ezen változtathat a Polaris és a hozzá hasonló fejlett programok.

A Polaris új no-limit változata különböző tétméreteket kapcsol össze, ezért ugyanúgy reagálhat például egy 10 vagy 12 zsetonnal emelő ellenfélre, tovább egyszerűsítve a számítási feladatot. A programot úgy alkották meg, hogy a 800 millió kétjátékos leosztási szimulációból származtatott adatbázis tanulmányozásával játékstratégiákat tanuljon. Ezek a stratégiák egy szoftverrobot sorozatban öltenek testet, amik különböző nevekre, mint Mr. Blonde, Mr. Pink és Agent Orange lettek keresztelve. Ezek mindegyike adott játékstílusok ellen száll harcba.

A kutatás hatalmas érdeklődést váltott ki, mivel jól példázza, hogyan használhatók a jövőben a számítógépek olyan területeken a problémamegoldásra, amiket a pókerasztalon tapasztalhatóhoz hasonló bizonytalanságok jellemeznek. Több cégóriás már most is játék teoretikusokat alkalmaz az árajánlat tételeknél, illetve termékeik beárazásánál. Az alapelv, hogy egy egyén stratégiája a környezetében élők stratégiáján alapul, segít a kutatóknak felfedni a versenyhelyzetben és a reciprokális altruizmusban levők viselkedéseit alakító erőket. Utóbbi olyan evolúciópszichológiai jelenség, melyben egy egyed úgy növeli egy másik túlélési sikerét, hogy nem vár azonnali ellenszolgáltatást; hasonló a játékelmélet szemet szemért stratégiájához.

"Ez a fajta technológia nagyon sikeres lehet a pénzpiacokon, ami inkább a pókerre emlékeztet mint a sakkra" - véli Noel Sharky, a brit Sheffield Egyetem MI és robottechnika professzora, hozzátéve, hogy a kanadaiak munkája több egészen új területbe vezetheti be a számítógépes rendszerek alkalmazását. Billings egyetért brit kollégájával és hangsúlyozza, nem szabad a jelenlegi alkalmazás alapján megítélni egy kutatás jelentőségét. "Amikor a matematikusok elkezdik kidolgozni a másodfokú egyenletek megoldásait, nem azon gondolkodnak hogyan tudják majd hasznosítani az iparban, csupán egy probléma megoldása lebeg a szemük előtt" - mondta. "Amikor kitoljuk a módszerrel megoldható feladatok határait, olyan alkalmazásoknak nyitunk utat, ami nem is létezett korábban, sőt, sokszor elképzelni sem tudjuk milyen is lesz valójában."

Informatika és tudomány

Lassan bedobjuk lapjainkat az MI ellen

Hozzászólások

Bejelentkezés