Hunter
Lassan bedobjuk lapjainkat az MI ellen
Idén újabb lépcsőfokhoz érkezett a mesterséges intelligencia. A helyszín kissé szokatlan ugyanakkor stílszerű volt, a Las Vegas-i Rio All-Suite Hotel & Casino pókerasztala, ahol egy számítógépes program, a Polaris először győzte le az embert egy olyan játékban, ahol nem a nyers számítási erő a döntő. A géppel egy asztalhoz ülők dörzsölt pókerezők, akik mindegyike 1 millió dollár feletti nyereményekkel büszkélkedett.
Többen csak úgy tekintettek a gép diadalára, mint a szilícium újabb előrenyomulására, amivel idővel felsőbbrendűvé válhat az emberekkel szemben. Bosszantó. Vannak azonban olyanok is, akik az MI egy izgalmas előrelépéseként tekintenek az eseményre - egy kis kóstolóként azokba a kifinomult feladatokba, aminek elvégzésére a számítógépek a közeli jövőben képesek lesznek.
1997-ben az IBM Deep Blue szuperszámítógépe volt az első gép, ami egy teljes mérkőzésben térdre kényszerített egy hús-vér sakk-világbajnokot, név szerint Gari Kaszparovot, tavaly pedig a malom játékban tökéletesre hangolt, gyakorlatilag verhetetlen programról számoltunk be. Ezeknek a játékoknak azonban van egy közös vonásuk: a jó matematikai képességű játékoknak kedveznek, márpedig a számítógépek ilyen téren elég jó helyzetben vannak. A póker azonban egészen más világ. Ez a ravaszság, a blöff és a csalás játéka, ami elég távol áll azoktól a dolgoktól, amivel eddig az alaplapokat és a processzorokat összefüggésbe hoztuk, ezért is értékes a Polaris győzelme az MI számára.
A diadal azonban nem nevezhető teljesnek, nem szabad leírni az emberi játékosokat, mivel a Polaris a Texas hold'em egy egyszerűsített változatában, az egy-egy elleni limit hold'emben fejlesztette tökélyre magát. Aki nincs benne annyira a póker világában annak leírjuk: a Texas hold'em a játék egyik legnépszerűbb változata, amiben a játékosok először csak két lapot kapnak a kezükbe. Ezek mellett, (három játékfázisban: 3 + 1 + 1) 5 db "közös" lap kerül az asztal közepére, amiket mindenki láthat és felhasználhat. Tehát, mindegyik játékos azt az ötöt tekintheti sajátjának a rendelkezésre álló 7 lapból, amelyek a legerősebb kombinációt adják.
A játékosok meghatározott osztási és licitálási szabályokat követve (pl. limit/no-limit) fogadásokat kötnek arra, kinek a kezébe került a legerősebb 5 lapból álló kombináció. Azt, hogy ki viheti el a fogadások összegyűlt tétjeit az is nagyban befolyásolja, hogy a licitálás során ki győzi meg versenytársait arról, az ő kezében lévő figura a nyerő, azaz a többiek még a lapok megmutatása előtt kiszállnak a versenyből, ezzel persze veszni hagyva korábban befizetett fogadási tétjeiket.
A limit a játék nevében azt jelzi, hogy a játékosok csak adott, fix összegeket rakhatnak fel tétként, röviden ez egy egyszerűsített változata a játéknak kevesebb permutációval, mint amit a no-limit rejt magában. A számítógépek az összetettebb játékban még nem olyan ütőképesek, azonban a Polaris fejlesztői, a kanadai Alberta Egyetem kutatói szerint csak idő kérdése, hogy a gép itt is felül kerekedjen. Nemrég megkezdték legújabb szoftver verziójuk tesztelését, ami már egy az egy elleni no-limit hold'emet játszik. Ha a program elég jól teljesít, akkor jövőre megmérkőzhet a világ legjobbjaival.
"Ha megrögzött szerencsejátékos lennék - ami nem vagyok - akkor lefogadnám, hogy két éven belül születik olyan póker program, ami képes lesz felülmúlni az embereket a no-limit változatban is" - nyilatkozott Darse Billings, az egyetem Számítógépes Póker Kutató Csoportjának alapítótagja a New Scientist magazinnak. A fejlesztő csapatot vezető Michael Bowling kissé óvatosabban pakolássza az MI póker győzelmével kapcsolatos tétjeit. "Még az én életemben be fog következni, ami lehet 5 év, de akár 50 is."
A pókerben a játékosoknak úgy kell döntést hozniuk a következő lépésükről, hogy nem látják a többiek lapjait, ami jóval nagyobb kihívást jelent a számítógépnek, mint a sakk vagy a malom, ahol a játék összes darabja a táblán van a döntéshozáskor. Utóbbi esetben megfelelő számítási teljesítménnyel kidolgozható egy optimális stratégia, egy "döntésfa", amivel minden mozzanat lebontható szabályozható szakaszokra és kiértékelhető a siker esélye.
A póker esetében ez a megközelítés már koránt sem ilyen kézenfekvő, és nem csak a lapok és a tétek számtalan permutációja miatt. A pókerben a legjobb stratégia nagyban függ az ellenfél játékstílusától. "Jól tudjuk, hogy a számítógépek nagyon gyorsak és kiválóak az előre definiált számítások elvégzésében" - mondta Billings. "Itt viszont olyan vizekre evezünk ahol az információ megbízhatatlan, elégtelen, vagy szándékosan megtévesztő lehet."
Minél nagyobb a lehetséges játékállapotok száma, annál nagyobb memóriára van szüksége a számítógépnek a számítások futtatásához. 2005-ben az Alberta csoport egy új, 10 milliárd állapot kezelésére alkalmas algoritmust fejlesztett ki, felváltva a korábbi 100 milliós csúcstartóját. A jelenleg tesztelés alatt álló legfrissebb változat 1000 milliárd állapotot kezel. Bár a felsorolt számok elképesztőnek tűnnek, mégis eltörpülnek az egyszerűnek tartott limit hold'em permutációinak száma mellett, ami eléri az egymilliárd milliárdot.
A kutatók tehát kénytelenek voltak egyszerűsíteni a számítógépen elvégzendő kalkulációkon, ezért bizonyos kártya és játékállapot kombinációkat összekapcsoltak, a jelek szerint teljes sikerrel. Márpedig az algoritmusok fejlődésével egyre kevesebb állapotot kell majd összecsoportosítani, így csökken a hibalehetőségek száma is, ami a bonyolultabb játékokban is sikerre viheti a gépet.
Az online pókeroldalak is tudatában vannak a veszélynek, hiszen jelenleg is akadnak jónéhányan, akik pókerrobotok bevetésével kacsintgatnak a könnyű pénzszerzés felé. Alkalmazásukat természetesen az oldalak szabályzata szigorúan tiltja, felfedezésüket a játékos kizárásával szankcionálják. A jelenleg elérhető szoftverek tudása főként a virtuális pókerasztalok ellenőrző rendszerének kijátszására korlátozódik, arra törekednek hogy ne fedezzék fel, hogy egy "botról" van szó. Pókertudásuk erősen megkérdőjelezhető, sikereket legfeljebb a kis téteken folyó játékokban érnek el, többnyire azonban csak elszórják gazdáik pénzét. Ezen változtathat a Polaris és a hozzá hasonló fejlett programok.
A Polaris új no-limit változata különböző tétméreteket kapcsol össze, ezért ugyanúgy reagálhat például egy 10 vagy 12 zsetonnal emelő ellenfélre, tovább egyszerűsítve a számítási feladatot. A programot úgy alkották meg, hogy a 800 millió kétjátékos leosztási szimulációból származtatott adatbázis tanulmányozásával játékstratégiákat tanuljon. Ezek a stratégiák egy szoftverrobot sorozatban öltenek testet, amik különböző nevekre, mint Mr. Blonde, Mr. Pink és Agent Orange lettek keresztelve. Ezek mindegyike adott játékstílusok ellen száll harcba.
A kutatás hatalmas érdeklődést váltott ki, mivel jól példázza, hogyan használhatók a jövőben a számítógépek olyan területeken a problémamegoldásra, amiket a pókerasztalon tapasztalhatóhoz hasonló bizonytalanságok jellemeznek. Több cégóriás már most is játék teoretikusokat alkalmaz az árajánlat tételeknél, illetve termékeik beárazásánál. Az alapelv, hogy egy egyén stratégiája a környezetében élők stratégiáján alapul, segít a kutatóknak felfedni a versenyhelyzetben és a reciprokális altruizmusban levők viselkedéseit alakító erőket. Utóbbi olyan evolúciópszichológiai jelenség, melyben egy egyed úgy növeli egy másik túlélési sikerét, hogy nem vár azonnali ellenszolgáltatást; hasonló a játékelmélet szemet szemért stratégiájához.
"Ez a fajta technológia nagyon sikeres lehet a pénzpiacokon, ami inkább a pókerre emlékeztet mint a sakkra" - véli Noel Sharky, a brit Sheffield Egyetem MI és robottechnika professzora, hozzátéve, hogy a kanadaiak munkája több egészen új területbe vezetheti be a számítógépes rendszerek alkalmazását. Billings egyetért brit kollégájával és hangsúlyozza, nem szabad a jelenlegi alkalmazás alapján megítélni egy kutatás jelentőségét. "Amikor a matematikusok elkezdik kidolgozni a másodfokú egyenletek megoldásait, nem azon gondolkodnak hogyan tudják majd hasznosítani az iparban, csupán egy probléma megoldása lebeg a szemük előtt" - mondta. "Amikor kitoljuk a módszerrel megoldható feladatok határait, olyan alkalmazásoknak nyitunk utat, ami nem is létezett korábban, sőt, sokszor elképzelni sem tudjuk milyen is lesz valójában."
Többen csak úgy tekintettek a gép diadalára, mint a szilícium újabb előrenyomulására, amivel idővel felsőbbrendűvé válhat az emberekkel szemben. Bosszantó. Vannak azonban olyanok is, akik az MI egy izgalmas előrelépéseként tekintenek az eseményre - egy kis kóstolóként azokba a kifinomult feladatokba, aminek elvégzésére a számítógépek a közeli jövőben képesek lesznek.
1997-ben az IBM Deep Blue szuperszámítógépe volt az első gép, ami egy teljes mérkőzésben térdre kényszerített egy hús-vér sakk-világbajnokot, név szerint Gari Kaszparovot, tavaly pedig a malom játékban tökéletesre hangolt, gyakorlatilag verhetetlen programról számoltunk be. Ezeknek a játékoknak azonban van egy közös vonásuk: a jó matematikai képességű játékoknak kedveznek, márpedig a számítógépek ilyen téren elég jó helyzetben vannak. A póker azonban egészen más világ. Ez a ravaszság, a blöff és a csalás játéka, ami elég távol áll azoktól a dolgoktól, amivel eddig az alaplapokat és a processzorokat összefüggésbe hoztuk, ezért is értékes a Polaris győzelme az MI számára.
A diadal azonban nem nevezhető teljesnek, nem szabad leírni az emberi játékosokat, mivel a Polaris a Texas hold'em egy egyszerűsített változatában, az egy-egy elleni limit hold'emben fejlesztette tökélyre magát. Aki nincs benne annyira a póker világában annak leírjuk: a Texas hold'em a játék egyik legnépszerűbb változata, amiben a játékosok először csak két lapot kapnak a kezükbe. Ezek mellett, (három játékfázisban: 3 + 1 + 1) 5 db "közös" lap kerül az asztal közepére, amiket mindenki láthat és felhasználhat. Tehát, mindegyik játékos azt az ötöt tekintheti sajátjának a rendelkezésre álló 7 lapból, amelyek a legerősebb kombinációt adják.
A játékosok meghatározott osztási és licitálási szabályokat követve (pl. limit/no-limit) fogadásokat kötnek arra, kinek a kezébe került a legerősebb 5 lapból álló kombináció. Azt, hogy ki viheti el a fogadások összegyűlt tétjeit az is nagyban befolyásolja, hogy a licitálás során ki győzi meg versenytársait arról, az ő kezében lévő figura a nyerő, azaz a többiek még a lapok megmutatása előtt kiszállnak a versenyből, ezzel persze veszni hagyva korábban befizetett fogadási tétjeiket.
A limit a játék nevében azt jelzi, hogy a játékosok csak adott, fix összegeket rakhatnak fel tétként, röviden ez egy egyszerűsített változata a játéknak kevesebb permutációval, mint amit a no-limit rejt magában. A számítógépek az összetettebb játékban még nem olyan ütőképesek, azonban a Polaris fejlesztői, a kanadai Alberta Egyetem kutatói szerint csak idő kérdése, hogy a gép itt is felül kerekedjen. Nemrég megkezdték legújabb szoftver verziójuk tesztelését, ami már egy az egy elleni no-limit hold'emet játszik. Ha a program elég jól teljesít, akkor jövőre megmérkőzhet a világ legjobbjaival.
"Ha megrögzött szerencsejátékos lennék - ami nem vagyok - akkor lefogadnám, hogy két éven belül születik olyan póker program, ami képes lesz felülmúlni az embereket a no-limit változatban is" - nyilatkozott Darse Billings, az egyetem Számítógépes Póker Kutató Csoportjának alapítótagja a New Scientist magazinnak. A fejlesztő csapatot vezető Michael Bowling kissé óvatosabban pakolássza az MI póker győzelmével kapcsolatos tétjeit. "Még az én életemben be fog következni, ami lehet 5 év, de akár 50 is."
A pókerben a játékosoknak úgy kell döntést hozniuk a következő lépésükről, hogy nem látják a többiek lapjait, ami jóval nagyobb kihívást jelent a számítógépnek, mint a sakk vagy a malom, ahol a játék összes darabja a táblán van a döntéshozáskor. Utóbbi esetben megfelelő számítási teljesítménnyel kidolgozható egy optimális stratégia, egy "döntésfa", amivel minden mozzanat lebontható szabályozható szakaszokra és kiértékelhető a siker esélye.
A póker esetében ez a megközelítés már koránt sem ilyen kézenfekvő, és nem csak a lapok és a tétek számtalan permutációja miatt. A pókerben a legjobb stratégia nagyban függ az ellenfél játékstílusától. "Jól tudjuk, hogy a számítógépek nagyon gyorsak és kiválóak az előre definiált számítások elvégzésében" - mondta Billings. "Itt viszont olyan vizekre evezünk ahol az információ megbízhatatlan, elégtelen, vagy szándékosan megtévesztő lehet."
Minél nagyobb a lehetséges játékállapotok száma, annál nagyobb memóriára van szüksége a számítógépnek a számítások futtatásához. 2005-ben az Alberta csoport egy új, 10 milliárd állapot kezelésére alkalmas algoritmust fejlesztett ki, felváltva a korábbi 100 milliós csúcstartóját. A jelenleg tesztelés alatt álló legfrissebb változat 1000 milliárd állapotot kezel. Bár a felsorolt számok elképesztőnek tűnnek, mégis eltörpülnek az egyszerűnek tartott limit hold'em permutációinak száma mellett, ami eléri az egymilliárd milliárdot.
A kutatók tehát kénytelenek voltak egyszerűsíteni a számítógépen elvégzendő kalkulációkon, ezért bizonyos kártya és játékállapot kombinációkat összekapcsoltak, a jelek szerint teljes sikerrel. Márpedig az algoritmusok fejlődésével egyre kevesebb állapotot kell majd összecsoportosítani, így csökken a hibalehetőségek száma is, ami a bonyolultabb játékokban is sikerre viheti a gépet.
Az online pókeroldalak is tudatában vannak a veszélynek, hiszen jelenleg is akadnak jónéhányan, akik pókerrobotok bevetésével kacsintgatnak a könnyű pénzszerzés felé. Alkalmazásukat természetesen az oldalak szabályzata szigorúan tiltja, felfedezésüket a játékos kizárásával szankcionálják. A jelenleg elérhető szoftverek tudása főként a virtuális pókerasztalok ellenőrző rendszerének kijátszására korlátozódik, arra törekednek hogy ne fedezzék fel, hogy egy "botról" van szó. Pókertudásuk erősen megkérdőjelezhető, sikereket legfeljebb a kis téteken folyó játékokban érnek el, többnyire azonban csak elszórják gazdáik pénzét. Ezen változtathat a Polaris és a hozzá hasonló fejlett programok.
A Polaris új no-limit változata különböző tétméreteket kapcsol össze, ezért ugyanúgy reagálhat például egy 10 vagy 12 zsetonnal emelő ellenfélre, tovább egyszerűsítve a számítási feladatot. A programot úgy alkották meg, hogy a 800 millió kétjátékos leosztási szimulációból származtatott adatbázis tanulmányozásával játékstratégiákat tanuljon. Ezek a stratégiák egy szoftverrobot sorozatban öltenek testet, amik különböző nevekre, mint Mr. Blonde, Mr. Pink és Agent Orange lettek keresztelve. Ezek mindegyike adott játékstílusok ellen száll harcba.
A kutatás hatalmas érdeklődést váltott ki, mivel jól példázza, hogyan használhatók a jövőben a számítógépek olyan területeken a problémamegoldásra, amiket a pókerasztalon tapasztalhatóhoz hasonló bizonytalanságok jellemeznek. Több cégóriás már most is játék teoretikusokat alkalmaz az árajánlat tételeknél, illetve termékeik beárazásánál. Az alapelv, hogy egy egyén stratégiája a környezetében élők stratégiáján alapul, segít a kutatóknak felfedni a versenyhelyzetben és a reciprokális altruizmusban levők viselkedéseit alakító erőket. Utóbbi olyan evolúciópszichológiai jelenség, melyben egy egyed úgy növeli egy másik túlélési sikerét, hogy nem vár azonnali ellenszolgáltatást; hasonló a játékelmélet szemet szemért stratégiájához.
"Ez a fajta technológia nagyon sikeres lehet a pénzpiacokon, ami inkább a pókerre emlékeztet mint a sakkra" - véli Noel Sharky, a brit Sheffield Egyetem MI és robottechnika professzora, hozzátéve, hogy a kanadaiak munkája több egészen új területbe vezetheti be a számítógépes rendszerek alkalmazását. Billings egyetért brit kollégájával és hangsúlyozza, nem szabad a jelenlegi alkalmazás alapján megítélni egy kutatás jelentőségét. "Amikor a matematikusok elkezdik kidolgozni a másodfokú egyenletek megoldásait, nem azon gondolkodnak hogyan tudják majd hasznosítani az iparban, csupán egy probléma megoldása lebeg a szemük előtt" - mondta. "Amikor kitoljuk a módszerrel megoldható feladatok határait, olyan alkalmazásoknak nyitunk utat, ami nem is létezett korábban, sőt, sokszor elképzelni sem tudjuk milyen is lesz valójában."