Вземи 200 лева бонус от Efbet

Създадоха непобедим покер бот

 

Компютрите вече знаят как да спечелят в шаха и други мисловни игри и сега една компютърна програма се опитва да завладее играта на покер.

Изследователски екип, воден от Майкъл Боулинг, професор по компютърни науки в Университета на Алберта в Канада, е разработил програма, която може да надиграе всеки един играч в хедс-ъп битка в дисциплината Холд ем без лимит. Резултатите от това изследване могат да имат трайни последици и за други ситуации, които изискват комплексно вземане на решения, като например решения за външната политика или за медицинско лечение.

За разлика от шахмата, в покера един играч много трудно може да разгадае последващите ходове на другите играчи. Плюс това, един играч може да спечели ръката и когато противникът му се откаже. Ето защо, казано с математически термин, играта има непълна информация.

Как работи

В периода на изследването са били използвани 4 000 централни процесори за два месеца – равно на около 1 000 години изчислително време – които са симулирали разиграването на милиарди покер ръце. Само таблицата с резултатите сама по себе си има размер от 15 терабайта, разказва Боулинг. За сравнение, един типичен хард диск на десктоп компютър е един терабайт.

Алгоритъмът минава през всички възможни ръце, които противниковият играч може да има, и след това взема решение в съответствие на резултатите за всяка тактика – рейзване, плащане или отказване. За да получите представа колко трудна задача е това, ще ви кажем, че има 13,8 трилиона различни ситуации, които могат да се появят в играта. За да се стигне дотам, всяко човешко същество на планетата ще трябва да играе близо 400 ръце.

Тъй като покерът не е толкова лесно решима игра като шаха, Боулинг и екипа му излязоха с набор от изисквания за наричането на играта “решена”. От научна гледна точка, играта е “по същество решена”, което означава, че има начин да се експлоатира стратегията, която компютърът използва. Ако предположим, че един играч играе срещу компютъра 70 години, 365 дни в годината за 24 часа в денонощието, програмата е написана толкова добре, че ако големият блайнд е $1,000, най- добрите играчи ще могат да печелят средно по около $1 на ръка или 1/1000 от големия блайнд.

Но алгоритъмът има и своите ограничения. Едно от тях, е че той работи само в игра срещу един противник. Програмата не може да се използва дори и за трима играчи, тъй като единият играч може да има ужасна стратегия (например, да рейзва през цялото време), а другият играч да има много по- добра стратегия, което може да обърка програмата.

Друг проблем за решаване е как да се тества игра при трима участници. Един експеримент може да бъде двама души да играят срещу машината, но според Боулинг е възможно двамата да си заговорничат срещу компютъра, дори и неволно. Подобни проблеми могат да възникнат при експерименти с две машини и един човек. Дори и двете програми да не си заговорничат, за човека може да изглежда, че го правят. “Не знам как да проведем експеримента честно”, каза той.

Боулинг заяви, че тази технология не е ограничена само до покера. Тя има различни цели, вариращи от националната сигурност до вземането на решения по време на медицинско лечение. Например, програмата може да помогне на лекар да вземе решение, когато не е сигурен за възможните резултати. Методите, използвани в покер програмата, могат да помогнат на докторите да идентифицират възможностите за лечение с оптимални резултати.