Ноам Браун: "Безлимитный холдем не будет решен в ближайшие годы"

Даг Полк играет с ботом Claudico

Создатель легендарного бота Baby Tartanian 8 Ноам Браун любезно согласился выделить время в своем плотном графике, чтобы поговорить с PokerNews о своем творении, в том числе истории его создания и игре в интернете; ответ на последний вопрос порождает серьезное беспокойство.

Браун объяснил, что ежегодные соревнования компьютерных покерных программ (Annual Computer Poker Competition) проходят с 2006 года, при этом безлимитный холдем был введен в программу в 2008 году. Именно в это время боты стали куда более сложными программами.

"Думаю, где-то в 2008-2009 годах мы начали работать над безлимитным холдемом. В то время боты рассматривали лишь колл, пас, ставку размером в банк и олл-ин", — вспоминает Браун. "Когда вы смотрите на абстракции карт, как мы их называем, прикидываете возможные руки, то должны их группировать и действовать одинаково применительно к большим группам рук. В то время все возможные комбинации на ривере были распределены примерно по 500 корзинам, тогда как сейчас мы оперируем миллионом корзин".

Если вы являетесь завсегдатаем покерных форумов, то наверняка слышали, что некоторые разновидности покера «решены», то есть в них разработана оптимальная стратегия. Однако Браун утверждает, что, безлимитный холдем решен не будет, по крайней мере, не в нашей жизни.

"Лимитный холдем и безлимитный холдем – два совершенно разных соревнования. В лимитном холдеме у вас три опции: колл, пас и ставка. В безлимитном холдеме у вас, по сути дела, бесчисленное количество опций, ведь вы можете ставить любое количество, а каждая из этих ставок интерпретируется компьютером как отдельное действие", — объяснил он.

"Если вы хотите решить безлимитный холдем, то при стеках 20,000, которые используются в ежегодных соревнованиях компьютерных покерных программ, мы говорим об игре, где количество возможных комбинаций составляет 10^163 (то есть 10 и 163 ноля), эта цифра находится в районе 10^15, то есть масштаб просто невообразимый. При нашей жизни безлимитный техасский холдем решен не будет. Не уверен, что это вообще случится. Вместе с тем, во многих ситуациях существуют способы аппроксимации решения задач, так что в ближайшие годы мы увидим бота, который будет побеждать ведущих профессионалов, однако между подобным достижением и решением игры лежит пропасть".

Далее Браун пояснил, что многие ошибочно предполагают, что даже лучшие покерные боты не блефуют и вообще их игра очень предсказуема. Это не соответствует действительности.

"Это совсем неудивительно [что боты блефуют], поскольку компьютер моделирует триллионы раздач, но, в отличие от нас, воспринимает блеф совершенно иначе. Просто раз за разом попадая в определенную ситуацию, он замечает, что даже не имея очень сильной руки, можно выиграть больше денег ставкой", — рассказал он.

Впрочем, боты все же не без слабых мест. В частности, боты высокого уровня ограничиваются хедз-апом, а вот, к примеру, в формате 6-макс действуют далеко не столь успешно. Однако и здесь грядут перемены. По словам Брауна, на соревнованиях компьютерных покерных программ этого года многие проявляют интерес именно к формату с шестью игроками. По его мнению, подобный турнир будет проведен уже в 2017 году, хотя на создание конкурентоспособного бота потребуется немало сил и времени.

Другой слабостью ботов является их неспособность подстроиться под оппонента, поскольку для создания оптимальной стратегии игры им требуются триллионы раздач, что против человека попросту невозможно. На мой вопрос о способности бота использовать слабости соперника Браун ответил следующее:

"Это важнейший вопрос. Боты наигрывают друг с другом миллионы раздач. Доказано, что бот достигает равновесия Нэша, то есть стратегии GTO. В покере существует другой важный аспект, а именно использование слабостей соперника. Даже если вы имеете в своем арсенале GTO, вы можете не выигрывать у своих оппонентов по-максимуму. В этом сильны именно «белковые» профессионалы – они находят слабости соперников и извлекают из них максимальную выгоду.

"Последнее время проводится масса исследований на предмет того, как научить этому бота, но пока без особого успеха. Подход, который мы используем, то есть наигрыш триллионов раздач против конкретного соперника, чтобы выявить его слабости и выработать оптимальную стратегию, сработал бы и против человека, но это попросту невозможно. А вот выработать стратегию на основе небольшой выборки раздач пока не получается. Именно в этом направлении идут активные разработки. Мы не знаем, почему люди достигли в данной области таких высот. Пожалуй, в настоящее время это самое слабое место ботов".

ПОКАЗАТЬ БОЛЬШЕ

Ваше мнение: