Искусственный интеллект Libratus выиграл почти $2 млн у профессиональных игроков в покер
Искусственный интеллект Libratus, созданный учеными из университета Карнеги-Меллон в Питтсбурге (США), смог обыграть профессиональных игроков в «техасский холдем» — одну из самых популярных разновидностей покера. Статью об этом авторы разработки опубликовали в журнале Science.
За последние годы ученые совершили прорыв в создании систем искусственного интеллекта, способных одерживать победу над людьми в играх, таких как шашки и шахматы. В прошлом году разработанный в исследовательском подразделении DeepMind компании Alphabet искусственный интеллект AlphaGo победил сильнейшего в мире игрока в го.
Ной Браун из университета Карнеги-Меллон пишет, что «техасский холдем» принципиально отличается от всех этих игр. С одной стороны, алгоритму проще играть в покер, чем в го: в карточной игре меньше вариантов. С другой стороны, у игроков в покер нет полной информации для принятия решений: они не знают, какие карты на руках у противника и что он знает о комбинации, которая досталась им. Таким образом, они видят лишь собственные карты, а также эмоции и жесты других игроков.
Ученые обучили Libratus мыслить «абстрактно». Распознавание и анализ эмоций и жестов человека пока остается сверхсложной задачей для алгоритма, поэтому при обучении Libratus акцент был сделан на анализ карточных комбинаций, ставок и прочих элементов покера. Система считает их примерно одним и тем же вариантом развития событий и предугадывает самые очевидные ходы противника. Если ход оказывается неожиданным для Libratus, он анализирует его и отдельно просчитывает его последствия. Затем алгоритм ищет варианты, которые помогут ему выиграть или минимизировать потери. Удачные версии собственных ходов система записывает, чтобы использовать их в последующих раундах.
Ученые решили устроить чемпионат и пригласили сыграть с Libratus Джейсона Леса, Дона Кима, Дэниэла Макоули и Джимми Чоу — ведущих игроков в «техасский холдем». Призовой фонд турнира составил $200 тыс., из которых 10% гарантированно доставались каждому игроку. К концу чемпионата искусственный интеллект обыграл людей, заработав огромное количество фишек. Их совокупная стоимость составила $1,8 млн. Если бы чемпионат проводился по всем правилам, эта сумма досталась бы Libratus, отмечается в статье.
В сентябре Сбербанк провел турнир по покеру между ботами. Участники написали ботов, которых обучили играть в «техасский холдем» в реальном времени. При этом боты должны были делать это эффективно. Победителем стал Дмитрий Ганин и его алгоритм fcll — он получил 300 тыс. рублей.
Позднее глава банка Герман Греф предложил использовать навыки искусственного интеллекта в покере для бизнеса: он объяснил, что навыки, используемые ИИ по время игры, могут пригодиться в работе с клиентами организации.