https://frosthead.com

Este jogo de pôquer com inteligência artificial sabe quando segurá-los e quando rebatê-los

Um programa de computador chamado Pluribus superou os profissionais de pôquer em uma série de jogos Texas Hold'em sem limite de seis jogadores, alcançando um marco na pesquisa de inteligência artificial. É o primeiro bot a vencer seres humanos em uma complexa competição multiplayer.

Como pesquisadores do laboratório de inteligência artificial do Facebook e da Universidade Carnegie Mellon relatam na revista Science, a Pluribus saiu vitoriosa em jogos dominados por humanos e algoritmos. Inicialmente, Merrit Kennedy escreve para a NPR, cinco versões do bot enfrentaram um jogador de pôquer profissional; na próxima rodada de experimentos, um bot jogou contra cinco humanos. De acordo com uma postagem no blog do Facebook, a IA ganhou em média cerca de US $ 5 por mão, ou US $ 1.000 por hora, ao jogar contra cinco oponentes humanos. Esta taxa é considerada uma "margem decisiva de vitória" entre os profissionais de poker.

Falando com Kennedy, o quatro vezes campeão do World Poker Tour, Darren Elias, explica que ajudou a treinar o Pluribus competindo contra quatro mesas de rivais e alertando os cientistas quando a IA cometeu um erro. Logo, o bot “estava melhorando muito rapidamente, indo de um jogador medíocre a basicamente um jogador de pôquer de nível mundial em questão de dias e semanas”. A experiência, Elias diz, foi “bastante assustadora”.

De acordo com James Vincent, da Verge, a Pluribus - uma IA incrivelmente barata, treinada com menos de US $ 150 em recursos de computação em nuvem - dominou ainda mais a estratégia do poker, jogando contra cópias de si mesmo e aprendendo por tentativa e erro. Como Jennifer Ouellette observa para o Ars Technica, o robô percebeu rapidamente que seu melhor curso de ação era uma combinação de jogabilidade e movimentos imprevisíveis.

A maioria dos profissionais humanos evitam “donk betting”, que encontra um jogador terminando uma rodada com uma chamada e iniciando a próxima com uma aposta, mas Pluribus prontamente adotou a estratégia impopular. Ao mesmo tempo, informa Ouellette, a IA também ofereceu tamanhos de apostas incomuns e exibiu melhor randomização do que os adversários.

"Sua maior força é a capacidade de usar estratégias mistas", disse Elias, de acordo com uma declaração da CMU. “É a mesma coisa que os humanos tentam fazer. É uma questão de execução para os humanos - fazer isso de uma maneira perfeitamente aleatória e fazê-lo consistentemente. A maioria das pessoas simplesmente não consegue.

O Pluribus não é a primeira IA de pôquer a derrotar profissionais humanos. Em 2017, os criadores do bot, Noam Brown e Tuomas Sandholm, desenvolveram uma iteração anterior do programa chamado Libratus. Esta IA derrotou decisivamente quatro profissionais de pôquer em 120.000 mãos de Texas Hold'em para dois jogadores, mas como o post do blog do Facebook explica, foi limitado pelo fato de que ele enfrentou apenas um adversário de cada vez.

De acordo com Will Knight, do MIT Technology Review, o pôquer representa um desafio para a IA, porque envolve vários jogadores e uma infinidade de informações ocultas. Comparativamente, jogos como xadrez e Go envolvem apenas dois participantes, e as posições dos jogadores são visíveis para todos.

Para superar esses obstáculos, Brown e Sandholm criaram um algoritmo projetado para prever os próximos dois ou três movimentos dos adversários em vez de avaliar seus passos até o final do jogo. Embora esta estratégia pareça priorizar o ganho de curto prazo sobre os ganhos de longo prazo, a Vincent de Verge escreve que “a incisividade de curto prazo é realmente tudo o que você precisa”.

Avançando, programas multijogador como o Pluribus poderiam ser usados ​​para projetar drogas capazes de combater bactérias resistentes a antibióticos, bem como melhorar a segurança cibernética e os sistemas robóticos militares. Como As notas de Ouellette da Ars Technica, outras possíveis aplicações incluem a supervisão de negociações multipartidárias, a precificação de produtos e o brainstorming de estratégias de leilão.

Por enquanto, Brown diz a Knight, o algoritmo permanecerá em grande parte sob sigilo - principalmente para proteger a indústria do poker online de incorrer em perdas financeiras devastadoras.

O pesquisador conclui: "Pode ser muito perigoso para a comunidade do poker".

Este jogo de pôquer com inteligência artificial sabe quando segurá-los e quando rebatê-los