Um programa de computador chamado Pluribus superou os profissionais de pôquer em uma série de jogos Texas Hold'em sem limite de seis jogadores, alcançando um marco na pesquisa de inteligência artificial. É o primeiro bot a vencer seres humanos em uma complexa competição multiplayer.
Como pesquisadores do laboratório de inteligência artificial do Facebook e da Universidade Carnegie Mellon relatam na revista Science, a Pluribus saiu vitoriosa em jogos dominados por humanos e algoritmos. Inicialmente, Merrit Kennedy escreve para a NPR, cinco versões do bot enfrentaram um jogador de pôquer profissional; na próxima rodada de experimentos, um bot jogou contra cinco humanos. De acordo com uma postagem no blog do Facebook, a IA ganhou em média cerca de US $ 5 por mão, ou US $ 1.000 por hora, ao jogar contra cinco oponentes humanos. Esta taxa é considerada uma "margem decisiva de vitória" entre os profissionais de poker.
Falando com Kennedy, o quatro vezes campeão do World Poker Tour, Darren Elias, explica que ajudou a treinar o Pluribus competindo contra quatro mesas de rivais e alertando os cientistas quando a IA cometeu um erro. Logo, o bot “estava melhorando muito rapidamente, indo de um jogador medíocre a basicamente um jogador de pôquer de nível mundial em questão de dias e semanas”. A experiência, Elias diz, foi “bastante assustadora”.
De acordo com James Vincent, da Verge, a Pluribus - uma IA incrivelmente barata, treinada com menos de US $ 150 em recursos de computação em nuvem - dominou ainda mais a estratégia do poker, jogando contra cópias de si mesmo e aprendendo por tentativa e erro. Como Jennifer Ouellette observa para o Ars Technica, o robô percebeu rapidamente que seu melhor curso de ação era uma combinação de jogabilidade e movimentos imprevisíveis.
A maioria dos profissionais humanos evitam “donk betting”, que encontra um jogador terminando uma rodada com uma chamada e iniciando a próxima com uma aposta, mas Pluribus prontamente adotou a estratégia impopular. Ao mesmo tempo, informa Ouellette, a IA também ofereceu tamanhos de apostas incomuns e exibiu melhor randomização do que os adversários.
"Sua maior força é a capacidade de usar estratégias mistas", disse Elias, de acordo com uma declaração da CMU. “É a mesma coisa que os humanos tentam fazer. É uma questão de execução para os humanos - fazer isso de uma maneira perfeitamente aleatória e fazê-lo consistentemente. A maioria das pessoas simplesmente não consegue.
O Pluribus não é a primeira IA de pôquer a derrotar profissionais humanos. Em 2017, os criadores do bot, Noam Brown e Tuomas Sandholm, desenvolveram uma iteração anterior do programa chamado Libratus. Esta IA derrotou decisivamente quatro profissionais de pôquer em 120.000 mãos de Texas Hold'em para dois jogadores, mas como o post do blog do Facebook explica, foi limitado pelo fato de que ele enfrentou apenas um adversário de cada vez.
De acordo com Will Knight, do MIT Technology Review, o pôquer representa um desafio para a IA, porque envolve vários jogadores e uma infinidade de informações ocultas. Comparativamente, jogos como xadrez e Go envolvem apenas dois participantes, e as posições dos jogadores são visíveis para todos.
Para superar esses obstáculos, Brown e Sandholm criaram um algoritmo projetado para prever os próximos dois ou três movimentos dos adversários em vez de avaliar seus passos até o final do jogo. Embora esta estratégia pareça priorizar o ganho de curto prazo sobre os ganhos de longo prazo, a Vincent de Verge escreve que “a incisividade de curto prazo é realmente tudo o que você precisa”.
Avançando, programas multijogador como o Pluribus poderiam ser usados para projetar drogas capazes de combater bactérias resistentes a antibióticos, bem como melhorar a segurança cibernética e os sistemas robóticos militares. Como As notas de Ouellette da Ars Technica, outras possíveis aplicações incluem a supervisão de negociações multipartidárias, a precificação de produtos e o brainstorming de estratégias de leilão.
Por enquanto, Brown diz a Knight, o algoritmo permanecerá em grande parte sob sigilo - principalmente para proteger a indústria do poker online de incorrer em perdas financeiras devastadoras.
O pesquisador conclui: "Pode ser muito perigoso para a comunidade do poker".