https://frosthead.com

A IA mais recente ensina a jogar sem ajuda humana

No ano passado, um programa de inteligência artificial chamado AlphaGo, criado pela equipe DeepMind do Google, derrotou um campeão humano no Go, um antigo jogo de estratégia chinês que é, em muitos aspectos, mais complexo que o xadrez. Como Emily Matchar relatou para a Smithsonian.com na época, foi uma conquista impressionante, já que em 1997 algumas pessoas estavam prevendo que levaria 100 anos para um computador bater em um humano na Go.

Embora o feito seja impressionante, AlphaGo aprendeu a jogar o jogo analisando jogos anteriores jogados por humanos. Mas, como Merrit Kennedy, da NPR, relata, uma nova versão da inteligência artificial chamada AlphaGo Zero descobriu como dominar o jogo por conta própria, sem intervenção humana ou manipulação - um avanço que tem grandes implicações para o futuro desenvolvimento de inteligência artificial.

De acordo com um comunicado de imprensa da DeepMind, versões anteriores do AlphaGo aprenderam a jogar o jogo estudando partidas entre jogadores amadores profissionais e fortes, absorvendo as regras do jogo e estratégias de jogo bem-sucedidas. O AlphaGo Zero, no entanto, não olhou para nenhum jogo jogado por humanos. Em vez disso, recebeu as regras do jogo e depois jogou contra si mesmo, usando o aprendizado por reforço para se ensinar movimentos certos e errados e estratégias de longo prazo. Quando a IA jogou o jogo, atualizou sua rede neural avançada para melhor prever os movimentos do seu oponente.

Os pesquisadores observaram a IA dominar o jogo em tempo real. Depois de três dias, conseguiu derrotar uma versão anterior chamada AlphaGo Lee, que derrotou o mestre Go Coreano Lee Sedol em 4 de 5 jogos em 2016. Depois de 21 dias, superou AlphaGo Master, a versão que derrotou os 60 melhores jogadores do Go em linha e o o melhor jogador do mundo Ke Jie no início deste ano. A versão mais recente venceu o AlphaGo Master 100 para 0. Depois de 40 dias, alcançou níveis de jogo que ninguém viu antes. A pesquisa aparece na revista Nature.

"Em um curto espaço de tempo, o AlphaGo Zero compreendeu todo o conhecimento Go que foi acumulado por humanos ao longo de milhares de anos de reprodução", diz o pesquisador David Silver, da DeepMind, do Google, em um vídeo do Youtube. “Às vezes, na verdade, é escolhido ir além disso e descobrir algo que os humanos nem haviam descoberto nesse período de tempo e descoberto novas peças de conhecimento que são criativas e inovadoras de várias maneiras.”

Como a Agence France-Presse relata, o AlphaGo Zero alcançou esse nível de domínio com muito mais eficiência do que seus antecessores. Enquanto a iteração anterior tinha 48 unidades de processamento de dados e jogou 30 milhões de jogos de treinamento ao longo de vários meses, Zero tinha apenas 4 unidades de processamento e jogou 4, 9 milhões de jogos de treinamento durante três dias. “As pessoas tendem a supor que o aprendizado de máquina é tudo sobre big data e grandes quantidades de computação, mas na verdade o que vimos com o AlphaGo Zero é que os algoritmos são muito mais importantes”, diz Silver à AFP.

Mas a pesquisa é mais do que apenas dominar um jogo de tabuleiro. Como Ian Sample nos relatórios do The Guardian, esse tipo de aprendizagem pode levar a uma nova geração de inteligência artificial de propósito geral que poderia ajudar a resolver problemas em campos que podem ser bem simulados em um computador, como composição de medicamentos, dobragem de proteínas ou física de partículas. Ao construir seu conhecimento a partir do zero sem preconceitos ou limitações humanas, os algoritmos podem seguir direções que os humanos ainda não pensaram em procurar.

Enquanto muitas pessoas na comunidade de IA vêem o AlphaGo Zero como uma grande realização, Gary Marcus, professor de psicologia da Universidade de Nova York especializado em inteligência artificial, diz a Kennedy da NPR que ele não acha que o algoritmo é verdadeiramente tabula rasa porque o conhecimento humano anterior foi na construção do algoritmo. Ele também não acha que a tabula rasa AI é tão importante quanto parece. “[Na] biologia, os cérebros humanos reais não são tabula rasa ... Eu não vejo a principal razão teórica por que você deveria fazer isso, por que você deveria abandonar muitos conhecimentos que temos sobre o mundo”, diz ele.

Mesmo assim, o rápido domínio do Alpha Go no jogo é impressionante - e um pouco assustador.

A IA mais recente ensina a jogar sem ajuda humana