Quase exatamente 20 anos atrás, o computador da IBM Deep Blue venceu o campeão mundial de xadrez Garry Kasparov em seu próprio jogo. Foi um momento crucial na história da inteligência artificial - a primeira vez que um computador derrotou um campeão humano de xadrez.
Mas para todos aqueles que viram isso como um sinal de que a revolução da IA estava em andamento, os críticos disseram "não tão rápido". O xadrez era relativamente simples de quebrar, eles disseram. O verdadeiro teste da IA seria um computador capaz de derrotar um campeão humano no Go, o complexo jogo chinês antigo de estratégia que envolve a intuição e a compreensão da estética. E esse dia dificilmente chegaria em breve.
"Pode levar cem anos até que um computador supere os seres humanos no Go - talvez até mais", disse o astrofísico e fã do Go, Piet Hut, ao The New York Times em 1997. "Se uma pessoa razoavelmente inteligente aprendeu a tocar Go, em um alguns meses ele poderia vencer todos os programas de computador existentes. Você não precisa ser um Kasparov.
Se um computador derrotasse um campeão do Go, o Times opinou, seria "um sinal de que a inteligência artificial está realmente começando a se tornar tão boa quanto a coisa real".
Bem, pessoal, esse momento chegou, cem anos ou mais antes do previsto. AlphaGo, um programa desenvolvido pela equipe de inteligência artificial do Google DeepMind, venceu o campeão europeu Go Fan Hui 5-0.
As descobertas foram relatadas hoje na revista Nature .
Go começa simplesmente, com um grid 19 por 19 e duas cores de peças (chamadas pedras), preto para um jogador, branco para o outro. Os jogadores se revezam colocando suas pedras em cruzamentos vazios - os pontos de cruzamento de duas linhas de grade. Lentamente, cada jogador tenta cercar as pedras do outro jogador, no ponto em que elas são capturadas e removidas do tabuleiro. Pode haver vários encadeamentos em andamento no quadro a qualquer momento, e muitas vezes é difícil dizer quem está prestes a capturar quem.
“O jogo do Go tem sido visto como o mais desafiador dos jogos clássicos para inteligência artificial devido ao seu enorme espaço de busca e a dificuldade de avaliar posições e movimentos do tabuleiro”, escrevem os autores do artigo.
AlphaGo "aprende" através de ambos os treinamentos de especialistas humanos, e através da prática jogando contra si mesmo. Como o Go tem muitos movimentos possíveis para que um computador simplesmente processe os dados ao tomar sua próxima decisão - um grande obstáculo para os esforços avançados de Inteligência Artificial - o AlphaGo usa duas “redes neurais profundas” diferentes. Uma rede é chamada de “Rede de políticas” - isso dá ao computador um punhado de movimentos promissores a serem considerados, com base em jogos passados, para que ele não precise analisar todos os movimentos possíveis. A "rede de valores" reduz a profundidade da pesquisa - ou seja, em vez de pesquisar até o final do jogo, a centenas de movimentos de distância, o programa pode parecer a apenas alguns passos para fazer suas escolhas.
Isso é um grande negócio: além de ser um teste dos poderes da IA, criar um programa de Go-playing capaz de derrotar campeões humanos tem sido uma espécie de corrida armamentista. Durante anos, vários programadores e empresas clamaram para criar a versão Go do Deep Blue. Alguns chegaram perto. Um programa francês chamado Crazy Stone venceu cinco vezes o campeão japonês Yoshio Ishida em 2013, mas Crazy Stone recebeu uma desvantagem (AlphaGo não era) e Ishida não tinha sido considerado um dos melhores jogadores em várias décadas. Até agora, o AlphaGo superou outros programas Go em 99, 8% do tempo.
Poucas horas antes de o Google divulgar oficialmente suas notícias, o Facebook, sem dúvida se arrependeu de ter sido espancado, soltou o anúncio de que sua própria inteligência artificial estava "chegando perto" de vencer os campeões humanos.
Então por que o Go é considerado um teste tão poderoso da IA? Seria muito redutor dizer que Go é mais fácil que o xadrez.
“O jogo reflete as habilidades dos jogadores em equilibrar ataque e defesa, fazendo com que as pedras funcionem eficientemente, permanecendo flexíveis em resposta a mudanças de situação, tempo, analisando com precisão e reconhecendo os pontos fortes e fracos do oponente”, explica a British Go Association. site, respondendo pelo apelo complexo da Go.
Enquanto o xadrez tem uma média de 35 movimentos legais por turno, o Go tem uma média de 200. E enquanto houver 10⁴³ Possíveis configurações de um tabuleiro de xadrez, um tabuleiro Go tem pelo menos 2.08 X 10¹⁷⁰ - mais configurações do que átomos no universo. Ao contrário do xadrez, onde o número de peças no tabuleiro é um bom indicador de quem está ganhando, é muito difícil saber quem está à frente no Go.
"Não há uma boa heurística para determinar se uma posição é boa ou ruim para um jogador", explica Jon Diamond, presidente da Associação Britânica Go. “É em parte análise e é parcialmente reconhecimento de padrões. Você avalia a diretoria de uma maneira complicada, não conseguimos descobrir como replicar em computadores. ”
Diamond diz que ficou surpreso ao saber do sucesso da AlphaGo. "Eu acho que não estava esperando por isso entre cinco e dez anos para ser honesto", diz ele. "Eles fizeram um bom trabalho."
O sucesso do AlphaGo pode significar que estamos muito mais perto do que se pensava que possuíssem IAs capazes de atuar em níveis humanos em outras áreas. O AlphaGo pode ser um “trampolim” para outros tipos de IA, dizem seus desenvolvedores. Uma IA que possa tomar decisões complexas e intuitivas necessárias para ganhar o Go pode, por exemplo, diagnosticar um paciente doente e prescrever um tratamento individualizado, de acordo com os desenvolvedores.
Em março, o AlphaGo terá seu teste testado novamente, quando enfrentará o sul-coreano Lee Sedol, considerado o melhor jogador de Go do mundo.
“Independentemente do resultado, será um evento significativo na história do baduk (Go)”, diz Lee em um comunicado de imprensa. "Ouvi dizer que a IA do Google DeepMind é surpreendentemente forte e está cada vez mais forte, mas estou confiante de que posso ganhar pelo menos desta vez."