https://frosthead.com

O teste de Turing mede algo, mas não é "inteligência"

Alan Turing, um dos pais da era da informática, era um homem extraordinariamente inteligente. Tão inteligente, na verdade, que ele entendeu que o termo "inteligência de máquina" era quase sem sentido. Melhor, ele argumentou, falar sobre o que uma máquina pode realmente fazer: pode falar? Pode manter uma conversa? Pelo menos é algo que podemos tentar estudar. Turing eventualmente propôs o que veio a ser conhecido como o “teste de Turing”: Se um juiz não pode dizer qual de duas entidades ocultas é um humano e qual é artificial, a máquina “passou” no teste - que é exatamente o que Diz-se que aconteceu no último sábado em Londres.

Conteúdo Relacionado

  • O Vale do Silício deve seu sucesso a esse gênio da tecnologia que você nunca ouviu falar
  • Previsão de 60 anos de Alan Turing sobre padrões na natureza comprovada

"Estamos orgulhosos em declarar que o teste de Alan Turing foi aprovado pela primeira vez", disse um dos organizadores, Kevin Warwick, da Universidade de Reading, quando os resultados foram anunciados. O chatbot vencedor leva o nome de "Eugene Goostman", um programa de computador que emula a personalidade de um menino ucraniano de 13 anos. "Eugene" conseguiu convencer 33% dos juízes de que era humano no evento de sábado, realizado nos escritórios da Royal Society em Londres, no 60º aniversário da morte de Turing. (Turing, um homossexual, foi condenado por grosseira indecência em 1952 e foi condenado a passar por um "tratamento" hormonal como parte de um acordo judicial. Dois anos depois, ele morreu de envenenamento por cianeto em um aparente suicídio.)

Mas uma palavra de cautela está em ordem. "Inteligência" sempre foi um assunto escorregadio, e o teste de Turing, em particular, tem sido muito polêmico. Turing descreveu como isso funcionaria em um artigo de 1950 intitulado “Computing machinery and intelligence”. Ele tirou a idéia de um tradicional jogo de salão vitoriano, onde você tenta descobrir se a pessoa escondida atrás de uma cortina é um homem ou uma mulher. fazendo perguntas. (As respostas às perguntas tinham de ser escritas, porque a voz seria uma indicação.) Veja como a versão de Turing funcionaria: você teria um juiz, sentado na frente de duas cortinas, sem saber o que está por trás delas. . Atrás de uma cortina é um humano; atrás do outro é um computador. O juiz pode fazer perguntas de qualquer uma das duas entidades ocultas. Com base nas respostas, o juiz tenta descobrir se a entidade oculta é um humano ou uma máquina. (Turing imaginou a conversa como sendo mediada por máquinas de teletipo; hoje, podemos usar qualquer tipo de interface eletrônica baseada em texto, como o tipo usado em salas de bate-papo da Internet ou mensagens instantâneas.)

Turing especulou que, até o ano 2000, “um interrogador médio não terá mais de 70% de chance de fazer a identificação correta” - ou seja, programas de computador trucidariam os juízes 30% do tempo - após cinco minutos de interrogatório. Os "cinco minutos" são importantes. Turing não falou sobre um limite de tempo como sendo parte inerente do teste, e pode-se argumentar que, para uma máquina realmente passar no teste, ela deveria ser capaz de lidar com qualquer quantidade de questionamento. Presumivelmente, o critério de cinco minutos era um limite arbitrário, mas necessário. O ano de 2000 chegou e se foi, com os chatbots fazendo apenas progressos constantes. (Em um momento mais sóbrio, respondendo a uma pergunta de um entrevistador da BBC em 1952, Turing disse que seriam 100 anos antes que uma máquina passasse no teste.)

Em 2012, eu era juiz em uma “maratona de testes de Turing”, o maior conjunto de testes de Turing realizado ao mesmo tempo; foi realizado em Bletchley Park, na Inglaterra, o local do trabalho de quebra de código vital de Turing durante os anos finais da Segunda Guerra Mundial. (Foi organizado pela mesma equipe que organizou o evento de sábado, e uma versão anterior de Eugene foi a vencedora daquela vez também.) O set-up para o evento de sábado foi o mesmo de 2012: os jurados digitaram suas perguntas em um computador então esperou que as respostas aparecessem em suas telas; os chatbots, junto com os "humanos escondidos", estavam em outra sala, fora de vista.

A primeira coisa que me tornei hiperconsciente é que quando você é um juiz em um teste de Turing, cinco minutos passam muito rápido. E quanto menor a conversa, maior a vantagem do computador; quanto mais tempo o interrogatório, maior a probabilidade de o computador se entregar. Eu gosto de chamar isso de efeito manequim: você já pediu desculpas a um manequim de loja de departamento, assumindo que você tinha acabado de encontrar um ser humano vivo? Se o encontro durar apenas uma fração de segundo, com você voltado para o outro lado, você pode imaginar que você apenas roçou um humano. Quanto mais tempo o encontro, mais óbvio é o manequim do manequim.

É o mesmo com os chatbots. Uma troca de hellos não revela nada - mas quanto mais você entra, mais problemas surgem. Chatbots, eu achei, parecem propensos a mudar de assunto sem motivo. Muitas vezes, eles não podem responder perguntas simples. Correndo o risco de parecer vago, eles simplesmente não parecem humanos . Em uma de minhas conversas em 2012, eu digitei uma piada simples - e a entidade com a qual eu estava conversando instantaneamente mudou o assunto para hambúrgueres. (O cientista da computação Scott Aaronson recentemente teve uma experiência semelhante quando conversou com Eugene através do site do bot. Aaronson perguntou a Eugene quantas pernas um camelo tinha; ele respondeu: "Algo entre 2 e 4. Talvez, três? :-)))" Mais tarde, quando Aaronson perguntou quantas pernas uma formiga tinha, Eugene cuspiu exatamente a mesma resposta, triplamente sorridente e tudo mais.

Note também que Eugene não imita um adulto nativo de língua inglesa; Ele finge ser um adolescente ucraniano jovem e um pouco irreverente, conversando em um inglês razoavelmente bom (mas longe de ser perfeito). Como Vladimir Veselov, um dos desenvolvedores do programa, disse ao Mashable.com : “Nós gastamos muito tempo desenvolvendo um personagem com uma personalidade crível.” Embora Eugene envolva alguém em qualquer tópico, sua idade “torna perfeitamente razoável que ele não não sei de tudo. Eugene não aparece e anuncia sua idade e nacionalidade; mas ele revelará se solicitado - e o resultado final pode ser uma certa clemência dos juízes, especialmente em relação à gramática inglesa e ao uso de palavras. (Suponho que a maioria dos juízes no sábado eram falantes nativos de inglês, embora eu não saiba ao certo isso.) As tabelas provavelmente teriam sido mudadas se Eugene fosse encontrar um orador ucraniano nativo como juiz.

A luta para construir uma máquina falante destaca o quão complexa é a linguagem. Não é apenas uma questão de falar - você tem que falar sobre algo, e o que você diz tem que fazer sentido - e tem que fazer sentido no contexto do que a outra pessoa acabou de dizer. Para nós, é fácil; para computadores, não tanto. E assim os chatbots confiam em uma variedade de truques: Memorizando megabytes de respostas enlatadas ou vasculhando a Internet em busca de diálogos que possam aproximar a conversa em que estão atualmente no meio. Em outras palavras, o que uma máquina carece de inteligência pode compensar no poder bruto da computação. É por isso que o Google ou o Siri (o assistente pessoal do iPhone) podem parecer tão inteligentes para nós: a Siri pode não ter uma “mente”, mas tem acesso a um vasto banco de dados de informações, pode agir como se fosse verdade. Foi o mesmo tipo de abordagem de força bruta que permitiu que o “Watson” da IBM vencesse no Jeopardy! em 2011.

Tudo isso levanta uma questão crucial: o que é exatamente o que o teste de Turing está medindo? Alguns críticos sugeriram que é mais uma recompensa do que uma inteligência. O psicólogo da NYU Gary Marcus, escrevendo no NewYorker.com, diz que Eugene consegue “executar uma série de 'truques' projetados para mascarar as limitações do programa.” Steven Harnad, psicólogo e cientista da computação na Universidade de Quebec, em Montreal, foi ainda mais cético, dizendo ao The Guardian que era "absurdo completo" alegar que Eugene havia passado no teste de Turing. (Para seu crédito, Turing estava bem ciente desse problema; ele chamou a idéia de "o jogo da imitação" e falava de inteligência apenas com moderação.) Ainda mais desajeitadamente, o computador, ao contrário do humano, é compelido a enganar. "O Teste de Turing é realmente um teste para ser um mentiroso de sucesso", disse-me Pat Hayes, cientista da computação do Institute for Human and Machine Cognition em Pensacola, Flórida, após a maratona de testes de 2012 de Turing. “Se você tivesse algo que realmente pudesse passar no jogo de imitação de Turing, seria um 'imitador humano' muito bem-sucedido”.

E "humano" é o outro ponto-chave: não é possível que existam outros tipos de inteligência no mundo, além do tipo exibido por nossa espécie? Uma máquina verdadeiramente inteligente teria inúmeras aplicações práticas, mas por que se concentrar em criar mais "pessoas"? Afinal, já temos muita gente. Como o linguista Noam Chomsky apontou, quando nos esforçamos para construir uma máquina que se mova debaixo d'água, não exigimos que ela “nade” - e um submarino não é menos uma conquista por sua incapacidade de fazer o nado de costas.

Sim, Eugene é impressionante, pelo menos em pequenas explosões. E, no entanto, até mesmo os melhores chatbots se deparam com questões que uma criança que a metade da idade de Eugene poderia lidar com despreocupação. Talvez não surpreendentemente, a maioria dos pesquisadores de IA passam pouco tempo obcecados com o teste de Turing. A inteligência da máquina está, de fato, avançando e muito rapidamente. O software de tradução de voz para texto, que era bastante patético há alguns anos, está melhorando rapidamente, assim como os programas de tradução de idiomas. A Amazon geralmente tem uma boa ideia do que você quer comprar antes mesmo de você. E o carro autônomo do Google teria sido mera fantasia há uma década. Mas a conversa, enquanto continuamos a redescobrir, é realmente difícil, e não é provável que seja a fronteira na qual a IA brilha mais intensamente. Por enquanto, se você está procurando alguém para conversar, eu recomendo um ser humano de verdade.

Dan Falk é um jornalista científico radicado em Toronto.

O teste de Turing mede algo, mas não é "inteligência"