https://frosthead.com

Conversando com máquinas

Software de reconhecimento de voz, a maioria de nós provavelmente concordaria, é uma coisa muito legal. Mas a parte de falar com as máquinas - seja smartphone, tela de TV ou painel de instrumentos - bem, não tanto. Pedir conselhos de um dispositivo? Reeks de geek. Enunciando cada palavra para que você possa ser entendido? Quão legal você pode realmente ser?

Mas a Apple, fiel à forma, assumiu essa posição contratando três ícones de legal para estrelar em sua mais recente campanha publicitária para a Siri, a voz do iPhone 4S. Há Zooey Deschanel (Adorável Cool) e John Malkovich (Cerebral Cool) e Samuel L. Jackson (Ultimate Cool), e todos fazem um jogo de palavras com um telefone parece o esporte dos deuses.

Os críticos, no entanto, apontam que, na vida real, Siri não é tão responsiva nem onisciente como é retratada nos comerciais. Você também, tenho certeza, fica chocado ao ouvir isso. Outros vêem a coisa toda como algo maduro para a paródia - veja o irmão de Zooey, Jooey, fazer uma versão de Funny or Die do dia chuvoso de Zooey e Siri juntos.

Não importa. Siri se tornou uma cantora líder no coro de robôs, a voz de “You Got Mail” de uma nova geração.

Está na moda em alguns círculos sugerir que Siri não é digno de Steve Jobs, que se ele ainda estivesse vivo, Jobs o teria tirado do mercado ou, pelo menos, nunca teria aprovado um anúncio tão importante. campanha por um produto tão falho.

Mas, como o sucessor de Jobs, Tim Cook, disse no início desta semana, os proprietários do iPhone 4S, como Siri. De acordo com uma pesquisa divulgada em março, quase 90% dizem que usam pelo menos uma vez por mês. E lembre-se que a Siri, um dos poucos produtos da Apple que se diz estar na versão beta quando foi lançada, não comemora seu primeiro aniversário até outubro. Ela ainda está aprendendo a linguagem e, o mais importante, apenas começando a explorar o potencial da inteligência artificial.

Siri provavelmente será uma peça central da Apple TV, prevista para fazer sua estréia em dezembro. Mas as chances são de que o lugar onde falar com as máquinas seja popular está em nossos carros.

Dirija, ela disse

Claro, isso já está acontecendo, mas você ainda precisa mudar para o robô, se quiser ser entendido. E mesmo assim não há garantia. Isso vai começar a mudar neste verão, quando alguns novos modelos virão equipados com algo chamado Dragon Drive!

É a invenção da Nuance Communications, uma empresa com sede em Massachusetts que se tornou uma potência no negócio de reconhecimento de voz. (Acredita-se que seja o cérebro por trás do Siri.) O reconhecimento de nuances e voz nos carros deu um grande salto na semana passada quando a empresa anunciou que o Dragon Drive! será capaz de tocar na nuvem.

Isso significa que o sistema aumentará drasticamente seu poder de computação e capacidade de memória. E isso significa que a voz em seu painel se tornará mais parecida com Siri e permitirá que você converse com ela. Não há mais gritos monossílabos. Chegará o dia em que você poderá mencionar casualmente que se sente como um Allman Brothers e, segundos depois, “Whipping Post” virá pelos alto-falantes.

A chave é quão bem somos capazes de ensinar o contexto e a pragmática das máquinas - como a linguagem é usada em situações sociais. E isso é negócio complicado. Para começar, até mesmo o dispositivo de reconhecimento de voz mais sofisticado precisa esperar que um humano termine de falar para poder analisar e interpretar a frase inteira. Depois, há a "teoria da mente", a capacidade de entender que outras pessoas podem ter crenças e intenções diferentes das nossas. Até onde sabemos, apenas humanos podem fazer isso.

Um estudo recente feito por dois psicólogos de Stanford pode lhe dar uma ideia do que está envolvido em ajudar as máquinas a intuir. Os pesquisadores Michael Frank e Noah Goodman criaram uma experiência on-line em que os participantes foram solicitados a examinar um conjunto de objetos e selecionar qual deles estava sendo referida como uma palavra específica. Por exemplo, um grupo de participantes viu um quadrado azul, um círculo azul e um quadrado vermelho. A pergunta para esse grupo era: Imagine que você está falando com alguém e quer se referir ao objeto do meio. Qual palavra você usaria, "azul" ou "círculo"?

O outro grupo foi perguntado: Imagine que alguém está falando com você e usa a palavra “azul” para se referir a um desses objetos. Qual objeto eles estão falando?

As respostas ajudaram os pesquisadores a obter uma imagem mais clara de como um ouvinte entende um palestrante e como um palestrante decide o que dizer. A partir disso, eles desenvolveram o tipo de modelo matemático que pode expandir e refinar o processo de pensamento de um computador.

Frank disse: "Vai levar anos de trabalho, mas o sonho é de um computador que realmente está pensando sobre o que você quer e o que você quer dizer, em vez de apenas o que você disse."

Uma maneira de falar

Aqui estão alguns desenvolvimentos mais recentes no reconhecimento de voz:

  • Siri fica em silêncio: a IBM tende a ficar realmente nervosa sobre os segredos corporativos, e agora proíbe que seus funcionários usem sites públicos de transferência de arquivos, como o Dropbox. Mas também proibiu o uso de Siri no escritório porque os executivos de segurança temem que alguém, enquanto fala ao celular, possa revelar informações confidenciais que acabam nos servidores da Apple.
  • Leve isso, a Apple !: A Samsung lançou seu novo smartphone Galaxy X III em Londres esta semana, e enquanto sua grande tela sensível ao toque está recebendo muita atenção, ela também possui novo software de reconhecimento de voz e rosto.
  • Faça o que eu digo, não o que eu faço: E a Samsung não pára por aí. Recentemente, apresentou um pedido de patente para um robô que entende a fala humana. O robô seria capaz de ajustar seus recursos de “escuta” para levar em conta o ruído ambiente que poderia interromper ou interromper os comandos que foram dados. Também seria capaz de reconhecer quem está falando com ele, mesmo que o ruído de fundo seja muito alto.

Bônus Infográfico: Você acha que seu carro agora está computadorizado. Espere até que esteja completamente conectado à Internet. Conheça o que um carro conectado pode fazer.

Conversando com máquinas