https://frosthead.com

Kissing Language Barriers Goodbye

Por muito tempo, o tradutor universal tem sido uma obsessão da cultura pop. Star Trek a apresenta como uma máquina portátil, parecida com um microfone, que pode traduzir a maioria dos idiomas imediatamente . O Guia do Mochileiro das Galáxias possui um peixe Babel, uma criatura que, quando presa dentro da orelha, oferece tradução instantânea de qualquer idioma da galáxia.

Portanto, não é de surpreender que os seres humanos atuais estejam tentando criar um dispositivo que funcione tão bem. Há dezenas de aplicativos de tradução para smartphones, mas a maioria traduz palavras em uma base simples e individual; um usuário digita ou fala uma palavra e o aplicativo volta com uma tradução. Agora, o objetivo, e a verdadeira vantagem monetária, é que engenheiros e empreendedores possibilitem que duas pessoas conversem em diferentes idiomas, enquanto um pequeno dispositivo produz traduções em tempo real.

Apps de tradução existentes

Em uma viagem à Grécia, Andrew Lauder, de língua inglesa, adoeceu.

"Eu fui à farmácia, e eles não conseguiam entender nenhum inglês, então eu não recebi nenhum remédio", diz Lauder, CEO da Vocre Translate. Os rótulos das drogas eram literalmente gregos para ele. Barreiras linguísticas são comuns para viajantes do mundo. Em um país estrangeiro, pequenas transações como comprar remédios ou obter orientações - outra dificuldade que Lauder enfrentou - tornam-se tarefas hercúleas.

Quando ele retornou, Lauder criou o Vocre Translate, um aplicativo de tradução de voz e texto. Começou como um aplicativo texto-para-texto (chamado MyLangauge), então inicialmente transformado em um modelo de fala para texto que, como outros aplicativos, incluindo o SayHi Translate, usava um modelo tradicional em que uma palavra se traduz diretamente para outra palavra. Diga “Olá”, e o smartphone ou tablet recita um “Hola” automatizado. “Adeus” se torna “Sayonara”. E assim por diante, muito parecido com um tradutor de texto.

Para criar a tradução de áudio simples, os criadores desses aplicativos precisavam de dados. O Vocre retirou suas informações de gravações e documentos de domínio público, como filmes antigos ou audiências públicas. “Basicamente, imploramos a um serviço de transcrição de correio de voz para permitir que usássemos sua nuvem para reconhecimento de fala”, diz Lee Bossier, CEO da SayHi.

Uma vez que os engenheiros tinham dados de áudio e texto, eles emparelharam o áudio e o texto, palavra por palavra. O software de reconhecimento de voz reconhece “queijo” e o converte em texto. Isso é convertido em francês, e o aplicativo encontra a pronúncia francesa para "fromage".

Dito isso, se um usuário insinuou algo brega, o tradutor não funciona tão bem, porque a linguagem falada não é tão estática quanto a linguagem escrita. Cadência, gíria, inflexão, pronúncia, dialeto e fluxo de conversação podem mudar o significado

Com o tempo, porém, Lauder queria um dispositivo mais conversacional. Em um e-mail, ele diz: “Com base em nossos dados de uso, descobrimos que as pessoas falam de maneira muito diferente da maneira como escrevem. A palavra falada é muito mais espontânea e muito menos formal e literal. ”Assim, ele empregou a tradução automática estatística, uma abordagem também usada pelo Google que usa dados para encontrar o uso comum de palavras, renunciando ao tradicional modelo de tradução palavra-a-palavra. Basicamente, o Vocre aprende como é usado. “Aprende com base em todas as conversas, em todas as frases que passam por isso. É algo que fica mais inteligente ao longo do tempo ”, diz Lauder.

Ainda assim, no momento, ambos os aplicativos levam alguns segundos para serem traduzidos, mas sem dúvida são eficazes, especialmente em conjunto com a linguagem corporal, para conversas transacionais como encomendar uma refeição. Afinal de contas, os humanos têm encomendado alimentos em línguas não nativas há anos e sempre conseguem comer. Mas eles não conseguiram ter conversas complexas e profundas.

Com o Vocre e o SayHi, as conversas podem durar pouco, mas não é o mesmo que conversar em seu idioma nativo. O Google pretende mudar isso completamente.

Abordagem do Google (Statistical Machine Translation)

Quando aprendemos uma nova língua na escola, começamos com termos de vocabulário individual. Mas a linguagem é mais fluida - as palavras precisam de contexto.

"A abordagem [do Google] é uma abordagem mais geral", diz Josh Estelle, engenheiro de software do Google Translate. "Em vez de tentar codificar todas essas regras, tentamos aprender as regras observando os dados."

A empresa de tecnologia evita o método one-to-one, palavra por palavra e emprega a tradução automática estatística, olhando não para o que as palavras significam, mas como a linguagem é modelada, o que ela aprende através dos dados . Então, ele aponta para a floresta, não para as árvores. Um exemplo em inglês: conhecemos as definições da palavra “break” e “up”. Mas a frase “break up” não é a combinação literal das duas palavras.

A tradução automática estatística requer dados. Montanhas disto. Para que o método funcione, ele não precisa apenas do fato de que “queijo fresco” é francês para queijo, mas 100 exemplos de “queijo fresco” e queijo sendo usado em sentenças reais.

Estelle diz que, se um falante de inglês tem dois menus, idênticos, exceto pelo fato de que um é impresso em inglês e um em chinês, "provavelmente você pode descobrir qual é o caractere chinês para 'sopa'". O contexto é rei. Mas para criar esse contexto, você precisa acessar milhões de menus e todos os outros documentos imagináveis.

Qual é exatamente o que o Google tem. Sem o gigante da web para coletar grandes quantidades de dados, um peixe Babel do mundo real não poderia existir. Ele rastreia a web e coleta tudo - texto e áudio. Em seguida, ele alimenta esses dados em algoritmos que comparam tudo com todo o resto. Essas comparações ajudam a chegar à raiz de como a linguagem funciona naturalmente.

"Uma coisa que surpreende as pessoas quando falamos sobre o Google Translate é que nossa equipe não tem nenhum linguista sobre isso", diz Estelle. “Lançamos 71 idiomas e eu diria que nossa equipe não sabe falar a grande maioria deles. Um tradutor humano não será capaz de aprender todos esses termos e coisas tão rápido quanto nossos [dados] podem aprender da web. ”

Qual é o ponto?

Como o Google, o Facebook vê benefícios. Considere a própria investida do site de mídia social na tradução.

“A missão do Facebook está conectando o mundo inteiro, e uma das barreiras para conectar o mundo é que nem todo mundo fala a mesma língua”, diz Tom Stocky, diretor de engenharia do Facebook. “No lado da tradução, acho que a visão realmente ambiciosa para o futuro é se você pudesse usar o Facebook em sua língua nativa e interagir com qualquer outra língua.”

Em agosto passado, o Facebook adquiriu o Jibbigo, um aplicativo de tradução de fala para fala que está disponível para dispositivos Android e iOS.

Usuários interessados ​​do Facebook notarão que o site social já emprega alguma tradução. Se você já teve uma postagem em espanhol na sua página em inglês, você recebeu imediatamente a oportunidade de traduzi-la para sua língua nativa.

Mas Stocky vê o componente de voz como um potencial de mudar o jogo. A ascensão de smartphones e tablets dá as boas-vindas a um mundo perpetuamente interconectado, e a ascensão do software de reconhecimento de voz está convidando a novos meios de interação na web. Stocky prevê um futuro em que os usuários podem apenas falar um comando para seus smartphones e interagir com outros usuários, além das diferenças de idioma.

"Não há dúvida de que isso acontecerá eventualmente, porque as únicas limitações são o poder do mecanismo de linguagem e, é claro, o tempo de processamento e o poder de processamento", diz ele.

Laura Murphy, professora do departamento de sistemas globais de saúde e desenvolvimento da Universidade de Tulane e ceticista admitida em tecnologia, questiona o valor de um tradutor universal e não precisa saber mais do que um idioma.

Ela acha que o dispositivo poderia ser um pouco útil em viagens, negócios e relações internacionais, mas não inovador. Em um certo nível, já temos tradutores (pessoas) no lugar, e a maioria dos que trabalham em relações estrangeiras conhecem os idiomas apropriados. Um dispositivo, Murphy acredita, poderia ter consequências negativas.

"Eu acho que isso pode deixar as pessoas preguiçosas", diz Murphy. Traduzir linguagens pode ser mentalmente desafiador, forçando o cérebro - especialmente um que conhece mais de dois idiomas - a trabalhar de uma maneira diferente, mas o exercício é gratificante, no entanto. O cérebro puxa de um lugar de empatia lingüística que até mesmo o melhor tradutor de voz nunca poderia alcançar.

Embora essa comunicação universal possa ser positiva, Murphy reconhece, “pode levar as pessoas a pensarem que estão se comunicando quando não estão”. A cultura nem sempre é completamente incorporada na linguagem (por exemplo, sarcasmo), e a comunicação não é sempre sobre a informação que está sendo passada.

Quando podemos esperar para ver esta tecnologia?

“Em 2005, levamos 40 horas para traduzir 1.000 sentenças”, diz Estelle, do Google. “Hoje, traduzimos o equivalente a 1.000 sentenças a cada 10 milissegundos.”

Como Richard Anderson disse na série de TV dos anos 1970, The Six Million Dollar Man, “Nós temos a tecnologia”. Agora, é apenas esperar pela coleta e análise de dados. Quanto tempo isso vai demorar permanece desconhecido, de acordo com Estelle. Mas estimativas cautelosas colocam esse dispositivo em nossas mãos dentro de uma década.

Enquanto criadores de aplicativos como Bossier ou empresas gigantes como Google e Facebook não querem construir suas próprias versões da Torre Bíblica de Babel, ele quer acabar com o balbuciar. Ele prevê um mundo onde todos nos comunicamos, sobre medicina, sobre política, sobre idéias.

E esse mundo pode não estar longe.

Nota do editor: Atualizamos essa história em 4 de abril de 2014 para descrever com precisão a tecnologia Vocre Translate.

Kissing Language Barriers Goodbye