Nas últimas décadas, os pesquisadores desenvolveram regularmente dispositivos destinados a traduzir a Língua Americana de Sinais (ASL) para o inglês, com a esperança de facilitar a comunicação entre pessoas surdas e com deficiência auditiva e o mundo da audição. Muitas dessas tecnologias usam luvas para capturar o movimento de assinatura, que pode ser volumoso e desajeitado.
Agora, um grupo de pesquisadores da Universidade Estadual de Michigan (MSU, na sigla em inglês) desenvolveu um dispositivo sem luvas do tamanho de um tubo de Chapstick que esperam melhorar a tradução do ASL-Inglês.
A tecnologia, chamada DeepASL, usa um dispositivo de câmera para capturar movimentos das mãos e, em seguida, alimenta os dados por meio de um algoritmo de aprendizado profundo, que corresponde a sinais de ASL. Ao contrário de muitos dispositivos anteriores, o DeepASL pode traduzir frases inteiras em vez de palavras isoladas e não exige que os usuários façam uma pausa entre os sinais.
"Esta é uma tecnologia verdadeiramente não intrusiva", diz Mi Zhang, professor de engenharia elétrica e de computação que lidera a pesquisa.
Zhang e sua equipe esperam que o DeepASL possa ajudar pessoas surdas e com deficiência auditiva, atuando como tradutor em tempo real. Pode ser especialmente útil em situações de emergência, diz Zhang, quando esperar por um tradutor pode custar minutos preciosos. O dispositivo, que pode ser integrado a um telefone, tablet ou computador, também pode ajudar a ensinar o ASL, diz Zhang. Como mais de 90% das crianças surdas nascem de pais que estão ouvindo, existe uma grande comunidade de adultos que precisam aprender ASL rapidamente. O DeepASL poderia servir como um tutor digital, dando feedback sobre se os alunos estão assinando corretamente.
Zhang solicitou uma patente e espera ter um dispositivo no mercado dentro de um ano. Por ser baseado em tecnologia acessível - o sistema de captura de movimento Leap Motion é vendido por US $ 78 - poderia ser mais amplamente acessível do que os esforços anteriores.
Os pesquisadores Biyi Fang e Mi Zhang demonstram o DeepASL. (Michigan State University)Mas Christian Vogler, professor de estudos de comunicação na Universidade Gallaudet, uma universidade para pessoas surdas ou com deficiência auditiva, é cético em relação aos dispositivos projetados para traduzir o ASL, e seu ceticismo é compartilhado por muitos na comunidade surda.
Os dispositivos geralmente não “traduzem” verdadeiramente a ASL, apenas reconhecem sinais manuais e os transformam em uma palavra inglesa por sinal, diz Vogler. Isso significa que informações gramaticais-chave são perdidas, informações sobre se uma frase é uma questão, uma negação, uma cláusula relativa e assim por diante. Enquanto o DeepASL traduz sentenças completas, algumas características da gramática ASL vão além dos sinais das mãos - expressões faciais são frequentemente usadas como modificadores, a sobrancelha pode transformar uma frase em uma pergunta, o posicionamento do corpo pode indicar quando o usuário está citando outra pessoa.
Até agora, "nenhum dos sistemas tem sido nem mesmo remotamente útil para as pessoas que assinam", diz Vogler, acrescentando que os pesquisadores muitas vezes parecem ter "muito pouco contato com a comunidade surda e com deficiência auditiva". necessidades. ”
A equipe de Zhang não testou o dispositivo em pessoas surdas e com deficiência auditiva, mas em estudantes de um programa de tradução em língua de sinais. Zhang enfatiza que o DeepASL é projetado para permitir somente comunicação básica neste momento, e que este é apenas um ponto de partida. Ele diz que sua equipe espera ampliar as capacidades do DeepASL no futuro para capturar expressões faciais também.
"Esse será o próximo marco significativo para alcançarmos", diz ele.
Vogler diz que é positivo que a tecnologia MSU esteja usando métodos de aprendizagem profunda, que tiveram sucesso com a linguagem falada. Mas, apesar de não precisar de uma luva, o dispositivo provavelmente tem as mesmas armadilhas de qualquer sistema anterior, já que não captura os movimentos do rosto e do corpo.
Vogler acredita que os pesquisadores devem se afastar da ideia de que os dispositivos de reconhecimento de linguagem de sinais podem realmente atender às necessidades de comunicação em pessoa.
“Temos muitas opções para facilitar a comunicação presencial e, até que tenhamos algo que realmente respeite as propriedades lingüísticas das línguas assinadas e os comportamentos reais de comunicação dos signatários, esses esforços não chegarão nem perto de substituí-los”, diz ele. “Em vez disso, as pessoas precisam trabalhar com membros reais da comunidade e com pessoas que entendam as complexidades dos idiomas assinados.”
Vogler diz que seria útil para a tecnologia de reconhecimento de linguagem de sinais como o MSU trabalhar com interfaces de voz como o Alexa. O crescimento dessas interfaces é um desafio de acessibilidade para pessoas surdas e com deficiência auditiva, diz ele, assim como a internet - um meio amplamente visual - tem apresentado um grande desafio para as pessoas cegas ao longo dos anos.
"Atualmente, não temos uma maneira eficaz e eficiente de interagir com essas interfaces de voz, se não formos capazes de usar nossa voz", diz ele. "O reconhecimento da língua de sinais é uma combinação perfeita para essa situação e que, na verdade, pode acabar sendo útil e usada."