https://frosthead.com

Como o GPS aprende a falar seu idioma

Karen Jacobsen, uma cantora australiana e dubladora, conseguiu o show em 2000, logo após chegar em Nova York. Os produtores - tipos corporativos - a enviaram para um estúdio de gravação durante três semanas, onde ela passava quatro horas por dia dizendo coisas como "no próximo cruzamento, vire à esquerda" e "recalculando". No final, não era a voz dela. que estava tenso. "Eu disse 'aproximadamente' aproximadamente 186 vezes", lembra Jacobsen. "Esse tipo de coisa pode fazer você ficar louco".

Conteúdo Relacionado

  • De Ptolomeu ao GPS, a Breve História dos Mapas

Dois anos depois, ela recebeu um telefonema de um amigo. "Karen", seu amigo deixou escapar. “Comprei para o meu marido uma dessas novas coisas de GPS e colocamos na voz australiana. É você! ”Foi assim que Jacobsen descobriu que sua voz estava dando instruções para 400 milhões de pessoas em todo o mundo.

Seu trabalho destaca o híbrido de sangue e tecnologia que vai para as vozes agora onipresentes nos dizendo para onde virar: mais de um bilhão de pessoas confiam no Google Maps todo mês e 80% ativam a opção de voz.

Nos primórdios da síntese de voz - pense nos sons robóticos de um Speak & Spell do final dos anos 70 -, um algoritmo converteu o texto em um fluxo monótono. Então, à medida que os bancos de dados cresciam, você podia gravar um dublador como Jacobsen pronunciando um corpus de sílabas e palavras, que os algoritmos combinariam e alterariam de acordo com as regras básicas. Mais recentemente, codificadores de software em empresas como a Nuance, que projeta interfaces de navegação para carros, desenvolveram uma terceira abordagem - aplicar o aprendizado profundo à síntese de fala. Ele mistura palavras gravadas e trechos sintetizados, confiando na inteligência artificial para tornar a pronúncia ainda mais humana. “Eles soam extraordinariamente naturais”, diz o diretor de tecnologia da Nuance, Vlad Sejnoha.

Naturalmente, as peculiaridades da linguagem continuam sendo um desafio para os sistemas de voz. "Pense 'bough' versus 'comprado' ou 'lido' versus 'lido'", diz um porta-voz do Google. "Mas esperamos que o usuário possa sempre adivinhar o que queremos dizer." Agora que a IA está ensinando sistemas de navegação a falar de forma mais inteligente, em seguida, ela pesquisará o mundo on-line e descobrirá onde você quer ir antes mesmo de você.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Assine a revista Smithsonian agora por apenas $ 12

Este artigo é uma seleção da edição de julho / agosto da revista Smithsonian.

Comprar
Como o GPS aprende a falar seu idioma