A civilização do Indo, que floresceu durante a maior parte do terceiro milênio aC, foi a sociedade mais extensa de seu tempo. No seu auge, abrangia uma área de mais de meio milhão de milhas quadradas centrada no que hoje é a fronteira Índia-Paquistão. Remanescentes do Indus foram encontrados ao norte até o Himalaia e até o sul de Mumbai. Foi a primeira cultura urbana conhecida do subcontinente e ostentava duas grandes cidades, uma em Harappa e outra em Mohenjo-daro. No entanto, apesar de seu tamanho e longevidade, e apesar de quase um século de investigações arqueológicas, muito sobre o Indus permanece envolto em mistério.
O pouco que sabemos veio de escavações arqueológicas que começaram na década de 1920 e continuam até hoje. Ao longo das décadas, os arqueólogos descobriram um grande número de artefatos, incluindo selos de selos, amuletos e pequenos comprimidos. Muitos desses artefatos carregam o que parecem ser espécimes de escrita - figuras gravadas que se assemelham, entre outras coisas, a ferraduras aladas, rodas raiadas e peixes verticais. O que exatamente esses símbolos podem significar, no entanto, continua sendo um dos mais famosos enigmas não resolvidos na erudição de civilizações antigas.
Houve outros códigos difíceis de serem quebrados na história. Egiptólogos perplexos tiveram um bom golpe com a descoberta da famosa pedra de Roseta em 1799, que continha textos egípcios e gregos. O estudo dos hieróglifos maias perdurou até que um lingüista russo chamado Yury Knorozov fez uso inteligente do Mayan falado na década de 1950. Mas não há uma pedra de Roseta do Indo, e os estudiosos não sabem quais idiomas, se algum, podem ter descendido do idioma falado pelo povo do Indo.
Cerca de 22 anos atrás, em Hyderabad, na Índia, um estudante da oitava série chamado Rajesh Rao virou a página de um livro de história e aprendeu sobre essa fascinante civilização e seu misterioso roteiro. Nos anos que se seguiram, a educação e a profissão de Rao o levaram a uma direção diferente - ele acabou estudando ciência da computação, que ele ensina hoje na Universidade de Washington em Seattle - mas monitorou cuidadosamente a bolsa da Indus, vigiando as dezenas de falhas tentativas de dar sentido ao roteiro. Mesmo estudando inteligência artificial e robótica, Rao acumulou uma pequena biblioteca de livros e monografias sobre o roteiro do Indo, cerca de 30 deles. Em uma estante próxima, ele também mantinha o livro de história da oitava série que o apresentava ao Indus.
"Foi incrível ver o número de idéias diferentes que as pessoas sugeriram", diz ele. Alguns estudiosos afirmaram que a escrita era uma espécie de roteiro sumério; outros o situavam na família dravidiana; outros ainda achavam que estava relacionado a uma língua da ilha de Páscoa. Rao chegou a apreciar que este era "provavelmente um dos problemas mais desafiadores em termos de história antiga".
Como tentativa após tentativa falhou em decifrar o roteiro, alguns especialistas começaram a perder a esperança de que ele pudesse ser decodificado. Em 2004, três estudiosos argumentaram em um artigo polêmico que os símbolos do Indus não tinham conteúdo lingüístico. Em vez disso, os símbolos podem ter sido pouco mais que pictogramas representando figuras políticas ou religiosas. Os autores chegaram a sugerir que o Indo não era uma civilização letrada. Para alguns no campo, toda a busca de tentar encontrar a linguagem por trás dessas gravuras Indus começou a se assemelhar a um exercício de futilidade.
Alguns anos depois, Rao entrou na briga. Até então, as pessoas que estudavam o roteiro eram arqueólogos, historiadores, linguistas ou criptologistas. Mas Rao decidiu persuadir os segredos do script do Indus usando a ferramenta que ele conhecia melhor - ciência da computação.








Em um dia de verão em Seattle, Rao me recebeu em seu escritório para mostrar como ele e seus colegas abordaram o problema. Ele estabeleceu uma coleção de réplicas de impressões de selos de barro que os arqueólogos descobriram nos sites do Indus. Eles são pequenos - como pequenos chocolates quadrados - e a maioria deles apresenta uma imagem de um animal sob uma série de símbolos Indus. A maioria das amostras do roteiro do Indus são miniaturas como essas, contendo apenas alguns caracteres; nenhum grande monólito foi descoberto. Os estudiosos estão incertos sobre a função dos pequenos selos, disse Rao, mas uma teoria é que eles podem ter sido usados para certificar a qualidade dos produtos comercializados. Outro sugere que os selos podem ter sido uma maneira de garantir que os comerciantes pagassem impostos ao entrar ou sair de uma cidade - muitos selos foram encontrados entre as ruínas das casas dos portões, que poderiam ter funcionado como antigas cabines de pedágio.
Rao e seus colegas não procuraram fazer milagres - eles sabiam que não tinham informações suficientes para decifrar o antigo roteiro -, mas levantaram a hipótese de que, usando métodos computacionais, eles poderiam pelo menos começar a estabelecer que tipo de escrita o Indus script foi: codificou a linguagem ou não? Eles fizeram isso usando um conceito chamado "entropia condicional".
Apesar do nome imponente, a entropia condicional é um conceito bastante simples: é uma medida da quantidade de aleatoriedade em uma sequência. Considere o nosso alfabeto. Se você pegar telhas de Scrabble e jogá-las no ar, você pode encontrar qualquer carta antiga aparecendo depois de qualquer outra. Mas em palavras inglesas reais, certas letras são mais prováveis de ocorrer após outras. Um q em inglês é quase sempre seguido por um u . Um t pode ser seguido por um r ou e, mas é menos provável que seja seguido por um n ou um b .
Rao e seus colaboradores - um grupo internacional que inclui cientistas da computação, astrofísicos e matemáticos - usaram um programa de computador para medir a entropia condicional do script do Indus. Em seguida, mediram a entropia condicional de outros tipos de sistemas - linguagens naturais (suméria, tâmil, sânscrito e inglês), uma linguagem artificial (a linguagem de programação de computador Fortran) e sistemas não linguísticos (sequências de DNA humanas, sequências de proteínas bacterianas e dois conjuntos de dados artificiais representando extremos altos e baixos de entropia condicional). Quando compararam a quantidade de aleatoriedade no script do Indus com a dos outros sistemas, descobriram que ela se assemelhava mais às taxas encontradas nas línguas naturais. Eles publicaram suas descobertas em maio na revista Science .
Se parece uma língua, e age como uma linguagem, então provavelmente é uma linguagem, sugere o documento deles. As descobertas não decifram o roteiro, é claro, mas aprimoram nossa compreensão e fornecem segurança aos arqueólogos que vinham trabalhando sob a suposição de que o script do Indus codifica a linguagem.
Depois de publicar o jornal, Rao teve uma surpresa. A questão de qual família de idiomas o roteiro pertence, ao que parece, é sensível: por causa da idade e significado da civilização do Indus, muitos grupos contemporâneos na Índia gostariam de reivindicá-lo como um ancestral direto. Por exemplo, os índios de fala tâmil do sul prefeririam aprender que a escrita do Indo era uma espécie de proto-dravidiana, uma vez que o tâmil é descendente de proto-dravidiano. Os falantes de hindi no norte prefeririam ser uma forma antiga de sânscrito, um ancestral do hindi. O artigo de Rao não conclui a qual família linguística pertence o roteiro, embora note que a entropia condicional é semelhante ao antigo tâmil - fazendo com que alguns críticos sumariamente “nos acusem de ser nacionalistas dravidianos”, diz Rao. "A ferocidade das acusações e ataques foi completamente inesperada."
Rao às vezes se sente aliviado ao retornar ao mundo menos ferozmente contestado da neurociência e da robótica. Mas o apelo do roteiro do Indus continua sedutor, e "o que costumava ser um hobby agora monopoliza mais de um terço do meu tempo", diz ele. Rao e seus colegas estão agora observando sequências de caracteres mais longas do que analisadas no artigo da Science . “Se houver padrões”, diz Rao, “poderíamos chegar a regras gramaticais. Isso por sua vez daria restrições a que tipos de famílias lingüísticas ”o script poderia pertencer.
Ele espera que suas descobertas futuras falem por si mesmas, incitando menos rancor dos oponentes torcendo por uma região da Índia contra outra. Por sua parte, quando Rao fala sobre o que o roteiro do Indo significa para ele, ele tende a falar em termos da Índia como um todo. "A herança da Índia seria consideravelmente enriquecida se pudéssemos entender a civilização do Indo", diz ele. Rao e seus colaboradores estão trabalhando nisso, uma linha de código fonte por vez.