Estatísticos e cientistas políticos têm tido um dia de campo com os resultados das eleições iranianas no início deste mês. A eleição foi fraudada? Podemos nunca saber, mas há bastante enterrado na matemática para nos fazer pensar que poderia ter sido assim. Mesmo assim, porém, há também o suficiente para nos fazer acreditar que tudo é legítimo. Aqui estão algumas análises que achei particularmente interessantes:
Limpar dados
Imediatamente após a eleição, dúvidas foram levantadas sobre a legitimidade dos dados, porque cada vez que um novo lote de resultados de votação era divulgado (eles saem em pedaços no Irã, semelhante aos Estados Unidos), a porcentagem de votos indo para o presidente Mahmoud Ahmadinejad. foi o mesmo: 67 por cento. Os dados geralmente não são limpos, e alguns começaram a se perguntar se os resultados foram fabricados.
Uma análise feita pelo professor de matemática da Universidade de Wisconsin, Jordan Ellenberg, em Slate, no entanto, aprofunda os dados para mostrar que era realmente mais bagunçado do que se poderia esperar. Os resultados não saíram de cidade em cidade, mas em grandes lotes que combinavam dados de várias áreas, o que significava que os totais de votos de Ahmadinejad eram na verdade médios. E a Lei dos Grandes Números dita, como Ellenberg escreveu:
As médias de quantidades amplamente variáveis podem, e geralmente produzem resultados que parecem quase perfeitamente uniformes. Dados dados suficientes, os outliers tendem a cancelar um ao outro.
Ellenberg conclui que os dados são "definitivamente confusos o suficiente para serem verdadeiros".
Lei de Benford
Várias análises analisaram os primeiros dígitos dos resultados eleitorais do Irã para verificar se estão de acordo com a Lei de Benford, que é:
Em listas de números de muitas (mas não todas) fontes de dados da vida real, o dígito principal é distribuído de uma maneira específica e não uniforme. De acordo com essa lei, o primeiro dígito é 1 quase um terço do tempo, e dígitos maiores ocorrem como o dígito à frente com frequência mais baixa e mais baixa, até o ponto em que 9 como primeiro dígito ocorre menos de uma vez em vinte. Essa distribuição dos primeiros dígitos surge logicamente sempre que um conjunto de valores é distribuído logaritmicamente.
Uma análise usando essa tática, feita por Boudewijn Roukema, da Universidade Nicolaus Copernicus, na Polônia, concluiu que havia quase o dobro de votos começando com o dígito 7 para Mehdi Karroubi do que seria esperado com a Lei de Benford. Além disso, Roukema suspeitava que os resultados para Ahmadinejad, em que havia menos 1s e mais 2s e 3s do que o esperado, seriam prováveis se alguém escolhesse manipular os resultados alterando os 1s no início dos votos para 2s e 3s Também teria levado a uma superestimativa do total de Ahmadinejad em vários milhões de votos.
Walter Mebane, cientista político e estatístico da Universidade de Michigan, também usou a Lei de Benford em sua análise, na qual ele também encontra várias irregularidades nos resultados eleitorais do Irã. Mas até ele admite que, embora seus resultados sejam "compatíveis com fraudes generalizadas", eles também são "compatíveis com Ahmadinejad, que na verdade venceu".
Os dois últimos dígitos
Dois estudantes de pós-graduação em Ciências Políticas da Universidade de Columbia fizeram uma terceira análise dos dados. Em uma análise que resumiram em um editorial do Washington Post, eles examinaram os dois últimos dígitos da contagem de votos de 29 províncias para cada um dos quatro candidatos (por exemplo, se alguém recebeu 14.579 votos, apenas os 7 e 9 foram considerados em a análise).
Os dois últimos dígitos nos resultados das eleições são ruídos aleatórios, e a distribuição dos dígitos deve ser bastante uniforme - cada dígito deve aparecer em torno de 10% do tempo. Os humanos, no entanto, são pobres geradores de números aleatórios e, quando inventamos números, tendemos a escolher alguns números com mais frequência do que outros. Nos resultados do Irã, apenas 4% dos números terminam no dígito 5, enquanto o dígito 7 aparece 17% do tempo. Resultados que se desviam tanto assim seriam esperados em cerca de quatro em cada cem eleições.
Os humanos também têm problemas para criar números que tenham dígitos não adjacentes (isto é, você tem menos probabilidade de chegar a 72 do que a 23), mas esses números também devem seguir padrões aleatórios e cerca de 70% dos pares devem consistir de não adjacentes dígitos. No entanto, nos resultados do Irã, apenas 62% o fazem. Mais uma vez, estes resultados seriam esperados em cerca de 4 em cada 100 eleições. Mas a combinação dos dois resultados seria esperada em apenas 1 de cada 200 eleições. Improvável, talvez, mas não impossível.
Onde isso nos deixa? Talvez nunca saibamos se os resultados relatados são reais ou não. Meu dado pessoal favorito de tudo isso, porém, não requer cálculos para levar a questões de legitimidade eleitoral. Esta citação, de Abbas-Ali Kadkhodaei, porta-voz do Conselho dos Guardiões do Irã, faria quase qualquer um pensar duas vezes:
As estatísticas fornecidas por Mohsen Resaei em que ele alega que mais de 100% dos elegíveis votaram em 170 cidades não são precisas - o incidente aconteceu em apenas 50 cidades.
(Para mais informações sobre o resultado das eleições no Irã, confira Nate Silver em fivethirtyeight.com)