Tweets de todo o mundo, plotados por localização como parte de um novo estudo. Clique para ampliar. Imagem via First Monday / Leetaru et. al.
É difícil avaliar a rapidez com que o Twitter conquistou o mundo. Apenas sete anos atrás, em 2006, foi uma ideia esboçada em um bloco de papel. Agora, o serviço é usado por cerca de 554 milhões de usuários - um número que equivale a quase 8% de todos os seres humanos no planeta - e cerca de 170 bilhões de tweets foram enviados, com esse número aumentando em 58 milhões a cada dia. .
Todos esses tweets fornecem uma fonte inestimável de notícias, entretenimento, conversas e conexões entre as pessoas. Mas para os cientistas, eles também são valiosos como algo bastante diferente: dados brutos.
Como o Twitter apresenta uma API aberta (que permite o download de tweets como dados brutos e analisáveis) e muitos tweets são georreferenciados, os pesquisadores podem usar bilhões desses tweets e analisá-los por localização para aprender mais sobre a geografia dos seres humanos em todo o planeta. No outono passado, como parte do Global Twitter Heartbeat, uma equipe da Universidade de Illinois analisou o idioma e a localização de mais de um bilhão de tweets nos EUA para criar mapas sofisticados de coisas como emoções positivas e negativas expressas durante o furacão Sandy ou apoio a Barack. Obama ou Mitt Romney durante a eleição presidencial.
Como Joshua Keating observou no blog War of Ideas da Foreign Policy, membros do mesmo grupo, liderados por Kalev Leetaru, deram um passo adiante. Como publicado em um novo estudo no início desta semana na revista online First Monday, eles analisaram os locais e idiomas de 46.672.798 tweets postados entre 23 de outubro e 30 de novembro do ano passado para criar um retrato impressionante da atividade humana ao redor do planeta, mostrada no parte superior do post. Eles fizeram uso do Twitter, um fluxo de dados que captura aleatoriamente 10% de todos os tweets em todo o mundo a qualquer momento (totalizando 1.535.929.521 no período de tempo), e simplesmente focados nos tweets com dados geográficos associados.
Como observam os pesquisadores, a densidade geográfica de tweets em muitas regiões - especialmente no mundo ocidental, onde computadores, dispositivos móveis e Twitter são usados em níveis máximos - corresponde de perto às taxas de eletrificação e uso de iluminação. Como resultado, os mapas de tweets (como a visão detalhada dos EUA continentais, abaixo) acabam se parecendo muito com imagens de satélite de luz artificial à noite.
Clique para ampliar. Imagem via First Monday / Leetaru et. al.
Como um teste para ver como os tweets combinavam com o uso de luz artificial, eles criaram o mapa composto abaixo, no qual os tweets são mostrados como pontos vermelhos e a iluminação noturna é mostrada como azul. As áreas onde elas correspondem em frequência (e efetivamente se anulam mutuamente) são mostradas em branco, e as áreas onde uma supera a outra permanecem em vermelho ou azul. Muitas áreas acabam parecendo bastante brancas, com algumas exceções importantes: o Irã e a China, onde o Twitter é proibido, são visivelmente azuis, enquanto muitos países com taxas de eletrificação relativamente baixas (mas onde o Twitter ainda é popular) aparecem como vermelhos.
Clique para ampliar. Imagem via First Monday / Leetaru et. al.
O projeto ficou ainda mais interessante quando os pesquisadores usaram um sistema automatizado para separar os tweets por idioma. O idioma mais comum no Twitter é o inglês, que é representado em 38, 25% de todos os Tweets. Depois vieram os japoneses (11, 84%), os espanhóis (11, 37%), os indonésios (8, 84%), os noruegueses (7, 74%) e os portugueses (5, 58%).
A equipe construiu um mapa de todos os tweets escritos nos 26 idiomas mais populares, cada um representado por uma cor diferente, abaixo:
Clique para ampliar. Imagem via First Monday / Leetaru et. al.
Enquanto os tweets da maioria dos países são dominados por seus idiomas oficiais, muitos são revelados para incluir tweets em uma variedade de outros idiomas. Olhe bem de perto, e você verá um arco-íris de cores sutilmente surgindo dos pontos cinzas (tweets ingleses) que cobrem os EUA:
Clique para ampliar. Imagem via First Monday / Leetaru et. al.
Entre outras análises, a equipe de pesquisa analisou a geografia de retweeting e referenciamento - a distância média entre um usuário e alguém que ele ou ela retweetou, bem como a distância média entre esse usuário e alguém que ele simplesmente menciona em um tweet. Em média, a distância para um retweet foi de 1.115 milhas e 1.118 para uma referência. Mas, contraintuitivamente, havia uma relação positiva entre o número de vezes que um usuário retweetou ou referenciou outro usuário e sua distância: os pares de usuários com apenas um punhado de interações, em geral, tinham maior probabilidade de estarem mais próximos (500- 600 milhas à parte) do que aqueles com dezenas de retweets e referências entre eles.
Isso indica que os usuários que moram longe estão mais propensos a usar o Twitter para interagir regularmente. Uma explicação pode ser que as entidades com mais seguidores - e, portanto, a maioria das referências e retweets - são frequentemente celebridades, organizações ou corporações, usuários com os quais as pessoas estão familiarizadas, mas que na verdade não têm um relacionamento pessoal. Um mapa global de retweets entre usuários está abaixo:
Clique para ampliar. Imagem via First Monday / Leetaru et. al.
O documento foi ainda mais detalhado em outros dados associados a tweets: a relação entre a cobertura noticiosa convencional e o número de tweets num país (a Europa e os EUA recebem cobertura mediática desproporcionada, enquanto a América Latina e a Indonésia são ignoradas), A maioria dos usuários recentemente (o Oriente Médio e a Espanha) adicionou os usuários e os locais onde os usuários têm, em média, mais seguidores (América do Sul e Costa Oeste).
Existem algumas ressalvas em todos esses dados. Por um lado, embora os tweets analisados totalizem dezenas de milhões, eles ainda são apenas 0, 3% de todos os tweets enviados, portanto podem não representar adequadamente todos os padrões do Twitter, especialmente se usuários que permitem geotagging se comportarem de maneira diferente de outros. Além disso, no mundo em rápida mudança do Twitter, algumas tendências podem ter mudado significativamente desde o outono passado. Mas como o Twitter continua a crescer e mais dados se tornam disponíveis, é lógico que esse tipo de análise só se tornará mais popular para demógrafos, cientistas da computação e outros pesquisadores.