https://frosthead.com

Seus tweets podem prever quando você vai pegar a gripe

Em 1854, em resposta a uma devastadora epidemia de cólera que varria Londres, o médico britânico John Snow introduziu uma ideia que revolucionaria o campo da saúde pública: o mapa epidemiológico. Ao registrar casos de cólera em diferentes bairros da cidade e plotando-os em um mapa com base nas residências dos pacientes, ele descobriu que uma única bomba de água contaminada era responsável por grande parte das infecções.

O mapa persuadiu-o - e, eventualmente, as autoridades públicas - que a teoria da doença de miasma (que afirmava que as doenças se espalham por gases nocivos) era falsa e que a teoria dos germes (que afirmavam corretamente que os microrganismos eram culpados) era verdadeira. Eles colocaram um bloqueio na alça da bomba responsável pelo surto, sinalizando uma mudança de paradigma que mudou permanentemente a forma como lidamos com doenças infecciosas e, portanto, o saneamento.

A tecnologia de mapeamento é bem diferente, assim como a doença, mas há certa similaridade entre o mapa de Snow e um novo projeto conduzido por um grupo de pesquisadores liderado por Henry Kautz, da Universidade de Rochester. Ao criar algoritmos que podem detectar tendências da gripe e fazer previsões baseadas em palavras-chave em tweets georreferenciados publicamente disponíveis, eles estão adotando uma nova abordagem para estudar a transmissão de doenças - que pode mudar a forma como estudamos e rastreamos o movimento de doenças na sociedade .

“Podemos pensar nas pessoas como sensores que estão olhando para o mundo ao seu redor e relatando o que estão vendo e experimentando nas mídias sociais”, explica Kautz. "Isso nos permite fazer medições detalhadas em uma escala populacional e não requer participação ativa do usuário."

Em outras palavras, quando nós twitamos que acabamos de ser abatidos por uma tosse dolorosa e uma febre, estamos inconscientemente fornecendo dados ricos para um enorme experimento de saúde pública, informações que os pesquisadores podem usar para rastrear o movimento de doenças como a gripe. em alta resolução e em tempo real.

O projeto de Kautz, chamado SocialHealth, fez uso de tweets e outros tipos de mídia social para rastrear uma série de problemas de saúde pública - recentemente, eles começaram a usar tweets para monitorar casos de intoxicação alimentar em restaurantes de Nova York registrando todos que postaram tweets geotagged de um restaurante, em seguida, seguindo seus tweets para as próximas 72 horas, verificando menções de vômitos, diarréia, dor abdominal, febre ou calafrios. Ao fazer isso, eles detectaram 480 prováveis ​​casos de intoxicação alimentar.

Mas, à medida que a estação muda, é o trabalho deles rastreando o vírus da gripe que é mais revelador. O Google Tendências da Gripe também procurou usar os pesquisadores do Google para rastrear o movimento da gripe, mas o modelo superestimou muito o surto do ano passado, talvez porque a cobertura da gripe pela mídia levou as pessoas a começarem a fazer consultas relacionadas à gripe. A análise do Twitter representa um novo conjunto de dados com algumas qualidades - uma resolução geográfica mais alta e a capacidade de capturar o movimento de um usuário ao longo do tempo - que poderia render melhores previsões.

Para iniciar seu projeto de rastreamento da gripe, os pesquisadores do SocialHealth analisaram especificamente Nova York, coletando cerca de 16 milhões de tweets públicos georreferenciados por mês de 600.000 usuários durante três meses. Abaixo está um lapso de tempo de um dia no Twitter de Nova York, com cores diferentes representando diferentes freqüências de tweets naquele local (azul e verde significam menos tweets, laranja e vermelho significam mais):

Para fazer uso de todos esses dados, sua equipe desenvolveu um algoritmo que determina se cada tweet representa um relatório de sintomas semelhantes aos da gripe. Anteriormente, outros pesquisadores simplesmente faziam isso procurando por palavras-chave em tweets (“doente”, por exemplo), mas sua equipe descobriu que a abordagem leva a falsos positivos: muitos mais usuários tuitam que estão cansados ​​do dever de casa do que são sentindo doente.

Para explicar isso, o algoritmo de sua equipe procura três palavras seguidas (em vez de uma) e considera com que frequência a sequência específica é indicativa de uma doença, com base em um conjunto de tweets que eles rotularam manualmente. A frase “doente de gripe”, por exemplo, está fortemente correlacionada com a doença, enquanto “doente e cansado” é menos. Algumas palavras em particular - dor de cabeça, febre, tosse - estão fortemente ligadas à doença, independentemente da sequência de três palavras da qual façam parte.

Uma vez que esses milhões de tweets foram codificados, os pesquisadores poderiam fazer algumas coisas intrigantes com eles. Para começar, eles analisaram as mudanças nos tweets relacionados à gripe ao longo do tempo e os compararam com os níveis de gripe relatados pelo CDC, confirmando que os tweets capturaram com precisão a tendência geral das taxas de gripe. No entanto, ao contrário dos dados do CDC, está disponível quase em tempo real, em vez de uma semana ou duas depois do fato.

Mas eles também foram mais fundo, observando as interações entre diferentes usuários - representados por dois usuários twittando no mesmo local (a resolução do GPS é cerca de meio quarteirão) dentro da mesma hora - para modelar a probabilidade de uma pessoa saudável adoeceria depois de entrar em contato com alguém com gripe. Obviamente, duas pessoas twittando do mesmo bloco com 40 minutos de intervalo não necessariamente se encontravam pessoalmente, mas as chances de elas terem se encontrado são ligeiramente maiores do que dois usuários aleatórios.

Como resultado, quando você olha para um conjunto de dados grande o suficiente de interações, surge uma imagem da transmissão. Eles descobriram que, se um usuário saudável encontra 40 outros usuários que se dizem doentes com sintomas de gripe, sua chance de contrair sintomas de gripe no dia seguinte aumenta de menos de um por cento para 20 por cento. Com 60 interações, esse número sobe para 50%.

A equipe também analisou as interações no próprio Twitter, isolando pares de usuários que se seguem e chamando-os de “amizades”. Embora existam muitos relacionamentos com o Twitter apenas na Web, alguns correspondem a interações da vida real e descobriram que um usuário Quem tem dez amigos que se dizem doentes é 28% mais propenso a adoecer no dia seguinte. No total, usando ambos os tipos de interações, seu algoritmo foi capaz de prever se uma pessoa saudável ficaria doente (e twittaria sobre isso) com 90% de precisão.

Ainda estamos nos estágios iniciais dessa pesquisa, e há muitas limitações: a maioria das pessoas ainda não usa o Twitter (sim, realmente) e, mesmo que isso aconteça, elas podem não twittar sobre adoecer.

Mas, se esse tipo de sistema puder ser desenvolvido, é fácil imaginar todo tipo de aplicativo. Seu smartphone pode avisar automaticamente, por exemplo, se você passou muito tempo nos lugares ocupados por pessoas com gripe, fazendo com que você vá para casa e pare de se colocar no caminho da infecção. Os residentes de uma cidade inteira poderiam até ser avisados ​​se estivessem à beira de um surto.

Apesar dos 150 anos em que fomos removidos do avanço do mapeamento da doença de John Snow, está claro que ainda existem aspectos da informação sobre doenças que não compreendemos completamente. Agora, como então, mapear os dados poderia ajudar a obter as respostas.

Seus tweets podem prever quando você vai pegar a gripe