https://frosthead.com

A grande maioria dos dados brutos dos antigos estudos científicos pode estar faltando

Um dos fundamentos do método científico é a reprodutibilidade dos resultados. Em um laboratório em qualquer lugar do mundo, um pesquisador deve ser capaz de estudar o mesmo assunto que outro cientista e reproduzir os mesmos dados, ou analisar os mesmos dados e observar os mesmos padrões.

É por isso que as descobertas de um estudo publicado hoje na revista Current Biology são tão preocupantes. Quando um grupo de pesquisadores tentou enviar por e-mail os autores de 516 estudos biológicos publicados entre 1991 e 2011 e pedir os dados brutos, eles ficaram consternados ao descobrir que mais de 90% dos dados mais antigos (de artigos escritos há mais de 20 anos) eram inacessível. No total, mesmo incluindo artigos publicados em 2011, eles só conseguiram rastrear os dados em 23%.

"Todo mundo sabe que, se você perguntar a um pesquisador por dados de estudos antigos, eles vão hem e haw, porque eles não sabem onde está", diz Timothy Vines, um zoólogo da Universidade da Columbia Britânica, que liderou o estudo. o esforço. "Mas nunca houve estimativas sistemáticas de quão rapidamente os dados mantidos pelos autores realmente desaparecem."

Para fazer sua estimativa, seu grupo escolheu um tipo de dados que foi relativamente consistente ao longo do tempo - medições anatômicas de plantas e animais - e desenterrou entre 25 e 40 trabalhos para cada ano ímpar durante o período que usou esse tipo de dados. se eles pudessem caçar os números brutos.

Uma quantidade surpreendente de suas investigações foi interrompida logo no primeiro passo: em 25% dos estudos, endereços de e-mail ativos não puderam ser encontrados, com endereços falsos listados no próprio documento e pesquisas na web não revelando nenhuma das atuais. Por outros 38% dos estudos, suas consultas não resultaram em resposta. Outros 7% dos conjuntos de dados foram perdidos ou inacessíveis.

"Algumas vezes, por exemplo, ele era salvo em disquetes de três polegadas e meia, para que ninguém pudesse acessá-lo, porque eles não tinham mais as unidades adequadas", diz Vines. Como a ideia básica de manter os dados é para que possa ser usada por outros em pesquisas futuras, esse tipo de obsolescência essencialmente torna os dados inúteis.

Esses podem parecer obstáculos mundanos, mas os cientistas são como o resto de nós - eles mudam endereços de e-mail, obtêm novos computadores com unidades diferentes, perdem seus backups de arquivos - portanto, essas tendências refletem problemas sérios e sistêmicos na ciência.

E preservar os dados é tão importante, vale a pena lembrar, porque é impossível prever em quais direções a pesquisa se moverá no futuro. Vines, por exemplo, tem conduzido sua própria pesquisa sobre um par de espécies de sapos nativas da Europa Oriental que parecem estar em processo de hibridação. Na década de 1980, diz ele, uma equipe separada de pesquisadores trabalhava no mesmo tema e encontrou um artigo antigo que documentava a distribuição desses sapos na década de 1930. Sabendo que sua distribuição havia mudado relativamente pouco nas décadas anteriores, os cientistas fizeram todo o tipo de cálculos que não seriam possíveis de outra forma. "O fato de os dados originais estarem disponíveis, de um estudo antigo muito pequeno escrito em polonês, foi incrivelmente útil para pesquisadores que vieram 70 anos depois", diz ele.

Há também o fato de que grande parte dessa pesquisa é paga com financiamento público, em grande parte proveniente de subsídios que estipulam que os dados resultantes sejam disponibilizados gratuitamente ao público. Além disso, os dados de campo são afetados pelas circunstâncias do ambiente em que são coletados - portanto, é impossível replicar com perfeição mais tarde, quando as condições mudaram.

Qual é a solução? Alguns periódicos - incluindo a Molecular Ecology, da qual Vines é editor-chefe - adotaram políticas que exigem que os autores submetam dados brutos junto com seus documentos, permitindo que a própria revista arquive os dados em perpetuidade. Embora os periódicos, como as pessoas, sejam suscetíveis a mudanças nos endereços de e-mail e à obsolescência tecnológica, esses problemas podem ser gerenciados com muito mais facilidade na escala institucional.

A grande maioria dos dados brutos dos antigos estudos científicos pode estar faltando