https://frosthead.com

Esta pode ser a maior árvore genealógica do mundo

O aumento do teste de DNA através de serviços como o 23andme mostra que há um grande mercado para a história da família.

Agora, os cientistas construíram esses dados publicando o que eles acreditam ser o maior banco de dados de genealogia do mundo, com uma árvore genealógica que liga 13 milhões de pessoas e remonta a mais de cinco séculos.

Como Jocelyn Kaiser relata para a revista Science, Yaniv Erlich, um geneticista computacional da Universidade de Columbia, imaginou o projeto sete anos atrás depois de receber um e-mail de uma prima parente distante do Geni.com, um dos muitos sites em busca de laços familiares.

Com o apoio do diretor de tecnologia da Gemi.com, Erlich fez o download dos perfis públicos do site - dezenas de milhões deles. Embora não oferecesse dados de DNA, as informações incluíam o nome de uma pessoa, sexo, data e local de nascimento, data da morte e parentes imediatos.

A Nature escreveu sobre o projeto de Erlich em seus estágios iniciais em 2013, e no ano passado, Sarah Zhang, do Atlantic, relatou que os pesquisadores haviam liberado uma pré-impressão da árvore maciça. Agora, escreve Kaiser, a equipe de Erlich publicou um estudo sobre seu trabalho na revista Science. Usando os dados, eles acabaram com 5, 3 milhões de árvores, a maior delas conecta cerca de 13 milhões de parentes, a maioria descendentes de europeus.

Desde o início do projeto, Erlich tornou-se o diretor científico do MyHeritage, uma empresa de genealogia e testes de DNA que possui o Geni.com. Ele fez um Reddit Ask Me Anything na sexta-feira passada sobre suas descobertas, corrigindo equívocos e explicando a metodologia por trás do projeto. Ele também observou que a parte mais interessante da experiência para ele era descobrir como traduzir todos os dados disponíveis em algo pessoal.

Em uma entrevista com Nicole Wetsman, da National Geographic, Erlich diz que descobrir como trabalhar com esses dados também foi a parte mais desafiadora do projeto. “Os conjuntos de dados genômicos possuem ferramentas, estruturas de dados e métodos específicos, mas não temos nada disso para isso. Nós estávamos inventando a roda como nós fomos ", diz ele.

Em última análise, os pesquisadores usaram a teoria matemática dos grafos para organizar e verificar as informações, relata Laura Geggel para a Live Science . Eles também compararam os perfis com cerca de 80.000 certificados de óbitos publicamente disponíveis em Vermont ao longo de um período de 25 anos para garantir que não fossem apenas perfis ricos carregados no Geni.com.

A equipe então decidiu quais informações eles queriam procurar para testar o banco de dados, escreve Wetsman.

Eles começaram a observar padrões e descobriram flutuações no tempo de vida, algo que haviam antecipado. Por exemplo, eles viram uma queda de homens jovens durante a Guerra Civil e as Guerras Mundiais I e II, e um aumento da sobrevivência infantil nos anos 1900. Eles também foram capazes de rastrear a migração, como a chegada do Mayflower em 1620, no que hoje é Massachusetts, seguido por um aumento de nascimentos nessa área.

Os pesquisadores também descobriram que a longevidade tem mais a ver com o meio ambiente e o comportamento do que com a genética; De fato, os dados revelaram que os genes são apenas 16% responsáveis ​​pelo tempo de vida. Paola Sebastiani, professora de bioestatística da Escola de Saúde Pública da Universidade de Boston, no entanto, adverte em tirar conclusões sobre esses dados em uma entrevista com Wetsman. "Há muita confusão sobre as definições de longevidade", diz ela.

O geneticista Peter Visscher, da Universidade de Queensland, em Brisbane, Austrália, conta à Kaiser que os dados que a equipe de Erlich cumpriu têm o potencial de fornecer informações sobre o papel da genética nas doenças, se os dados estiverem ligados a informações sobre saúde.

A equipe de pesquisa já começou a combinar a árvore com informações do DNA.Land, que agrupa os dados do DNA, o que poderia significar que uma árvore ainda maior pode estar chegando em breve. Pesquisadores prevêem que, se o banco de dados pudesse voltar a 65 gerações, eles seriam capazes de completar a árvore.

Esta pode ser a maior árvore genealógica do mundo