https://frosthead.com

A Biblioteca do Congresso vai parar de arquivar o Twitter

Em 2010, ninguém esperava que o centro do discurso político dos Estados Unidos mudasse em breve para o Twitter, o aplicativo de mensagens sociais que dava aos usuários a oportunidade de “microblog” mensagens de 140 caracteres (embora isso tenha sido recentemente elevado a uma brisa animada. personagens). Na época, o Twitter começou a enviar à Biblioteca do Congresso todos os tweets públicos já enviados, mesmo voltando a seus primeiros dias de existência em 2006. Depois de 12 anos pegando todos os gostos, a disputa do fast-food, o re-tweet racista, o russo bot e estranho reflexo do Twitter star dril, a Biblioteca já teve o suficiente. Harper Neidig, do The Hill, informa que o COL anunciou ontem que, após 31 de dezembro, só coletará Tweets que considerar de importância histórica.

Em um artigo sobre o assunto, a Biblioteca cita várias razões para a mudança. Em primeiro lugar, o volume de tweets cresceu dramaticamente desde que um acordo foi assinado pela primeira vez com o Twitter sete anos atrás, tornando o gerenciamento da cobrança pesado. A natureza dos tweets também mudou. A biblioteca só recebe os textos dos tweets e não recebe imagens, vídeos ou gifs animados associados a eles. Com o tempo, como isso se tornou uma parte maior da cultura do Twitter, a coleção perdeu muito conteúdo e contexto.

A Biblioteca também cita a recente expansão do limite de caracteres de tweets como uma razão para a mudança, explicando que o Twitter está se transformando e pode mudar mais no futuro. “A biblioteca geralmente não coleta de forma abrangente. Dada a direção desconhecida das mídias sociais quando o presente foi planejado pela primeira vez, a Biblioteca abriu uma exceção para os tweets públicos ”, explica a Biblioteca no jornal. “Com as mídias sociais agora estabelecidas, a Biblioteca está trazendo sua prática de coleta mais de acordo com suas políticas de cobrança.”

Atualmente, o arquivo de Tweets de 12 anos não é acessível publicamente e o LOC não possui um cronograma atual para quando ele pode estar disponível. Eles agora dizem que isso servirá como um instantâneo dos primeiros 12 anos de uma forma emergente de comunicação social, como se a Biblioteca tivesse enviado todos os telégrafos durante os primeiros 12 anos daquela tecnologia.

O movimento não foi completamente inesperado. Andrew McGill, da The Atlantic, explica que o COL não possuía recursos ou experiência adequados para o projeto e não tinha engenheiros trabalhando em tempo integral nos tweets. A biblioteca jogou mais ou menos lotes de tweets não processados, 500 milhões produzidos todos os dias, em um servidor para ser tratado em uma data posterior. "Isso é um aviso quando começamos a lidar com big data - temos que ser cuidadosos com o que nos comprometemos", diz Michael Zimmer, da Universidade de Wisconsin-Milwaukee, a McGill. “Quando as bibliotecas não tinham recursos para digitalizar livros, apenas uma empresa do tamanho do Google era capaz de colocar o dinheiro e os corpos nela. E isso pode ser onde a Biblioteca do Congresso está presa ”.

Em 2010, o número de tweets era de cerca de um décimo do tráfego atual, e a função "retweet" ainda era nova e os threads não estavam ativos. Com o tempo, no entanto, tweets embutidos em tópicos, fotos e vídeos e o novo limite de caracteres tornaram cada tweet maior e o volume de dados diários surpreendentes. Em 2013, relata McGill, a Biblioteca já admitiu que estava com dificuldades e disse que a realização de uma pesquisa no arquivo de tweets de 2006 a 2010 levaria 24 horas no sistema atual do LOC.

No acordo original, a Biblioteca concordou em embargar os tweets por seis meses e remover quaisquer tweets e tweets privados excluídos. Os pesquisadores ficaram animados em acessar os dados, mas ficaram desapontados com a falta de acesso público. Ainda assim, alguns esperam que a Biblioteca venha a encontrar uma maneira de tornar os Tweets acessíveis, o que poderia ser muito valioso para sociólogos, psicólogos, cientistas políticos e outros pesquisadores.

"Não sou Ph.D., mas me surpreende pensar no que poderíamos aprender sobre nós mesmos e o mundo à nossa volta a partir dessa riqueza de dados", escreveu o ex-diretor de comunicações do COL, Matt Raymond, quando a parceria foi realizada. anunciado. “E tenho certeza de que vamos aprender coisas que nenhum de nós pode conceber.”

Mesmo que não tenhamos os arquivos para procurar, o Twitter ainda nos ensinou muitas coisas. Pessoas comuns podem ser mais hilárias que os melhores comediantes. Eles também podem ser incrivelmente estúpidos. Os nazistas ainda existem e não têm problema em expressar seus pensamentos horríveis. Trolls vai arruinar qualquer conversa, não importa quão banal. E, claro, a brevidade é a alma da inteligência. E imprudência em igual medida.

A Biblioteca do Congresso vai parar de arquivar o Twitter