Login: Abbie Grotke, coordenadora de Mídias Digitais da Biblioteca do Congresso dos EUA
A Biblioteca do Congresso dos Estados Unidos é a maior do mundo e há dez anos arquiva a internet. Já são 167 terabytes de dados (cada TB equivale a 1.000 gigabytes) – e a eles em breve se juntará todo o acervo do Twitter, adquirido no início do mês. O Link conversou com a responsável pelo Projeto de Mídias Digitais, Abigail Grotke.
É diferente preservar objetos digitais? A preservação de objetos digitais traz novos desafios em relação ao que selecionar. Nós não podemos arquivar toda a web, então a seleção é uma grande preocupação. Também há outras questões legais e copyright. Nos EUA, as instituições precisam dar permissão para arquivar, preservar e tornar o acervo acessível aos pesquisadores. Além disso, ferramentas especiais são necessárias para arquivar o conteúdo da web e esse é um campo relativamente novo.
Quem decide sobre o que será preservado? Muitos países são capazes de definir a preservação de todo o seu domínio – como as bibliotecas nacionais da Suécia, Noruega, Dinamarca, França e outras. Não há uma maneira fácil, porém, para identificar todo o domínio nacional americano. Então adotamos uma abordagem seletiva: preservamos os sites selecionados pelos nossos especialistas que são relacionados a temas ou eventos, como as eleições ou o 11 de setembro. Também arquivamos sites produzidos pelo Congresso e os de interesse para nossa biblioteca legal.
Por que arquivar o todo o acervo de tweets? O Twitter é parte de um registro histórico de comunicação, divulgação de notícias e tendências sociais – todos pertinentes para as coleções de herança cultural É um arquivo direto de importantes eventos como a eleição americana de 2008 e a Revolução no Irã. Isso também serve como um ‘feed de notícias’ e é uma plataforma para o jornalismo cidadão com muitos eventos significantes reportados primeiro pelas testemunhas oculares. Individualmente, os tweets podem soar insiginificantes. Mas, coletivamente, são um recurso para as futuras gerações entenderem a vida no século 21.
Como fica a privacidade dos usuários?
O Twitter tem sido uma plataforma de comunicações pública e aberta desde o seu início. Informações dos usuários e tweets privados não serão inclusos. Tweets apagados não farão parte do arquivo, nem informação anexada como imagens e sites. A doação original conterá toda a informação pública postada desde 2006. Haverá uma janela de seis meses entre a data dos tweets e o dia em que eles estarão disponíveis para pesquisa.
O acervo ficará disponível ao público em geral? A biblioteca está interessada em preservar o acesso ao arquivo a longo prazo. A coleção do Twitter servirá como um caso de estudo útil de como desenvolver políticas para uso de pesquisa de todos os nossos arquivos digitais. A Biblioteca não tentará reproduzir a funcionalidade do Twitter. Estamos interessados em oferecer tweets complementares a algumas coleções digitais da biblioteca.
- Arquivo da Web Portuguesa
Portugal é um dos países em que toda a internet está sendo arquivada. “É tão importante guardar as publicações que estão na web quanto as impressas”, disse ao Link Daniel Gomes, coordenador do Arquivo da Web Portuguesa. O projeto, capitaneado pela Fundação para a Computação Científica Nacional, já guardou 14 TB de dados em servidores próprios e em computadores de cidadãos comuns que doam pelo menos 100 MB de espaço para o projeto. Não há seleção – tudo que está sob domínio .pt é guardado. A maior dificuldade, porém, não é o espaço: é garantir uma busca eficiente. “As pessoas estão acostumadas ao Google. Temos que dar as respostas em poucos segundos, senão os utilizadores ficam frustrados”.