Por Bem Morris, Editor, Tecnologia de Negócios da BBC
O ano de 2039 pode parecer muito distante, mas Ian Crawford já está se planejando para ele.
Marcará o 100º aniversário do início da Segunda Guerra Mundial — um grande ano para seu empregador, o Museu Imperial da Guerra.
O Sr. Crawford é diretor de informações do museu e supervisiona um projeto para digitalizar sua enorme coleção de fotos, áudio e filmes.
Com uma coleção de cerca de 24.000 horas de filmes e vídeos, e 11 milhões de fotografias, é uma tarefa vasta.
E no período que antecede 2039, o material da Segunda Guerra Mundial será uma prioridade.
Fazer cópias digitais dessas fontes históricas é vital, pois as cópias originais se degradam com o tempo e, um dia, serão perdidas para sempre.
“Quando você tem a única cópia, você quer ter certeza de que seu sistema de armazenamento é confiável”, diz Ian Crawford.
A quantidade de dados necessária para esse armazenamento de longo prazo está crescendo o tempo todo, pois os scanners mais recentes podem registrar documentos e filmes com grande detalhe.
“Seu potencial de crescimento é realmente enorme”, diz o Sr. Crawford.
“Agora estamos observando os próprios objetos e digitalizando-os em 3D, o que pode gerar arquivos muito grandes.”
Essa enxurrada de dados não está atingindo apenas os museus, ela está chegando a todos os lugares.
As empresas estão comprando mais espaço para dados de backup, os hospitais precisam de um lugar para armazenar registros e o governo precisa de um lugar para armazenar quantidades cada vez maiores de informações.
“Continuamos criando quantidades absurdas de dados”, diz Simon Robinson, analista principal da empresa de pesquisa Enterprise Strategy Group.
“Para a maioria das organizações — varia muito — o volume de dados está dobrando a cada quatro ou cinco anos. E em alguns setores, está crescendo muito mais rápido do que isso”, ele diz.
Dados que precisam ser mantidos por um longo tempo não são armazenados em data centers tradicionais, aqueles vastos armazéns, com racks de servidores e luzes piscantes. Essas operações são projetadas para dados que precisam ser acessados e atualizados com frequência.
Em vez disso, a maneira mais popular de manter dados a longo prazo é em fita. Em particular, um formato conhecido como LTO (Linear Tape Open), a versão mais recente sendo chamada de LTO-9.
As fitas em si não são diferentes das antigas fitas VHS, mas são um pouco menores e mais quadradas.
Dentro do cassete há um quilômetro de fita magnética, capaz de armazenar 18 terabytes de dados.
É muito — apenas uma fita pode armazenar a mesma quantidade de dados de quase 300 smartphones padrão.
O Imperial War Museum em Duxford usa um sistema de fita da Spectra Logic. A máquina, do tamanho de um guarda-roupa grande, pode armazenar até 1.500 fitas LTO.
Tais sistemas LTO dominam o mercado de armazenamento de longo prazo. Eles existem há décadas e provaram ser confiáveis.
Também é bem barato, o que é importante, pois geralmente os clientes querem pagar o mínimo possível pelo armazenamento de longo prazo.
No entanto, alguns estão convencidos de que é possível fazer melhor.
Em uma antiga fábrica de papel de parede em Chiswick, oeste de Londres, uma empresa iniciante vem desenvolvendo um sistema de armazenamento de longo prazo que usa lasers para queimar pequenos hologramas em um polímero sensível à luz.
O presidente-executivo Charlie Gale ressalta que, com a fita magnética, os dados só podem ser armazenados na superfície, enquanto os hologramas podem armazenar dados em múltiplas camadas.
“Você pode fazer coisas chamadas multiplexação, por meio das quais você pode sobrepor vários conjuntos de informações em um espaço. Esse é realmente o tipo de superpoder do que estamos fazendo. E acreditamos que podemos colocar mais informações em menos espaço do que nunca”, ele diz.
Os blocos de polímero do HoloMem podem suportar temperaturas extremas sem que os dados sejam corrompidos — entre -14 °C e 160 °C.
Em comparação, a fita magnética precisa ser mantido entre 16C e 25Co que significa custos significativos de aquecimento e resfriamento, especialmente em países com temperaturas extremas.
A fita também precisa ser substituída após cerca de 15 anos, enquanto o polímero é bom por pelo menos 50 anos.
O Sr. Gale observa que, como o laser altera quimicamente o polímero, os dados não podem ser adulterados depois de gravados.
O protótipo do sistema da Holomem, que será capaz de armazenar e recuperar dados, estará pronto ainda este ano.
O Sr. Gale diz que o custo do sistema foi mantido baixo pelo uso de componentes padrão e amplamente disponíveis, incluindo o laser. Por isso, ele está confiante de que o HoloMem será capaz de igualar ou superar os custos da fita magnética.
O HoloMem precisará ser competitivo, pois há um concorrente formidável pairando no mercado.
Por meio de seu braço de pesquisa, a Microsoft está desenvolvendo seu próprio sistema de armazenamento de dados de longo prazo.
Assim como o HoloMem, a empresa decidiu que é hora de abandonar a fita magnética, mas a Microsoft escolheu o vidro como material de armazenamento.
Chamado de Projeto Sílica, o sistema usa lasers poderosos para criar pequenas mudanças estruturais no vidro, chamadas voxels, que podem ser usadas para armazenar dados. Os voxels são incrivelmente pequenos e podem ser empacotados em camadas.
A Microsoft diz que um pedaço de vidro de 2 mm de espessura, do tamanho de um DVD, seria capaz de armazenar mais de sete terabytes de dados.
O sistema armazena os painéis de vidro em prateleiras, onde eles podem ser acessados por pequenos robôs semelhantes a caranguejos que deslizam sobre trilhos.
Barato e durável, o vidro é um meio de armazenamento atraente, diz Richard Black, que lidera o Projeto Sílica.
“Ele é praticamente imune à temperatura, umidade, partículas e campos eletromagnéticos”, diz o Sr. Black.
Ele poderia potencialmente preservar dados por centenas e talvez milhares de anos.
Um dia, esse sistema poderá ser integrado ao enorme negócio de computação em nuvem da Microsoft, o Azure.
Mas isso ainda está longe, pois o sistema tem anos de desenvolvimento pela frente.
De volta a Duxford, o Imperial War Museum, como muitas organizações, tem feito experiências com inteligência artificial. Eles testaram recentemente se a IA poderia identificar diferentes modelos do Spitfire em fotos de seu catálogo de imagens.
O Sr. Crawford acredita que a IA pode ser incrivelmente útil na catalogação de sua biblioteca digital, trabalho que levaria centenas de anos para os humanos.
A capacidade da IA de vasculhar grandes quantidades de dados tornou a preservação desses dados ainda mais importante: pode haver algo valioso escondido ali.
“No passado, o negócio era arquivar dados para o caso de precisarem. Agora, há uma razão comercial real pela qual eles podem querer voltar e fazer algumas análises”, diz o Sr. Robinson.