Descobriu-se que não é necessário ser cientista para codificar dados em DNA. Pesquisadores vêm explorando o armazenamento de dados baseado em DNA há décadas, mas um novo método baseado em templates, inspirado nos processos químicos das células, torna essa prática acessível até para leigos. Essa técnica pode abrir caminho para uma forma incomum, mas extremamente estável, de armazenar informações.
A ideia de armazenar dados em DNA foi proposta pela primeira vez na década de 1950 pelo físico Richard Feynman. O material genético possui densidade de armazenamento e durabilidade excepcionais: um único grama de DNA pode armazenar um trilhão de gigabytes de dados e manter as informações por milhares de anos. Décadas depois, uma equipe liderada por George Church, da Universidade de Harvard, colocou essa ideia em prática, codificando um livro de 53.400 palavras.
O método inicial dependia da síntese de DNA, que consiste em montar sequências genéticas nucleotídeo por nucleotídeo, como contas em um fio. Usando os blocos construtivos A, T, C e G, era possível codificar informações. Contudo, esse processo era caro, demorado e propenso a erros, produzindo apenas 1 bit (ou um oitavo de byte) por nucleotídeo adicionado à sequência. Além disso, exigia conhecimento técnico avançado.
O novo método, publicado na revista Nature na semana passada, é mais eficiente, armazenando 350 bits por vez ao codificar cadeias de DNA em paralelo. Em vez de montar cada cadeia de DNA manualmente, a equipe utiliza blocos pré-construídos com cerca de 20 nucleotídeos, codificando informações ao alterar alguns blocos e deixar outros inalterados. Long Qian, da Universidade de Pequim, e sua equipe, inspiraram-se no fato de que as células compartilham o mesmo conjunto básico de genes, mas comportam-se de maneira diferente em resposta a alterações químicas nas cadeias de DNA. “Todas as células do nosso corpo têm a mesma sequência genômica, mas a programação genética vem das modificações no DNA. Se a vida pode fazer isso, nós também podemos”, explica Qian.
Qian e seus colegas codificaram dados por meio de metilação, uma reação química que ativa ou desativa genes ao adicionar um composto metil—uma pequena molécula relacionada ao metano. Depois de encaixar os blocos em posições específicas na cadeia de DNA, os pesquisadores escolhem quais blocos serão metilados, com a presença ou ausência da modificação representando os valores binários 0 ou 1. As informações podem ser decifradas usando sequenciadores de nanoporo para detectar a metilação. Em teoria, o novo método é simples o suficiente para ser executado sem conhecimento detalhado de manipulação de DNA.
A capacidade de armazenamento de cada cadeia de DNA atinge um máximo de cerca de 70 bits. Para arquivos maiores, os pesquisadores dividiram os dados em várias cadeias identificadas por códigos de barras exclusivos codificados nos blocos. Após isso, essas cadeias foram lidas simultaneamente e sequenciadas de acordo com seus códigos de barras. Com essa técnica, os pesquisadores codificaram a imagem de um tigre do período Han, ajustando o processo de codificação até que a imagem fosse restaurada sem erros. O mesmo procedimento foi aplicado com sucesso a imagens mais complexas, como uma impressão fotorrealista de um panda.
Para testar a aplicabilidade prática do método, a equipe recrutou 60 estudantes de diversas áreas acadêmicas, não apenas cientistas, para codificar textos de sua escolha. Os voluntários transcreveram suas mensagens em código binário por meio de um servidor web. Em seguida, com um kit enviado pela equipe, adicionaram enzimas em placas de 96 poços contendo os blocos de DNA, marcando quais seriam metilados. Os pesquisadores processaram as amostras em um sequenciador, produziram a cadeia de DNA correspondente e, finalmente, decodificaram as mensagens em um algoritmo, que devolveu o texto ao servidor para os estudantes acessarem com uma senha. As mensagens retornaram com uma taxa de erro de 1,4% nos caracteres, mas os erros foram corrigidos usando modelos de aprendizado de linguagem.
Após maior desenvolvimento, Qian acredita que essa tecnologia será útil para o armazenamento de longo prazo de informações arquivísticas, como registros médicos, relatórios financeiros ou dados científicos que não precisam ser acessados frequentemente.
O sucesso dos não especialistas nos testes sugere que o armazenamento em DNA pode, eventualmente, se tornar uma tecnologia prática. “Todos armazenam dados diariamente, então, para competir com as tecnologias tradicionais, os métodos baseados em DNA precisam ser acessíveis ao público comum”, afirma Jeff Nivala, codiretor do Laboratório de Sistemas de Informação Molecular da Universidade de Washington. “Embora essa ainda seja uma demonstração inicial voltada para não especialistas, é notável que eles tenham conseguido alcançar isso.”
O armazenamento em DNA ainda precisa evoluir bastante para competir com os métodos tradicionais. Segundo Nivala, o novo sistema é mais caro do que as técnicas tradicionais ou os métodos anteriores de síntese de DNA. No entanto, o processo de codificação pode se tornar mais eficiente com automação em larga escala. Com o desenvolvimento futuro, o armazenamento em DNA baseado em templates pode se tornar um método mais seguro para lidar com a crescente demanda por dados.