Biologia Molecular

Armazenamento de dados em DNA

O DNA tem potencial para armazenar grandes quantidades de informação. Na teoria, dois bits de dados podem ser incorporados por nucleotídeo (unidade de base individual de uma cadeia de DNA) de forma que em cada grama da molécula de cadeia dupla, pode-se armazenar 455 exabytes de dados (1 exabyte equivale a 1e+18 bytes). Tal capacidade de armazenamento ultrapassa formas inorgânicas como dispositivos de memória, discos rígidos ou até mesmo armazenamentos baseados em computação quântica.

O primeiro armazenamento bem-sucedido foi realizado em 2012 por três pesquisadores, os geneticistas George Church e Sriram Kosuri, e o engenheiro biomédico Yuan Gao. Na pesquisa, publicada na revista Science (leia aqui), o trio codificou um livro de 53.246 palavras, 11 arquivos de imagem e códigos Javascript em um fragmento de DNA. A equipe de Church formou longas cadeias de código genético simplificado, onde as bases adenina e citosina representavam zeros, enquanto as bases guanina e timina representavam o número um. Surpreendentemente, após a codificação, o livro poderia ser lido com técnicas avançadas de sequenciamento do DNA.

Considerando que os métodos de armazenamento podem se tornar obsoletos com o tempo, como fitas e disquetes, os pesquisadores estão sempre buscando novas formas de tecnologia. A leitura e escrita em DNA são dois caminhos possíveis, já que este constitui uma forma densa e estável de armazenamento de dados.

Um ponto ainda em discussão é que o custo das tecnologias de sequenciamento diminuiu para cerca de um milésimo do que era há quatro anos, e a síntese de DNA avançou muito nos últimos oito anos. Na pesquisa, o chip de DNA utilizado continha 55.000 oligonucleotídeos, enquanto as metodologias mais novas permitem um milhão.

Recentemente outra equipe, liderada pelo dr. Nick Goldman codificou 5,2 milhões de bits em DNA. Entre os dados armazenados estavam 154 sonetos de Shakespeare, um clipe de aúdio do discurso de Martin Luther King, uma cópia sobre a estrutura do DNA de James Watson e Francis Crick, uma foto do instituto dos pesquisadores e um arquivo que descreve como os dados foram convertidos. A pesquisa, publicada na revista Nature (leia aqui), utilizou uma forma mais complexa e eficiente de codificação, em que cada bit (sequências formadas por oito algarismos 1 ou 0) foram representados por uma palavra de cinco letras formadas por A, T, C e G. Para evitar os erros, o grupo quebrou a sequência em pequenos fragmentos, cada um com 117 letras, que indicavam onde pertenciam no código geral.

Esquema de codificação do DNA (GODLMAN et al, 2013).

Como a pesquisa anterior, a promessa de armazenamento barra no elevado custo da metodologia. Estima-se que para cada megabyte codificado sejam necessários U$12.400,00 e outros U$220,00 para revertê-lo em informação. Possivelmente, esse método de armazenamento não seja vantajoso para todas as aplicações. A tecnologia deve funcionar melhor nos casos em que os dados precisam ser armazenados por um longo tempo sem serem lidos.

Artigo por: Raphael Gonçalves Nicésio

Os artigos do blog são destinados a estudantes, profissionais e pessoas que se interessam pela biomedicina e demais áreas da saúde. O conteúdo não visa substituir as orientações de um médico, portanto não deve ser utilizado para autodiagnóstico ou automedicação.

Licença Creative Commons
Esta publicação está licenciada com uma Licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Não é permitido duplicar, copiar ou reproduzir qualquer parte sem autorização prévia.

0 comentários:

Postar um comentário

2007-2016. Biomedicina Brasil. Tecnologia do Blogger.