Genética

Dados genômicos crescem mais rápido que Twitter e YouTube

Biólogos quantitativos da Universidade de Illinois Urbana-Champaign e Cold Spring Harbor Laboratory, em Nova Iorque, descobriram que a genômica reina como campeã entre três dos maiores domínios de dados ao redor do mundo: Astronomia, Twitter e YouTube.

Os cientistas determinaram qual iria expandir mais rápido avaliando aquisição, armazenamento, distribuição e análise de cada conjunto de dados. Os genomas são quantificados por seus componentes químicos, ou pares de bases. Eles superam outros geradores de dados porque a taxa de sequenciamento do genoma dobra a cada sete meses. Se mantiver este ritmo, até 2020, mais de um bilhão de bilhões de bases serão sequenciadas e armazenadas por ano, ou seja, 1 exabase. Em 2025, os pesquisadores estimam que a taxa será de quase 1 zettabase (um trilhão de bilhões de bases) de sequência por ano.

"A esperança é que pelo sequenciamento de muitos indivíduos, o conhecimento obtido irá ajudar a prever e curar uma variedade de doenças", afirma Gene Robinson, da Universidade de Illinois Urbana-Champaign. Antes que possam ser úteis para a medicina, os genomas devem ser comparados com outros conjuntos de dados genômicos.

Uma razão pela qual a taxa está dobrando tão rapidamente é porque os cientistas começaram o sequenciamento de células individuais. A tecnologia unicelular de sequenciamento do genoma para a pesquisa do câncer podem revelar sequências mutadas e ajudar no diagnóstico. Os pacientes têm várias células individuais sequenciadas, o que pode acabar resultando em mais de 7 bilhões de genomas sequenciados.

Que "é mais do que a população da Terra", diz Michael Schatz, professor associado do Cold Spring Harbor Laboratory, em Nova Iorque. "O que significa ter mais genomas de pessoas no planeta?" Significa uma montanha de informações que devem ser obtidas, arquivadas e analisadas.

"Outras formas têm sido muito bem sucedidas nessas escalas, como o YouTube", comenta Schatz. Hoje, os usuários do YouTube adicionam cerca de 300 horas de vídeo a cada minuto, e os pesquisadores esperam que a taxa cresça até 1.700 horas por minuto, ou seja 2 exabytes de dados de vídeo por ano, até 2025. O Google criou uma infra-estrutura de dados de fluxo contínuo para o YouTube . Eles forneceram internet muito mais rápida, grande espaço no disco rígido, algoritmos que otimizam os resultados e uma equipe de pesquisadores experientes.

"Nós precisamos que o investimento em genômica seja nessa proporção, para que consigamos entender as doenças, que tipos de tratamentos aplicarmos, ou respondermos perguntas sobre ascendência", diz Schatz. "Ao sequenciar centenas de milhões de pessoas, podemos olhar através do padrão. Poderíamos ter uma noção de comunidade global, e como somos incrivelmente conectados."

IEEE Spectrum 

Artigo por: Raphael Gonçalves Nicésio

Os artigos do blog são destinados a estudantes, profissionais e pessoas que se interessam pela biomedicina e demais áreas da saúde. O conteúdo não visa substituir as orientações de um médico, portanto não deve ser utilizado para autodiagnóstico ou automedicação.

Licença Creative Commons
Esta publicação está licenciada com uma Licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Não é permitido duplicar, copiar ou reproduzir qualquer parte sem autorização prévia.

0 comentários:

Postar um comentário

2007-2016. Biomedicina Brasil. Tecnologia do Blogger.