Microsoft tras el almacenamiento en ADN: mil millones de TB en un gramo

Conocimiento pertenece al mundo
Tweet about this on TwitterShare on FacebookShare on LinkedInShare on Google+Share on StumbleUponShare on TumblrShare on RedditPin on PinterestEmail this to someone

Microsoft está muy interesada en el almacenamiento de grandes cantidades de datos a largo plazo. Para ello se ha asociado con Twist Bioscience, intentando guardar una cantidad ingente de información en un gramo de ADN.

El adn humano es, todavía, una parte de nosotros que no deja de sorprendernos. Pensemos cuando, en 2013, se empezaron a recoger los primeros experimentos para guardar datos en secuencias de ADN. Lo que se hizo fue trasladar los datos binarios a plataformas biológicas. Con esto se descubrió que, por ejemplo, se podían escribir archivos MP3 en secuencias de ADN y almacenarlos en grandes cantidades. Las muestras utilizadas eran de una densidad de 2,2 petabytes por gramo, miles de terabytes de almacenamiento. ¿Qué no podríamos hacer nosotros con un disco duro de ese tamaño en nuestro ordenador? Pues por ejemplo descargar toda nuestra librería de Steam de una sola vez, y aún sobraría sitio.

Los experimentos con ADN parecen haber ido aún más lejos, y según podemos leer enArs Technica ahora Microsoft podría almacenar mil millones de terabytes en un gramo de ADN.

Microsoft busca más permanencia para sus datos

La razón por la que Microsoft quiere embarcarse en esta operación es, básicamente, laenorme permanencia de los datos en el tiempo. Por ahora la empresa de Redmond le ha comprado 10 millones de hebras de ADN a la empresa Twist Bioscience, de forma que puedan empezar a investigar en la forma de guardar datos en soporte biológico de forma permanente.

Edificio de Microsoft en Colonia (Alemania)Edificio de Microsoft en Colonia (Alemania)

A día de hoy la ventana de vida de que disponen los medios de almacenamiento convencionales que se utilizan en las industrias y en los hogares es muy limitada. Si el experimento sale bien, se pueden guardar los datos en ADN y almacenarlos durante miles de años.

Además, la tecnología necesaria para leer información almacenada en secuencias de ADN ha bajado muchísimo su coste durante los últimos años. El proyecto del genoma humano costó unos 3.000 millones de dólares en 13 años que duró, mientras que hoy reproducir esa misma experiencia costaría unos mil dólares.

Sin embargo, la gran dificultad de convertir ADN en un medio de almacenamiento masivo de datos estriba en leer y escribir lo que se guarda. En la parte de la escritura es donde Twist Bioscience entra en juego, produciendo strings de material genético creados ex profeso para la ocasión que se generan a través de una máquina construida por ellos.

El ADN quiere reemplazar a los discos durosEl ADN quiere reemplazar a los discos duros

Según podemos leer en el San Francisco Business Times, el pasado otoño Microsoft condujo un experimento piloto en el que recuperó sin pérdidas los datos almacenados en las hebras de ADN sintético creadas por Twist Bioscience.

Por ahora la tecnología no es comercialmente viable debido a su coste. Resulta mucho más barato comprar un buen montón de discos duros y ponerlos a almacenar datos y copias de respaldo, que comprar hebras de ADN para utilizarlo como soporte duradero. Según Emily Leproust, CEO de Twist Bioscience, tienen que conseguir que el coste de su tecnología baje de los “100 dólares por gen a un centavo por cada uno” para ser competitivos con los centros de datos.

¿Cómo se consigue guardar datos binarios en un soporte biológico?

Para entender mejor cómo se puede convertir los datos informáticos en algo que se puede almacenar en una secuencia de ADN tendremos que echar mano de un experimento conducido por la Universidad de Harvard en 2012 según el cual consiguieron copiar 700 terabytes de datos a 1 gramo de ADN.

El almacenamiento de datos en ADN lo que hace es tratar al material biológico como si fuese cualquier otro medio digital. Las hebras de código genético se codifican, y se asigna a cada una de sus bases un valor binario. El ácido desoxirribonucleico tiene cuatro bases: timina (T), guanina (G), adenina (A) y citosina (C). A T y G se les concede el valor 1, mientras que a A y C se les concede valor 0.

Lo siguiente era secuenciar los datos almacenados para poder leerlos. Para ayudar al proceso, cada hebra de ADN tiene un bloque de dirección de 19 bits en su inicio, de forma que se puede secuenciar una gran cantidad de código genético sin seguir un orden concreto y después ordenarlo como datos usable usando sólo la dirección.

Los científicos llevan ya una buena temporada mirando al ADN como un medio potencial para guardar datos durante mucho tiempo. Esto se debe a tres razones:

  • Es increíblemente denso.
  • Es volumétrico en lugar de plano.
  • No necesita ninguna condición especial para mantenerse intacto.

La intención de los investigadores que llevaron a cabo este experimento, y casi podríamos decir que también la de Microsoft, es llegar a un momento del futuro en el que el almacenamiento biológico nos permitirá guardar cualquier cosa sin privarnos de nada. Por ahora las copias de respaldo de las grandes empresas sólo se pueden guardar durante unas pocas semanas o meses, debido a que no es viable tener almacenes llenos de discos duros mecánicos que pueden fallar en cualquier momento.

Fuente:http://www.malavida.com/

Conocimiento pertenece al mundo
Tweet about this on TwitterShare on FacebookShare on LinkedInShare on Google+Share on StumbleUponShare on TumblrShare on RedditPin on PinterestEmail this to someone