Microsoft tras el almacenamiento en ADN: mil millones de TB en un gramo

Microsoft está muy interesada en el almacenamiento de grandes cantidades de datos a largo plazo. Para ello se ha asociado con Twist Bioscience, intentando guardar una cantidad ingente de información en un gramo de ADN.

El adn humano es, todav√≠a, una parte de nosotros que no deja de sorprendernos. Pensemos cuando, en 2013, se empezaron a recoger los primeros experimentos para guardar datos en secuencias de ADN. Lo que se hizo fue trasladar los datos binarios a plataformas biol√≥gicas. Con esto se descubri√≥ que, por ejemplo, se pod√≠an escribir archivos MP3 en secuencias de ADN y almacenarlos en grandes cantidades. Las muestras utilizadas eran de una densidad de 2,2 petabytes por gramo, miles de terabytes de almacenamiento. ¬ŅQu√© no podr√≠amos hacer nosotros con un disco duro de ese tama√Īo en nuestro ordenador? Pues por ejemplo descargar toda nuestra librer√≠a de Steam de una sola vez, y a√ļn sobrar√≠a sitio.

Los experimentos con ADN parecen haber ido a√ļn m√°s lejos, y seg√ļn podemos leer enArs Technica ahora Microsoft podr√≠a almacenar mil millones de terabytes en un gramo de ADN.

Microsoft busca m√°s permanencia para sus datos

La razón por la que Microsoft quiere embarcarse en esta operación es, básicamente, laenorme permanencia de los datos en el tiempo. Por ahora la empresa de Redmond le ha comprado 10 millones de hebras de ADN a la empresa Twist Bioscience, de forma que puedan empezar a investigar en la forma de guardar datos en soporte biológico de forma permanente.

Edificio de Microsoft en Colonia (Alemania)Edificio de Microsoft en Colonia (Alemania)

A d√≠a de hoy la ventana de vida de que disponen los medios de almacenamiento convencionales que se utilizan en las industrias y en los hogares es muy limitada. Si el experimento sale bien, se pueden guardar los datos en ADN y almacenarlos durante miles de a√Īos.

Adem√°s, la tecnolog√≠a necesaria para leer informaci√≥n almacenada en secuencias de ADN ha bajado much√≠simo su coste durante los √ļltimos a√Īos. El proyecto del genoma humano cost√≥ unos 3.000 millones de d√≥lares en 13 a√Īos que dur√≥, mientras que hoy reproducir esa misma experiencia costar√≠a unos mil d√≥lares.

Sin embargo, la gran dificultad de convertir ADN en un medio de almacenamiento masivo de datos estriba en leer y escribir lo que se guarda. En la parte de la escritura es donde Twist Bioscience entra en juego, produciendo strings de material genético creados ex profeso para la ocasión que se generan a través de una máquina construida por ellos.

El ADN quiere reemplazar a los discos durosEl ADN quiere reemplazar a los discos duros

Seg√ļn podemos leer en el San Francisco Business Times, el pasado oto√Īo Microsoft condujo un experimento piloto en el que recuper√≥ sin p√©rdidas los datos almacenados en las hebras de ADN sint√©tico creadas por Twist Bioscience.

Por ahora la tecnolog√≠a no es comercialmente viable debido a su coste. Resulta mucho m√°s barato comprar un buen mont√≥n de discos duros y ponerlos a almacenar datos y copias de respaldo, que comprar hebras de ADN para utilizarlo como soporte duradero. Seg√ļn Emily Leproust, CEO de Twist Bioscience, tienen que conseguir que el coste de su tecnolog√≠a baje de los “100 d√≥lares por gen a un centavo por cada uno” para ser competitivos con los centros de datos.

¬ŅC√≥mo se consigue guardar datos binarios en un soporte biol√≥gico?

Para entender mejor c√≥mo se puede convertir los datos inform√°ticos en algo que se puede almacenar en una secuencia de ADN tendremos que echar mano de un experimento conducido por la Universidad de Harvard en 2012 seg√ļn el cual consiguieron copiar 700 terabytes de datos a 1 gramo de ADN.

El almacenamiento de datos en ADN lo que hace es tratar al material biológico como si fuese cualquier otro medio digital. Las hebras de código genético se codifican, y se asigna a cada una de sus bases un valor binario. El ácido desoxirribonucleico tiene cuatro bases: timina (T), guanina (G), adenina (A) y citosina (C). A T y G se les concede el valor 1, mientras que a A y C se les concede valor 0.

Lo siguiente era secuenciar los datos almacenados para poder leerlos. Para ayudar al proceso, cada hebra de ADN tiene un bloque de dirección de 19 bits en su inicio, de forma que se puede secuenciar una gran cantidad de código genético sin seguir un orden concreto y después ordenarlo como datos usable usando sólo la dirección.

Los científicos llevan ya una buena temporada mirando al ADN como un medio potencial para guardar datos durante mucho tiempo. Esto se debe a tres razones:

  • Es incre√≠blemente denso.
  • Es volum√©trico en lugar de plano.
  • No necesita ninguna condici√≥n especial para mantenerse intacto.

La intención de los investigadores que llevaron a cabo este experimento, y casi podríamos decir que también la de Microsoft, es llegar a un momento del futuro en el que el almacenamiento biológico nos permitirá guardar cualquier cosa sin privarnos de nada. Por ahora las copias de respaldo de las grandes empresas sólo se pueden guardar durante unas pocas semanas o meses, debido a que no es viable tener almacenes llenos de discos duros mecánicos que pueden fallar en cualquier momento.

Fuente:http://www.malavida.com/