Saltar al contenido
computerg

ūü•á El Almacenamiento De ADN Es La Innovaci√≥n M√°s Importante De La Que Nunca Ha O√≠do Hablar

junio 26, 2021

A medida que el volumen de datos producidos por la actividad de Internet, los dispositivos digitales y los sensores de IoT contin√ļa aumentando a un ritmo agresivo, las empresas se est√°n quedando sin tiempo para resolver un problema cr√≠tico: d√≥nde poner todo.

Seg√ļn un informe reciente de IDC, la cantidad de datos creados durante los pr√≥ximos cinco a√Īos ser√° m√°s del doble de la cantidad generada desde que se utiliz√≥ el almacenamiento digital.

Aunque menos del 2% de los 64,2 ZB (68,9 mil millones de TB) creados el a√Īo pasado estaba en almacenamiento a largo plazo (el resto se sobrescribi√≥ o se almacen√≥ temporalmente en cach√©), las necesidades de almacenamiento global de datos siempre superan la expansi√≥n de la capacidad total.

Si bien los discos duros (HDD) y las unidades de estado sólido (SSD) hacen un excelente trabajo almacenando y entregando la cantidad de datos que nuestros dispositivos cotidianos necesitan para funcionar, ninguno es adecuado para almacenar datos. Información a granel y durante largos períodos de tiempo. .

Cuando se trata de almacenamiento de archivos, la cinta magn√©tica Linear Tape-Open (LTO) es la reina suprema, con el menor costo por capacidad de cualquier tecnolog√≠a. La generaci√≥n actual de cintas, LTO-8, tiene una capacidad nativa de 12 TB y se puede comprar por tan solo ‚ā¨ 75 (o ‚ā¨ 6.25 / TB).

Sin embargo, aunque rentable, la banda también tiene sus debilidades; solo se puede acceder a los datos en serie, lo que dificulta la localización de archivos específicos, y las empresas también deben migrar a una nueva cinta de forma semi-regular para evitar la pérdida de datos.

En un intento por resolver la crisis de datos que se avecina, los investigadores buscan nuevas tecnologías de almacenamiento ultradensas y ultraduraderas. Han surgido algunos candidatos diferentes, pero un concepto parece particularmente prometedor: ácido desoxirribonucleico, más conocido como ADN.

¬ŅQu√© es el almacenamiento de ADN y c√≥mo funciona?

El ADN, el material b√°sico de los organismos vivos, consta de cuatro bloques de construcci√≥n moleculares: adenina (A), guanina (G), citosina (C) y timina (T). Estos compuestos se conectan en pares (AT & GC) para formar los pelda√Īos de la famosa escalera de doble h√©lice.

Esta estructura se puede utilizar como una forma extremadamente densa y duradera de almacenamiento de datos, convirtiendo los 1 y 0 binarios en el alfabeto genético de cuatro letras. Se ha demostrado que un solo gramo de ADN puede almacenar 215 PB (220 000 TB) de datos.

‚ÄúEl almacenamiento de datos de ADN es el proceso de codificar y decodificar datos binarios en y a partir de cadenas de ADN sintetizadas‚ÄĚ, explic√≥ un portavoz de la Alianza de Almacenamiento de Datos de ADN (DDSA), fundada en el √ļltimo a√Īo por Microsoft, Western Digital, Twist Bioscience e Ilumina.

“Para almacenar datos en el ADN, los datos digitales originales se codifican, luego se escriben (sintetizan mediante procesos químicos / biológicos) y se almacenan. Cuando los datos almacenados se necesitan nuevamente, las moléculas de ADN se secuencian para revelar cada A, C, G o T individual en orden y se reasignan a partir de las bases de ADN en 1 y 0.

(Crédito de la imagen: DNA Data Storage Alliance)

El ADN supera a las tecnologías actuales de almacenamiento de archivos en casi todas las categorías. Un artículo reciente estima que 9 TB de ADN codificado se pueden comprimir en solo 1 mm ^ 3 de espacio, lo que significa que el volumen de un solo casete LTO contendría 2 millones de TB de datos, o aproximadamente 167.000 veces el volumen. Capacidad de una cinta LTO-8 .

En un escenario de la vida real, el ADN podr√≠a usarse para almacenar la totalidad de YouTube (que albergar√≠a alrededor de 400,000 TB de videos nuevos cada a√Īo) en un peque√Īo refrigerador, en lugar de acres y acres de centros de datos.

A diferencia de la cinta magn√©tica, que debe reemplazarse cada diez o dos a√Īos seg√ļn el uso, el ADN puede durar miles de a√Īos en las condiciones adecuadas. Esto significa que el costo total de propiedad (TCO) tiene el potencial de ser extremadamente bajo.

El ADN también es biodegradable y fácilmente reproducible, y consume poca energía más allá de la energía necesaria para producir el clima necesario, lo que lo hace extremadamente respetuoso con el medio ambiente.

Sin embargo, todav√≠a existen muchas razones por las que el ADN a√ļn no ha hecho obsoleto el almacenamiento en cinta. La tecnolog√≠a est√° todav√≠a en su infancia, con problemas que resolver en casi cada paso del camino, desde la codificaci√≥n hasta la s√≠ntesis y la secuenciaci√≥n.

Seg√ļn Turguy Goker, director de desarrollo avanzado, LTO de la empresa de almacenamiento Quantum, todav√≠a es demasiado pronto para ¬ęapostar por este caballo¬Ľ.

‚ÄúEl almacenamiento de ADN est√° nadando en aguas turbulentas en este momento y pasar√°n algunos a√Īos antes de que pueda navegar con seguridad a costas comerciales‚ÄĚ, explic√≥.

Denso y duradero, pero lento y caro.

Por más prometedores que puedan ser los primeros signos, todavía hay una serie de obstáculos que superar antes de que el ADN pueda comenzar a poner fin al problema de la capacidad de almacenamiento del mundo. Los principales problemas son el costo y la velocidad.

Para evitar la degradación, el ADN necesita un clima muy específico, que puede ser difícil y costoso de mantener. Específicamente, el ADN debe almacenarse a temperaturas extremadamente bajas o exponerse a un flujo de aire cuidadosamente controlado.

Utilizando las técnicas actuales, el proceso de escritura de datos de ADN también consume mucho tiempo en comparación con las tecnologías existentes. Hasta que esto pueda mejorarse, el almacenamiento de ADN seguirá siendo inutilizable a gran escala.

¬ęEscribir ADN es un proceso qu√≠mico y es inherentemente mucho, mucho m√°s lento que la electr√≥nica digital que estamos acostumbrados a usar¬Ľ, explic√≥ Goker. ¬ęSin superar esta barrera, escribir sobre el almacenamiento basado en ADN es an√°logo a vaciar una piscina con una pajita¬Ľ.

ADN

(Crédito de la imagen: Shutterstock / Billion Photos)

La lectura de los datos almacenados en el ADN también plantea desafíos, con una alta probabilidad de que se introduzcan errores durante el proceso de secuenciación. Por esta razón, la DDSA espera que los primeros en adoptar la tecnología la usen para escribir una vez, leer nunca (WORN) o escribir una vez, leer raramente o nunca (PIRE) casos de uso (por ejemplo, almacenar ciertos tipos de datos para cumplir con los requisitos reglamentarios). .

Además de las cuestiones tecnológicas, es necesario abordar la falta de normas comunes para garantizar que las tecnologías de almacenamiento de ADN sean interoperables entre sí y con las tecnologías existentes.

Sin embargo, dado que el almacenamiento de ADN atrae tanto la atención como la inversión de los gobiernos, los operadores de almacenamiento establecidos y los gigantes tecnológicos, se está trabajando para encontrar soluciones a estos problemas.

Por ejemplo, la Oficina del Director de Inteligencia Nacional de EE. UU. Lanz√≥ el programa de Almacenamiento de Informaci√≥n Molecular (MIST) el a√Īo pasado, con el objetivo declarado de desarrollar tecnolog√≠as de ADN capaces de escribir 1 TB y leer 10 TB en 24 horas, por un costo de menos de ‚ā¨ 1.000. .

Además, Twist Bioscience ha desarrollado un método para aumentar el rendimiento de la síntesis de ADN en un factor de 1000 utilizando una plataforma de silicio que miniaturiza la química requerida.

Seg√ļn la DDSA, las preocupaciones sobre la precisi√≥n de los datos se disipar√°n con scripts capaces de corregir problemas de secuenciaci√≥n, y la organizaci√≥n tambi√©n cree que hay tiempo para establecer especificaciones que evitar√°n la fragmentaci√≥n en la industria.

‚ÄúA diferencia de la s√≠ntesis para el cuidado de la salud, que tiene que ser perfecta, el almacenamiento de ADN puede tolerar errores debido a los algoritmos de correcci√≥n que se utilizan normalmente en el almacenamiento en la actualidad. Los pioneros del almacenamiento de ADN ya est√°n trabajando en mejoras al algoritmo de codificaci√≥n y correcci√≥n de errores que mitigar√°n este riesgo y recuperar√°n los datos con precisi√≥n ‚ÄĚ, dijo un portavoz.

“A medida que los métodos y herramientas de almacenamiento de datos de ADN comercialmente viables se comprendan mejor y estén más disponibles, la Alianza considerará la creación de especificaciones y estándares específicos (por ejemplo, codificación, interfaces físicas, preservación, sistemas de archivos) para promover el surgimiento de ADN interoperables. Soluciones basadas en almacenamiento de datos que complementan las jerarquías de almacenamiento existentes.

¬ŅEs este el final de la banda?

Si bien la llegada del almacenamiento de ADN plantear√° preguntas sobre la utilidad duradera de la cinta magn√©tica, algunos creen que la escritura a√ļn no est√° en la pared.

Por ejemplo, cuando se le preguntó si pensaba que el ADN pondría en peligro sus productos de almacenamiento en cinta, IBM hizo un movimiento para mejorar la densidad de la cinta, lo que también se ha demostrado en un contexto comercial.

‚ÄúA medida que los vol√ļmenes de datos contin√ļan aumentando en todo el mundo, la tecnolog√≠a de cintas sigue siendo la soluci√≥n preferida para la retenci√≥n, protecci√≥n y resistencia de datos empresariales para entornos locales y de nube h√≠brida‚ÄĚ, dijo Andy Walls, director de tecnolog√≠a y arquitecto jefe de la divisi√≥n de almacenamiento flash de IBM.

‚ÄúTambi√©n es la tecnolog√≠a de almacenamiento m√°s respetuosa con el medio ambiente disponible, que no consume energ√≠a y tiene una duraci√≥n de d√©cadas. Y debido a que continuamos mejorando la densidad de la cinta, hoy en d√≠a un solo cartucho IBM (es decir, m√°s peque√Īo que una cinta VHS) puede contener una incre√≠ble cantidad de 60 TB de datos comprimidos. Estas son algunas de las cualidades que hacen que la cinta sea la soluci√≥n ideal para los hiperescaladores m√°s grandes que dependen de ella para un almacenamiento de archivos confiable y econ√≥mico. ¬Ľ

almacenamiento en cinta

Biblioteca de almacenamiento de cintas (Crédito de la imagen: Shutterstock / kubais)

A finales del a√Īo pasado, IBM tambi√©n anunci√≥ que hab√≠a batido el r√©cord mundial de densidad de superficie en un prototipo de cinta de ferrita de estroncio (SrFe), desarrollada por Fujifilm. El par alcanz√≥ un r√©cord de 317 GB / in ^ 2, lo que se traduce en 580 TB por cartucho, lo que demuestra que la cinta tiene mucho camino por recorrer antes de alcanzar la densidad m√°xima.

Aunque los atributos del almacenamiento de ADN son más comparables a los de las bandas, Quantum cree que es más probable que el ADN se adapte a las configuraciones existentes que a reemplazar la tecnología existente por completo.

‚ÄúLa cinta no muestra signos de desaparecer pronto, particularmente para prop√≥sitos de archivo a largo plazo en el sitio‚ÄĚ, nos dijo Goker. ‚ÄúEs la forma m√°s econ√≥mica de almacenamiento por megabyte, puede almacenar grandes cantidades de datos por cartucho y requiere costos operativos muy bajos. Tambi√©n es uno de los medios de almacenamiento m√°s seguros, ya que los datos se almacenan fuera de l√≠nea y tambi√©n pueden servir como un archivo activo, una funci√≥n clave y importante para los hiperescaladores.

‚ÄúEn lugar de considerar que las dos opciones de almacenamiento compiten, debemos considerar su complementariedad cuando trabajamos en conjunto. El ADN complementar√° las bandas en el futuro al coexistir como un sistema escalonado dentro de los centros de datos de hiperescala. Es poco probable que el ADN reemplace la cinta magn√©tica en los pr√≥ximos a√Īos, pero ocupar√° un nivel m√°s bajo, ya que la escritura una vez le√≠da rara vez se usa. Una combinaci√≥n perfecta para el archivado de big data ‚Ķ


Source link