Saltar al contenido
computerg

ūü•á El Futuro Del Almacenamiento Seg√ļn Phison

abril 17, 2021


Phison ya ofrece cifrado sobre la marcha en nuestros productos Opal SSD y FIPS 140-2. Como se mencion√≥ anteriormente, funciona porque es una capacidad que puede ejecutarse con datos que ya van al SSD. La compresi√≥n es f√°cil de integrar en el SSD y se alinea con el concepto del modelo de transmisi√≥n, pero ofrece un beneficio limitado ya que la mayor√≠a de los datos masivos (fotos, videos o m√ļsica) ya est√°n completamente comprimidos. Hay grandes conjuntos de datos que pueden beneficiarse de la compresi√≥n, pero el caso de uso es relativamente raro, por lo que tiende a delegarse para dedicar dispositivos de servidor.

El caso de la deduplicación rompe el modelo de transmisión por varias razones:

1) Se necesita una gran cantidad de memoria para realizar un seguimiento de los hash de cada sector.

2) Los SSD ya son trabajos en su totalidad en entornos de centros de datos, por lo que cualquier trabajo de investigación se suprime para E / S del host.

El √ļnico beneficio real de tener una b√ļsqueda SSD es una ligera reducci√≥n en el tiempo de transferencia del bus PCIe y una carga reducida en el procesador host. Por el contrario, el costo de SSD debe aumentar debido a los requisitos de c√≥mputo m√°s altos y la DRAM adicional. Su poder activo tambi√©n debe aumentar necesariamente. El problema de la deduplicaci√≥n se implementa mejor mediante el uso de recursos del sistema de repuesto, especialmente por la noche cuando la gente duerme, en lugar de agregar un 10-20% de SSD.

Hoy en día existe un tipo de dispositivo informático híbrido que tiene mucho éxito: Smart NIC. Combinan una tarjeta de red de alta velocidad (típ. 10 Gb / s) con un potente procesador o FPGA. Si bien esta combinación funciona para la tarjeta de red, no funciona tan bien para el almacenamiento. La razón es muy sencilla. La parte inteligente de la tarjeta de red procesa los datos que ya están pasando a través de la tarjeta de red al host. La tarjeta de red inteligente funciona bien cuando puede procesar datos a medida que fluyen o cuando la tarjeta de red inteligente puede satisfacer una demanda accediendo directamente a los recursos del chasis.

La propuesta de valor típica para el almacenamiento informático se presenta de la siguiente manera: el SSD está más cerca de los datos, libera ancho de banda del bus y descarga el procesador host. A primera vista, el almacenamiento informático parece una venta fácil, pero no es así.

En primer lugar, el SSD ya est√° utilizando el 100% de sus recursos y presupuesto de energ√≠a para realizar su funci√≥n principal. En muchos casos, los SSD empresariales de alta densidad deben limitar el rendimiento para evitar exceder su presupuesto de energ√≠a o enfriamiento. En segundo lugar, SSD normalmente utiliza n√ļcleos de procesador peque√Īos que est√°n muy lejos de lo que pueden hacer el procesador host o la GPU. En tercer lugar, este experimento se intent√≥ antes de que Computation Storage se convirtiera en una palabra de moda. Una empresa intent√≥ combinar una GPU y una SSD, pero la soluci√≥n termin√≥ degradando ambas tecnolog√≠as. Para cumplir con los requisitos de la GPU, la SSD ten√≠a que funcionar muy r√°pido y agregar una gran carga t√©rmica a la GPU. La GPU es mucho m√°s caliente que una SSD y ha creado una tensi√≥n de retenci√≥n sustancial en la NAND. Finalmente, un SSD es un consumible que tiene un ancho de banda de escritura limitado, mientras que una GPU puede funcionar indefinidamente hasta que se vuelva obsoleta.

Tomando un enfoque diferente, podríamos agregar un procesador más potente directamente al SSD. A continuación, nos encontramos con el problema de la RAM. Hoy en día, la mayoría de los SSD empresariales mantienen una relación NAND / DDR de 1000: 1. El SSD solo necesita extraer unos pocos bytes por cada traducción de 4K LBA, por lo que el ancho de banda DDR es relativamente bajo. Esto significa que el SSD puede usar DRAM de calidad más lenta, lo que reduce el costo total del módulo. Agregar un procesador invitado más grande al SSD con más DDR para aplicaciones reduce la energía disponible para la función principal del SSD de proporcionar E / S al host principal. También aumenta el costo del SSD, pero no proporciona una ganancia proporcional en la potencia de cálculo.

Luego est√° la cuesti√≥n de c√≥mo se implementa el almacenamiento hoy que debe abordarse. Por lo general, los datos se agregan en conjuntos RAID de varias unidades y, por lo tanto, ning√ļn SSD ver√° el conjunto de datos completo. Podr√≠amos cambiar la forma en que se usa el almacenamiento, asegur√°ndonos de que cada SSD siempre vea elementos de datos completos y use la replicaci√≥n completa para proporcionar redundancia. Es poco probable que esto suceda porque este modelo no comparte el ancho de banda de almacenamiento si un SSD contiene m√°s datos de los que se necesitan actualmente. Las cintas RAID resuelven este problema al escalonar los accesos para que cada cliente subsiguiente se inicie poco despu√©s del cliente actual. Podr√≠amos extender el modelo donde cada SSD tiene una copia completa de un conjunto de datos implementando la replicaci√≥n en m√ļltiples unidades, pero luego necesitamos agregar un mecanismo de b√ļsqueda y uso compartido de carga. La duplicaci√≥n tambi√©n tiene una huella de almacenamiento mucho mayor que la simple RAID5 o RAID6. En pocas palabras, la forma en que usamos el almacenamiento hoy en d√≠a es rentable, f√°cil de implementar y funciona bien para la mayor√≠a de los escenarios. Cambiar la infraestructura de almacenamiento por completo a lo que equivale a agregar algunas CPU de servidor es dif√≠cil de justificar.

A pesar de la desventaja del almacenamiento informático de propósito general, existen algunos casos específicos que tienen sentido. Esto sucede cuando el caso de uso de almacenamiento refleja el caso ganador para Smart NIC. Es decir, el SSD solo necesita procesar los datos una vez cuando los mueve a través del dispositivo. Podemos equiparar el cifrado y la compresión con el almacenamiento informático, pero eso es un poco exagerado. Es más preciso definir estos dos casos de uso como procesamiento de datos en línea o de transmisión mediante un algoritmo muy simple.

Phison y uno de nuestros clientes desarrollaron un producto en el que encontramos una aplicaci√≥n de almacenamiento de computadora muy adecuada para SSD. No requiere una gran cantidad de memoria o potencia de CPU y no interfiere con el prop√≥sito principal del SSD, que es el almacenamiento de E / S. Estamos desarrollando un producto de seguridad que utiliza el aprendizaje autom√°tico para buscar se√Īales de un ataque de datos. Puede identificar ransomware y otras actividades no autorizadas sin un impacto medible en el rendimiento de SSD.


Source link