Saltar al contenido
computerg

🥇 El Futuro Del Almacenamiento Según Phison

abril 17, 2021


Phison ya ofrece cifrado sobre la marcha en nuestros productos Opal SSD y FIPS 140-2. Como se mencionó anteriormente, funciona porque es una capacidad que puede ejecutarse con datos que ya van al SSD. La compresión es fácil de integrar en el SSD y se alinea con el concepto del modelo de transmisión, pero ofrece un beneficio limitado ya que la mayoría de los datos masivos (fotos, videos o música) ya están completamente comprimidos. Hay grandes conjuntos de datos que pueden beneficiarse de la compresión, pero el caso de uso es relativamente raro, por lo que tiende a delegarse para dedicar dispositivos de servidor.

El caso de la deduplicación rompe el modelo de transmisión por varias razones:

1) Se necesita una gran cantidad de memoria para realizar un seguimiento de los hash de cada sector.

2) Los SSD ya son trabajos en su totalidad en entornos de centros de datos, por lo que cualquier trabajo de investigación se suprime para E / S del host.

El único beneficio real de tener una búsqueda SSD es una ligera reducción en el tiempo de transferencia del bus PCIe y una carga reducida en el procesador host. Por el contrario, el costo de SSD debe aumentar debido a los requisitos de cómputo más altos y la DRAM adicional. Su poder activo también debe aumentar necesariamente. El problema de la deduplicación se implementa mejor mediante el uso de recursos del sistema de repuesto, especialmente por la noche cuando la gente duerme, en lugar de agregar un 10-20% de SSD.

Hoy en día existe un tipo de dispositivo informático híbrido que tiene mucho éxito: Smart NIC. Combinan una tarjeta de red de alta velocidad (típ. 10 Gb / s) con un potente procesador o FPGA. Si bien esta combinación funciona para la tarjeta de red, no funciona tan bien para el almacenamiento. La razón es muy sencilla. La parte inteligente de la tarjeta de red procesa los datos que ya están pasando a través de la tarjeta de red al host. La tarjeta de red inteligente funciona bien cuando puede procesar datos a medida que fluyen o cuando la tarjeta de red inteligente puede satisfacer una demanda accediendo directamente a los recursos del chasis.

La propuesta de valor típica para el almacenamiento informático se presenta de la siguiente manera: el SSD está más cerca de los datos, libera ancho de banda del bus y descarga el procesador host. A primera vista, el almacenamiento informático parece una venta fácil, pero no es así.

En primer lugar, el SSD ya está utilizando el 100% de sus recursos y presupuesto de energía para realizar su función principal. En muchos casos, los SSD empresariales de alta densidad deben limitar el rendimiento para evitar exceder su presupuesto de energía o enfriamiento. En segundo lugar, SSD normalmente utiliza núcleos de procesador pequeños que están muy lejos de lo que pueden hacer el procesador host o la GPU. En tercer lugar, este experimento se intentó antes de que Computation Storage se convirtiera en una palabra de moda. Una empresa intentó combinar una GPU y una SSD, pero la solución terminó degradando ambas tecnologías. Para cumplir con los requisitos de la GPU, la SSD tenía que funcionar muy rápido y agregar una gran carga térmica a la GPU. La GPU es mucho más caliente que una SSD y ha creado una tensión de retención sustancial en la NAND. Finalmente, un SSD es un consumible que tiene un ancho de banda de escritura limitado, mientras que una GPU puede funcionar indefinidamente hasta que se vuelva obsoleta.

Tomando un enfoque diferente, podríamos agregar un procesador más potente directamente al SSD. A continuación, nos encontramos con el problema de la RAM. Hoy en día, la mayoría de los SSD empresariales mantienen una relación NAND / DDR de 1000: 1. El SSD solo necesita extraer unos pocos bytes por cada traducción de 4K LBA, por lo que el ancho de banda DDR es relativamente bajo. Esto significa que el SSD puede usar DRAM de calidad más lenta, lo que reduce el costo total del módulo. Agregar un procesador invitado más grande al SSD con más DDR para aplicaciones reduce la energía disponible para la función principal del SSD de proporcionar E / S al host principal. También aumenta el costo del SSD, pero no proporciona una ganancia proporcional en la potencia de cálculo.

Luego está la cuestión de cómo se implementa el almacenamiento hoy que debe abordarse. Por lo general, los datos se agregan en conjuntos RAID de varias unidades y, por lo tanto, ningún SSD verá el conjunto de datos completo. Podríamos cambiar la forma en que se usa el almacenamiento, asegurándonos de que cada SSD siempre vea elementos de datos completos y use la replicación completa para proporcionar redundancia. Es poco probable que esto suceda porque este modelo no comparte el ancho de banda de almacenamiento si un SSD contiene más datos de los que se necesitan actualmente. Las cintas RAID resuelven este problema al escalonar los accesos para que cada cliente subsiguiente se inicie poco después del cliente actual. Podríamos extender el modelo donde cada SSD tiene una copia completa de un conjunto de datos implementando la replicación en múltiples unidades, pero luego necesitamos agregar un mecanismo de búsqueda y uso compartido de carga. La duplicación también tiene una huella de almacenamiento mucho mayor que la simple RAID5 o RAID6. En pocas palabras, la forma en que usamos el almacenamiento hoy en día es rentable, fácil de implementar y funciona bien para la mayoría de los escenarios. Cambiar la infraestructura de almacenamiento por completo a lo que equivale a agregar algunas CPU de servidor es difícil de justificar.

A pesar de la desventaja del almacenamiento informático de propósito general, existen algunos casos específicos que tienen sentido. Esto sucede cuando el caso de uso de almacenamiento refleja el caso ganador para Smart NIC. Es decir, el SSD solo necesita procesar los datos una vez cuando los mueve a través del dispositivo. Podemos equiparar el cifrado y la compresión con el almacenamiento informático, pero eso es un poco exagerado. Es más preciso definir estos dos casos de uso como procesamiento de datos en línea o de transmisión mediante un algoritmo muy simple.

Phison y uno de nuestros clientes desarrollaron un producto en el que encontramos una aplicación de almacenamiento de computadora muy adecuada para SSD. No requiere una gran cantidad de memoria o potencia de CPU y no interfiere con el propósito principal del SSD, que es el almacenamiento de E / S. Estamos desarrollando un producto de seguridad que utiliza el aprendizaje automático para buscar señales de un ataque de datos. Puede identificar ransomware y otras actividades no autorizadas sin un impacto medible en el rendimiento de SSD.


Source link