Tres verdades sobre las unidades de disco duro y las unidades SSD
Examen de la afirmación de que la memoria flash reemplazará a las unidades de disco duro en el centro de datos.
"Las unidades de disco duro pronto serán cosa del pasado."
"Las matrices completamente en flash pronto reemplazarán a los discos y las matrices híbridas en el centro de datos."
"El centro de datos del futuro será solo en flash.”
Bienvenido a la última entrega de la eterna saga de la extinción de las unidades de disco duro. El debate, con los aspectos más destacados que se muestran arriba, se ha extendido por más de una década. Las predicciones que pronostican la desaparición de las unidades de disco duro pronunciadas por unos cuantos defensores –y digamos optimistas de la tecnología flash– no han envejecido bien a lo largo de los años. Pero parece que, con el tiempo, ellos se vuelven cada vez más descarados.
Sin lugar a dudas, el almacenamiento flash es ideal para admitir aplicaciones que requieren alto rendimiento y velocidad. Y los ingresos por flash están creciendo, al igual que los ingresos por matrices completamente en flash (AFA). Pero no a expensas de las unidades de disco duro. La premisa subyacente a la especulación sobre la muerte de las unidades de disco duro es profundamente errónea.
Vivimos en una era en la que la omnipresencia de la nube y la aparición de los casos de uso de la IA han elevado el valor de los conjuntos de datos masivos. Las unidades de disco duro, que actualmente almacenan la mayoría de los exabytes (EB) del mundo, son más indispensables que nunca para los operadores de centro de datos.
Incluso en los últimos años, cuando los precios de las unidades flash cayeron temporalmente a mínimos históricos, las unidades de estado sólido (SSD) no desplazaron a las unidades de disco duro en cargas de trabajo que requirieran almacenamiento masivo de datos.
Los analistas del sector esperan que las unidades de disco duro sean el principal beneficiario del crecimiento continuo de EB. El siguiente gráfico muestra que los centros de datos en la nube para empresa y a gran escala (donde reside la gran mayoría de los conjuntos de datos del mundo) será una ubicación clave de este crecimiento. En términos relativos, se prevé que el almacenamiento en unidades de disco duro crezca un 6,996 EB, mientras que las unidades SSD crecerán un 1,363 EB entre 2022 y 2027.1
No es un juego de suma cero. En los centros de datos, las unidades de disco duro y la memoria flash siempre trabajaron en sinergia para admitir diferentes servicios. Cada una tiene sus propias ventajas y propuestas de valor. De hecho, en la era de la IA generativa, computar clústeres estrechamente asociados con la tecnología flash alimenta indirectamente la necesidad descendente de más EB de unidades de disco duro, ya que el contenido generado debe almacenarse de forma económica.
Esta sinergia de soportes de almacenamiento está viva y en buen estado, mientras que la conjetura sobre la obsolescencia de las unidades de disco duro carece de credibilidad y, en última instancia, no se hará realidad.
Echemos un vistazo más de cerca a tres mitos clave que subyacen a esta conjetura, y las razones basadas en datos de terceros por las que las unidades de disco duro seguirán siendo fundamentales para las arquitecturas de almacenamiento de datos para el futuro previsible.
Los datos son claros. Las unidades de disco duro tienen una sólida ventaja de costo por terabyte (TB) sobre las unidades SSD, lo que las posiciona como la piedra angular indiscutible de la infraestructura de almacenamiento del centro de datos.
A pesar de que los precios del almacenamiento de memoria flash NAND siguen siendo muy volátiles y alcanzaron un mínimo en 2023 debido a la débil demanda y el exceso de oferta, la empresa de análisis Forward Insights pronostica un resurgimiento de los precios para las unidades SSD a partir de 2024 y hasta 2025. Después de enfrentarse a una abrupta caída de precios, los proveedores de unidades SSD darán la bienvenida a este cambio después de luchar para reducir el inventario obsoleto y recortar el gasto de capital para igualar la oferta con la demanda. En consecuencia, ya hemos comenzado a ver aumentos de precios para las soluciones basadas en NAND.
El análisis de Seagate de la investigación realizada por IDC, TRENDFOCUS y Forward Insights confirma que los discos duros seguirán siendo la opción más rentable para la mayoría de las tareas empresariales. Se prevé que la diferencia de precio por TB entre las unidades SSD para empresa y las unidades de disco duro para empresa se mantendrá en un nivel superior de 6 a 1 hasta al menos 2027.
Esta diferencia de precio por TB es particularmente evidente en el centro de datos, donde el costo de adquisición de dispositivos es, con mucho, el componente dominante en el costo total de propiedad (TCO). Teniendo en cuenta todos los costos del sistema de almacenamiento, incluidos los costos de adquisición de dispositivos, energía, redes y computación, los sistemas basados en unidades de disco duro ofrecen un costo total de propiedad muy superior por TB.
En un intento por eludir estas discrepancias en el costo total de propiedad y las disparidades de precios, algunos OEM de AFA han comenzado a diseñar sus propios dispositivos NAND de alta densidad personalizados con puntos de capacidad de cientos de TB, alegando ventajas teóricas del costo total de propiedad que van más allá de la economía del dispositivo hasta el nivel del sistema. El problema con esta lógica es que añadir niveles drásticamente más altos de densidad NAND a un único dispositivo o sistema no altera la marcada diferencia de costo por TB de los soportes sin procesar.
Otra táctica utilizada para distraer la atención de la desventaja del costo por TB tiene que ver con los llamados "TBe" o "terabytes efectivos." Se afirma que, debido a las técnicas de reducción de datos (por ejemplo, la compresión de datos), una unidad SSD puede ofrecer mucho más espacio de almacenamiento de lo que implica su capacidad bruta. Sin embargo, en grandes implementaciones, la reducción de datos se produce más arriba en la pila, lo que los hace irrelevantes a nivel de almacenamiento. Además, dado el mayor enfoque en la protección de datos y la prevalencia del cifrado, la compresión de datos a menudo no es factible en la mayoría de los casos de uso empresarial y en la nube. Cuando los datos están cifrados, no se pueden comprimir porque su entropía es tan alta que no hay ningún patrón que simplificar.
En resumen: Mientras que la memoria flash se destaca en la realización de tareas específicas y de alto rendimiento, las unidades de disco duro seguirán siendo el destino principal para los EB de los centros de datos, ya que ofrecen una solución fiable, rentable y ampliamente adoptada en el futuro previsible.
La noción de que el sector de las NAND aumentaría o podría aumentar rápidamente su oferta para sustituir toda la capacidad de disco duro no solo es optimista, sino que dicho intento llevaría a la ruina financiera. La transición de unidad de disco duro a NAND no se trata solo de producir más unidades. Es un gigante financiero y logístico para ejecutarlo, y mucho menos a un precio que es competitivo con las unidades de disco duro.
Según el cuarto trimestre de 2023,NAND Market Monitor del cuarto trimestre del analista de la industria Yole Intelligence, toda la industria de NAND envió 3.1 zettabytes (ZB) de 2015 a 2023, mientras que tuvo que invertir la asombrosa cantidad de 208 mil millones de dólares en gastos de capital, aproximadamente el 47 % de sus ingresos combinados.
Por el contrario, el sector de las unidades de disco duro satisface la gran mayoría (casi el 90 %) de las necesidades de almacenamiento de los centros de datos de una manera muy eficiente. Para ayudar a clarificar esto, usemos la tecnología de Seagate como un proxy para el sector de las unidades de disco duro. Entre 2015 y 2023, Seagate envió 3.5 ZB de almacenamiento. Las inversiones de capital de Seagate durante ese periodo de ocho años ascendieron a un total de 4,300 millones de dólares, o solo alrededor del 5 % de los ingresos totales por unidades de disco duro de Seagate. Esto equivale aproximadamente a 67,000 millones de dólares por ZB para el sector de NAND frente a 1,000 millones de dólares por ZB para la producción de unidades de disco duro (como lo representa Seagate). El sector de las unidades de disco duro es mucho más eficiente a la hora de ofrecer ZB al centro de datos. Los pronósticos de IDC para las unidades de disco duro y de Forward Insights para las unidades SSD muestran que, en 2024, la producción de EB de unidades de disco duro será casi tres veces mayor que la de las unidades SSD. Ese mismo año, en los mercados empresariales y de centro de datos, la producción de EB de unidades de disco duro será seis veces superior a la de las unidades SSD.
Recientemente, algunos proveedores de AFA han afirmado que la industria flash podría reemplazar por completo la producción de capacidad de toda la industria de las unidades de disco duro para 2028. Veamos qué tipo de inversión necesitaría la industria de NAND para lograrlo.
El informe de Yole Intelligence citado anteriormente indica que, de 2025 a 2027, la industria de NAND invertirá alrededor de 73 mil millones de dólares, lo que se estima que producirá 963 EB de salida para unidades SSD empresariales, así como otros productos NAND para tabletas y teléfonos. Esto se traduce en una inversión de aproximadamente $76 por TB de salida de almacenamiento flash. Si se aplica ese mismo precio de capital por bit, se requeriría una asombrosa inversión adicional de 206 mil millones de dólares para respaldar los 2.723 ZB de capacidad de disco duro que se espera se envíen en 2027. En total, son casi 279 mil millones de dólares de inversión para un mercado total de aproximadamente 25 mil millones de dólares.
Está claro que este nivel de inversión es poco probable para una industria que enfrenta rendimientos inciertos, especialmente después de perder dinero a lo largo de 2023.
Lo últimoLa Ficha técnica de NAND Flash Platinum de TrendForce más reciente muestra que hay aproximadamente 28 plantas de fabricación de NAND en todo el mundo en operación en 2024. Si usamos la fase 1 de Fab7 de Kioxia, abierta en octubre de 2022, por ejemplo, la creación de una única fábrica de NAND ecológica cuesta unos 6.8 mil millones de dólares. Por lo tanto, el gasto de capital incremental de 206 mil millones de dólares que necesita la industria de NAND sería aproximadamente igual a 30 nuevas fábricas. Estas instalaciones tendrían que construirse, ampliarse, probarse, cualificarse y ponerse en línea para su producción completa en los próximos tres a cuatro años, duplicando el número de fábricas de NAND en todo el mundo en menos de cuatro años.
Además, el informe StorageSphere de 2023 de IDC muestra que, en 2023, la relación entre la capacidad instalada de unidades de disco duro SSD en los centros de datos en la nube y fuera de la nube es de 7 a 1. IDC pronostica que esta proporción dominante de EB basados en unidades de disco duro se mantendrá entre 6 y 7 veces en el futuro previsible, con una tasa de crecimiento anual compuesta (CAGR) del 26 %, lo que dará lugar a una capacidad de unidad de disco duro de hasta 10 ZB en 2027. Por lo tanto, además de reemplazar toda la producción anual futura de nuevas instalaciones de unidades de disco duro año tras año como se describió anteriormente, el sector de NAND también necesitaría invertir para reemplazar la parte antigua de esta base instalada de 10 ZB de unidades de disco duro de centros de datos cuando lleguen al final de su ciclo de vida útil: una inversión incremental muy por encima de los 206 mil millones de dólares necesarios solo para reemplazar la capacidad de disco duro de 2.723 ZB que se espera que se ofrezca en 2027.
Las soluciones NAND atienden cargas de trabajo específicas de centro de datos de manera eficiente, pero la idea de que los centros de datos dependan completamente de ellas está plagada de peligros. Más allá de los riesgos y la imposibilidad de que el sector de las NAND sustituya el suministro de unidades de disco duro, la volatilidad de los precios añade otra capa de incertidumbre para las empresas que buscan la estabilidad del suministro y el mejor costo total de propiedad para su almacenamiento.
La idea de que NAND pueda reemplazar completamente a las unidades de disco duro en un futuro previsible es muy improbable, si no imposible. La industria tendría que superar formidables obstáculos financieros y logísticos mientras invierte una gran cantidad de capital y tecnología en un mercado que no está preparado para un cambio que altere la arquitectura actual del centro de datos.
Este tema es una falsa dicotomía. Los proveedores de flash completo aconsejan a las empresas “simplificar” y “prepararse para el futuro” apostando por solo flash para obtener un alto rendimiento. De lo contrario, plantean, las empresas se arriesgan a no poder seguir el ritmo de las demandas de rendimiento de las cargas de trabajo modernas. Esta lógica de suma cero falla por tres razones:
Vamos a abordarlos uno por uno.
Primero, la mayoría de los datos del mundo residen en la nube y en grandes centros de datos. En estos entornos, las cargas de trabajo siguen una regla de Pareto: solo un pequeño porcentaje de la carga de trabajo requiere un porcentaje significativo del rendimiento. Esta es la razón por la que, según IDC3, durante los últimos cinco años, los discos duros han representado casi el 90 % de la base de almacenamiento instalada en proveedores de servicios en la nube y centros de datos de hiperescala.
Eche un vistazo a la tabla siguiente, derivada de la investigación de 2023 Global DataSphere de IDC. La mayoría de los datos del mundo son parte de cargas de trabajo que necesitan un tiempo de transferencia de datos nominal para casos de uso general.
En algunos casos, los sistemas completamente flash ni siquiera son necesarios como parte de las soluciones de mayor rendimiento. Existen sistemas de almacenamiento híbridos que funcionan tan bien como todo en flash o aún más rápido. A nivel de dispositivo, las diferencias de rendimiento son obvias; sin embargo, a gran escala en los bastidores de los centros de datos, el rendimiento de la unidad de disco duro se beneficia de un acceso extremadamente paralelo, lo que resulta en un nivel de rendimiento que es más que suficiente para la mayoría de las cargas de trabajo, incluidos la IA y el aprendizaje automático. Igual de importante, cualquier ventaja de rendimiento incremental significativa que ofrece la memoria flash a menudo puede verse limitada por otras decisiones de infraestructura, como la capacidad o la calidad de la red.
Segundo, como se estableció anteriormente en este artículo, las consideraciones sobre el TCO son clave para la mayoría de las decisiones sobre la infraestructura del centro de datos. Esto obliga a un equilibrio entre el costo, la capacidad y el rendimiento. El costo total de propiedad óptimo se consigue alineando los soportes más rentables (unidad de disco duro, memoria flash o cinta) con los requisitos de carga de trabajo. Las unidades de disco duro y las matrices híbridas (creadas a partir de unidades de disco duro y SSD) son ideales para la mayoría de los casos de uso de aplicaciones y almacenamiento empresarial y en la nube.
Por supuesto, uno puede optar por usar unidades SSD o AFA para cargas de trabajo que se adapten mejor a las unidades de disco duro, como los servicios de archivos, el almacenamiento de objetos, los sistemas de gestión de documentos o el alojamiento web. Pero en cuanto a los costos, entre mayor sea la capacidad, más extrañamente ilógica sería dicha decisión. Es como usar su automóvil, estacionado en una cochera, para guardar su ropa. ¿Es posible? Seguro, si eso es lo que quiere hacer con un automóvil. ¿Pero es rentable? En absoluto.
Aunque el almacenamiento flash es excelente en situaciones de lectura intensiva, su resistencia disminuye con el aumento de la actividad de escribir. Los fabricantes solucionan este problema con la corrección de errores y el aprovisionamiento excesivo, es decir, almacenamiento adicional que no se ve para reemplazar las celdas desgastadas. Sin embargo, estas soluciones conllevan costos adicionales: El exceso de aprovisionamiento aumenta enormemente el costo del producto incorporado y se necesita energía constante para evitar la pérdida de datos. Esto plantea desafíos para entornos como los centros de datos perimetrales o cualquier entorno en el que el funcionamiento continuo no esté garantizado y se acelere a altas temperaturas.
Además, mientras que las tecnologías como la celda de triple nivel (TLC) y la celda de cuatro niveles (QLC) permiten que la memoria flash maneje cargas de trabajo con un gran volumen de datos, como las unidades de disco duro, la justificación económica se debilita para los conjuntos de datos más grandes o la retención a largo plazo. En estos casos, las unidades de disco, con su creciente densidad de área, ofrecen una solución más rentable. En entornos de hiperescala, el aprovechamiento de miles de unidades de disco duro en paralelo logra un rendimiento que complementa la memoria flash, lo que ilustra su función colaborativa en los centros de datos modernos.
En consecuencia, mientras que flash de QLC se está apoderando de un porcentaje considerable del mercado de TLC, al igual que TLC reemplazó el almacenamiento NAND de celdas de varios niveles (MLC), no está erosionando la cuota de mercado de las unidades de disco duro debido a los factores de costo, disponibilidad y carga de trabajo explorados en este artículo.
El tercero y un aspecto relacionado es la afirmación de que los AFA son superiores a las matrices híbridas o a los sistemas de almacenamiento de unidades de disco duro. Los defensores de la tecnología flash afirman que usar un tipo de almacenamiento es "más simple" que adoptar una combinación de tipos de soportes y niveles de almacenamiento. No tan rápido
Muchos sistemas de almacenamiento híbrido emplean una arquitectura definida por software bien probada y finamente ajustada que, sin problemas, aprovecha a la perfección los puntos fuertes de diversos tipos de soportes en unidades únicas. En las arquitecturas de centro de datos de nube privada o pública de gran escala, los sistemas de archivos o el almacenamiento definido por software se utilizan para administrar las cargas de trabajo de almacenamiento de centro de datos. Ofrecen una flexibilidad más que adecuada, lo que permite a las empresas ajustar su composición de almacenamiento en función de las necesidades en constante cambio.
Las unidades AFA y SSD son ideales para cargas de trabajo de alto rendimiento y lectura intensiva. Pero es un error extrapolar los casos de uso de nichos o las implementaciones a pequeña escala al mercado masivo y a hiperescala, donde los AFA proporcionan una forma innecesariamente costosa de hacer lo que las unidades de disco duro ya ofrecen con un TCO mucho más bajo.
Las arquitecturas de almacenamiento en la nube, a hiperescala y para grandes empresas seleccionan el almacenamiento que optimiza el costo, la capacidad y el rendimiento. Las unidades de disco duro sirven cargas de trabajo que la memoria flash no debería. Flash ofrece cargas de trabajo que las unidades de disco duro no deberían. Ambos soportes de almacenamiento coexistirán en el centro de datos, y las unidades de disco duro seguirán dominando en términos de EB almacenados en un futuro previsible.
Hablando de EB, es común señalar el aumento de los volúmenes de unidades SSD junto con la disminución de los envíos de unidades de disco duro como prueba de un punto de inflexión en el mercado de almacenamiento. Pero este argumento es una pista falsa, ya que no reconoce los incrementos en la capacidad de disco duro y los envíos totales de EB de unidades de disco duro, que están aumentando más rápido que nunca. Un ejemplo de esto: gracias a la innovación de densidad de área habilitada para HAMR, la nueva plataforma Mozaic™ de Seagate duplicará la capacidad máxima de la unidad en los próximos cuatro años, mientras que la tecnología tradicional de grabación magnética perpendicular (PMR) tardó nueve años en lograr el mismo resultado.
En lugar de contar el volumen de unidades, lo que importa cuando se trata de medir con precisión el crecimiento son los envíos de EB. Los analistas predicen que los envíos de EB de unidad de disco duro seguirán aumentando a un ritmo sin precedentes. Y aunque el almacenamiento flash también verá un crecimiento, no se acercará a las unidades de disco duro en términos de capacidad instalada.
El análisis de Seagate de los datos de IDC y TRENDFOCUS predice un aumento de casi el 250 % en las perspectivas de EB para discos duros para 2028. Extrapolando más allá en el tiempo, esa proporción se mantendrá durante la próxima década. Eche un vistazo:
La supuesta obsolescencia de las unidades de disco duro ha sido un tema de discusión en la industria tecnológica durante más de una década. Pero las diversas predicciones no han envejecido bien. Tampoco esperamos que la ronda más reciente sea correcta.
Casi invariablemente, los absolutistas de flash intentan fundamentar sus argumentos con falacias lógicas, a menudo extrapolando desde un pequeño subconjunto de casos de uso a escala, que es donde sus conclusiones no son válidas.
Es marketing creativo en el mejor de los casos.
En realidad:
Por supuesto, hay otros mitos que contribuyen al "marketing creativo" que predice la desaparición de las unidades de disco duro: los mitos sobre la sostenibilidad, la potencia y la fiabilidad, entre otras áreas. Esté atento: los abordaremos en próximas publicaciones. Sin embargo, los tres mitos mencionados anteriormente nos parecen los más relevantes.
Cualquier interrogatorio serio de los datos expuestos en este artículo lleva a la conclusión de que las unidades de disco duro han llegado para quedarse. Seguirán almacenando la gran mayoría de los datos del mundo en el futuro.
Sugerir lo contrario es pura ilusión.
IDC, Pronóstico global de StorageSphere, 2023-2027. Doc n.º US50851423, junio de 2023.
Ibid.
IDC, Estudio multicliente, Índice de infraestructura de nube 2023: Consumo de computación y almacenamiento de 100 proveedores de servicios, noviembre de 2023.