Cargas de trabajo de centros de datos de Seagate atendidas completamente por sistemas de almacenamiento híbridos y en disco duro
En una era de demanda insaciable de datos, Seagate no solo es el fabricante líder de soluciones de almacenamiento; también es una importante empresa global que gestiona grandes cantidades de datos a través de sus propios centros de datos expansivos. Al enfrentarse a los antiguos sistemas de almacenamiento completamente en flash, Seagate vio la oportunidad de modernizar su estrategia para satisfacer las necesidades actuales y el crecimiento futuro de los datos. La empresa decidió implementar sistemas de almacenamiento híbridos que proporcionan capacidad masiva a través de unidades de disco duro más una fina capa de flash, por su capacidad de escalar la capacidad de datos masivos de manera eficiente, sin sacrificar el rendimiento de ninguna manera. Se implementaron varias matrices de almacenamiento InfiniBox de Infinidat en varios centros de datos de Seagate.
Mucho se ha hecho recientemente sobre la idoneidad de las unidades de disco duro y las unidades de estado sólido (SSD) para los centros de datos. Hay buenas razones por las que las unidades de disco duro continúan soportando aproximadamente el 90 % de los requisitos de capacidad de hiperescala y en la nube.1 La propia experiencia de Seagate ha demostrado por qué: Una estrategia integral, en la que las unidades flash y las unidades de disco duro no solo coexisten, sino que se complementan entre sí, garantiza que se satisfagan todas las necesidades de almacenamiento de Seagate, desde las más rutinarias hasta las más exigentes.
La implementación por parte de Seagate de estos sistemas de almacenamiento híbrido es un gran ejemplo de cómo la sinergia de las dos tecnologías es más efectiva para satisfacer las demandas de los centro de datos modernos. El almacenamiento flash tiene como función la mejora del rendimiento para tareas específicas, mientras que las unidades de disco duro representan la columna vertebral, manejando el almacenamiento masivo de datos.
Las unidades de disco duro y las unidades SSD son tecnologías de almacenamiento importantes pero diferentes, con enfoques fundamentalmente diferentes para leer y escribir datos. Y, por supuesto, las unidades de disco duro tienen una ventaja significativa en el coste por terabyte sobre las unidades SSD. La arquitectura de almacenamiento escalable requiere una combinación de dispositivos de medios, optimizada para satisfacer las necesidades de presupuesto, capacidad y rendimiento de las cargas de trabajo.
Para los arquitectos y operadores de centro de datos, hay varios factores clave que dirigen las decisiones de arquitectura de almacenamiento: alta disponibilidad y resistencia, rendimiento, capacidad, compatibilidad y costo general. Estos elementos garantizan que la infraestructura de almacenamiento pueda gestionar cargas de trabajo diversas y exigentes de manera eficiente y económica.
Los requisitos del centro de datos de Seagate se formaron a partir de objetivos claros dirigidos a las operaciones complejas de la empresa, que abarcan la investigación, el diseño, la fabricación y una presencia diversa en el mercado que abarca los canales de empresa a empresa (B2B) y de empresa a consumidor (B2C). Al reconocer el creciente volumen de datos generados por los dispositivos del Internet de las Cosas (IoT), la automatización y la digitalización en la fabricación, Seagate se propuso aumentar de manera rentable su capacidad de almacenamiento y su rendimiento. Esta mejora sería vital para aprovechar la inteligencia artificial y el análisis de datos, lo que genera valor comercial al derivar información de grandes volúmenes de datos no estructurados.
La amplia gama de operaciones fundamentales de la empresa se basa en:
Los analistas han observado que la gran mayoría de los datos asociados con las cargas de trabajo empresariales requieren una capacidad masiva y una transferencia de datos en tiempo nominal, que se adaptan bien a las ventajas de escala y costo total de propiedad (TCO) que ofrecen las unidades de disco duro. Vinod Pasi, vicepresidente y director global de infraestructura de TI de Seagate, confirma que este paradigma refleja la experiencia de Seagate en la creación de una arquitectura de almacenamiento de datos que sirva de manera efectiva a todas las cargas de trabajo de sus centro de datos.
La implementación estratégica de Seagate de los sistemas de almacenamiento híbrido ha sido fundamental para gestionar de manera eficiente su diversa gama de cargas de trabajo de centros de datos. La empresa ha identificado cargas de trabajo específicas que exigen diferentes niveles de rendimiento de transferencia de datos y capacidad de almacenamiento masivo.
Por ejemplo, las bases de datos de informes en tiempo no real, como BDW e Informatica, junto con las bases de datos de fábrica como ODS, TS y PIC, representan una parte significativa de las necesidades de almacenamiento de datos de Seagate. Estas cargas de trabajo, que también incluyen máquinas virtuales (VM) de VMware que alojan aplicaciones Linux y Windows, servicios de archivos (NFS, CIFS, SFTP, FTP), Hadoop HDFS para varios sitios y clústeres de almacenamiento MinIO para aplicaciones de copia de seguridad y aprendizaje automático, representan en conjunto aproximadamente el 90 % de La capacidad de almacenamiento de Seagate. Estas cargas de trabajo son atendidas principalmente por unidades de disco duro debido a sus importantes requisitos de capacidad y la rentabilidad del almacenamiento en unidad de disco duro.
Para las cargas de trabajo que requieren transferencia de datos en tiempo real, como las bases de datos de soporte de línea de fábrica y Citrix VDI, que representan el 10% de las necesidades de almacenamiento de Seagate, las capacidades de almacenamiento en caché inteligente y colocación de datos de los sistemas de almacenamiento híbrido garantizan que el rendimiento no se vea comprometido. Estas aplicaciones se benefician de la fina capa de las unidades SSD integradas en los sistemas híbridos, que proporcionan la velocidad necesaria y la baja latencia para las operaciones en tiempo real, a la vez que aprovechan las unidades de disco duro de alta capacidad para la mayor parte del almacenamiento de datos.
Las cargas de trabajo de los centro de datos de Seagate ilustran una tendencia más amplia del sector en la que la mayoría de los datos empresariales se gestionan de manera eficiente mediante soluciones de almacenamiento híbridas. Al optimizar el equilibrio entre las unidades de disco duro para el almacenamiento masivo que requiere un rendimiento de transferencia de datos en tiempo nominal a real, y las unidades SSD para tareas de alto rendimiento que requieren una transferencia de datos en tiempo real a tiempo ultra real, los sistemas de almacenamiento híbrido ofrecen una arquitectura eficaz. Esa arquitectura puede manejar cargas de trabajo diversas y exigentes de centros de datos, lo que garantiza un alto rendimiento y escalabilidad sin los costos prohibitivos asociados con una infraestructura completamente en flash.
Los arquitectos de almacenamiento en la nube, a hiperescala y de gran cantidad empresarial tienden a seleccionar la combinación más adecuada de tipos de almacenamiento para optimizar el costo, la capacidad y el rendimiento. Las matrices de almacenamiento híbridas avanzadas son ideales para ese objetivo. Las unidades SSD son ideales para cargas de trabajo de alto rendimiento y lectura intensiva que requieren una transferencia de datos en tiempo ultra real (una proporción muy pequeña de las cargas de trabajo), mientras que las unidades de disco duro proporcionan el acceso necesario a datos masivos y sirven a la inmensa mayoría de las cargas de trabajo. Las unidades de disco duro gestionan cargas de trabajo que la memoria flash no debería, y la memoria flash gestiona las cargas de trabajo que las unidades de disco duro no deberían. La implementación de sistemas híbridos avanzados puede simplificar la arquitectura, lo que garantiza que cada medio de almacenamiento se utilice cuando más se necesite.
Los centros de datos de Seagate utilizan una combinación de soluciones de almacenamiento diseñadas para satisfacer las necesidades operativas específicas.
Anteriormente, Seagate resolvía algunas demandas de rendimiento de almacenamiento utilizando sistemas completamente en flash, que proporcionaban un alto rendimiento pero a un costo significativo: los soportes flash cuestan más de seis veces más que los soportes de unidad de disco duro por terabyte (TB). En busca de una solución más rentable que pudiera ofrecer un rendimiento comparable y la escalabilidad necesaria para el crecimiento futuro, Seagate implementó 17 nuevos sistemas de almacenamiento híbrido.
Además de las matrices híbridas, Seagate emplea 26 sistemas de almacenamiento de unidades de disco duro Exos para funciones específicas como el almacenamiento de datos de cámaras de seguridad, los destinos de las copias de seguridad y la conservación de registros de certificación.
La mayor parte de nuestra capacidad de almacenamiento, más de 50 petabytes, la proporcionan las unidades de disco duro Seagate Exos, que están integradas tanto en los sistemas híbridos Infinidat como en los sistemas de almacenamiento Exos basados exclusivamente en disco.
Cada matriz híbrida proporciona 4,6 petabytes de espacio utilizable en el unidad de disco duro más una fina capa flash. La tecnología de almacenamiento en caché inteligente optimiza dinámicamente la gestión de datos entre sus variados soportes de almacenamiento, ajustándose a las cargas de trabajo cambiantes para garantizar automáticamente un alto rendimiento para las exigentes aplicaciones de Seagate. La arquitectura satisface la demanda de un mayor almacenamiento de datos, lo que permite a la empresa gestionar de manera eficiente cualquier carga de trabajo mediante la optimización de la capacidad y la velocidad de acceso para tareas de uso intensivo de datos, todo con un menor TCO por TB.
Las unidades de disco duro y las unidades SSD se complementan entre sí en cuanto a soluciones de almacenamiento, ya que las unidades SSD gestionan los requisitos de alta velocidad y baja latencia, y las unidades de disco duro gestionan las necesidades de almacenamiento de alta capacidad. Por lo general, las unidades SSD son ideales para tipos de bloques y archivos que requieren una latencia muy baja de menos de 1 milisegundo, lo que las hace adecuadas para cargas de trabajo de lectura intensiva de muy alto rendimiento. Por otro lado, las unidades de disco duro son adecuadas para una gama más amplia de tipos de archivos, incluidos los tipos de bloques, archivos y objetos, especialmente cuando una alta capacidad es esencial. Las unidades de disco duro son más adecuadas para aplicaciones con requisitos de latencia moderada a alta, que van desde 1 hasta más de 100 milisegundos.
Como la mayoría de los sistemas de almacenamiento híbridos, InfiniBox de Infinidat incorpora unidades de disco duro como almacenamiento principal. También incluye una caché DRAM más grande de lo habitual y un nivel de estado sólido que sirve como caché secundaria. La memoria caché DRAM más grande permite almacenar más datos cerca de las CPU, lo que aumenta el rendimiento y ayuda en la eficacia de las estrategias de colocación de datos. La mayoría de los datos del sistema residen en unidades de disco duro, la base de las capacidades de almacenamiento masivo. Al fusionar de forma inteligente los datos en la caché de escribir y escribirlos secuencialmente, estos sistemas garantizan una mayor eficiencia de escritura y minimizan el impacto en la resistencia de los soportes flash. Los metadatos del sistema se guardan en DRAM utilizando estructuras de datos trie para un acceso rápido y eficiente, lo que contribuye al alto rendimiento y escalabilidad del sistema.
Los algoritmos gestionan la ubicación de los datos de forma inteligente en una jerarquía de almacenamiento por niveles. Los sistemas utilizan el etiquetado de metadatos para supervisar las métricas, incluidas las frecuencias de acceso, los tamaños de bloque, las frecuencias de lectura/escritura y los perfiles de E/S de aplicación asociados, utilizando información dinámica sobre qué datos es más probable que se referencien y se usen juntos. A continuación, el sistema realiza una precarga eficaz de los datos, lo que genera altas tasas de aciertos en la caché de lectura.
Este enfoque integrado ilustra cómo los sistemas de almacenamiento híbridos avanzados aprovechan las ventajas de las unidad de disco duro y las unidades SSD, asignando las cargas de trabajo donde se pueden gestionar de manera más eficiente: el almacenamiento masivo en las unidades de disco duro y las tareas de mejora del rendimiento en las unidades SSD.
La implementación por parte de Seagate de una estrategia de almacenamiento híbrido ha permitido aumentar la rentabilidad y la productividad, lo que proporciona beneficios financieros anuales por petabyte de capacidad de almacenamiento, entre los que se incluyen la reducción de los costes de infraestructura de TI, la mejora de los tiempos de copias de seguridad, la mejora de los tiempos de carga y la aceleración de las tasas de transacción.
Vinod Pasi dice que la evaluación comparativa de su equipo de TI muestra que los nuevos sistemas híbridos superan, a un costo menor, el rendimiento de las matrices completamente en flash anteriores, a la vez que proporcionan un crecimiento sustancial de la capacidad, acomodando varias cargas de trabajo con alta eficiencia, incluyéndolo todo, desde grandes bases de datos y análisis hasta servicios de archivos y Cargas de trabajo de VMware.
La transición permitió a Seagate optimizar sus operaciones de almacenamiento de datos, pasando de múltiples matrices completamente en flash a un solo sistema híbrido para administrar su crucial base de datos de 350 TB. Este cambio simplificó la arquitectura y redujo la complejidad del soporte y el mantenimiento, marcando un paso estratégico hacia una gestión de datos más eficiente.
En general, en todas las cargas de trabajo, el equipo de TI ha visto mejoras significativas en varias métricas de rendimiento. Los tiempos de copias de seguridad mejoraron en un 90 %, pasando de horas a minutos. Los tiempos de carga mejoraron un 40 %. Las tasas de transacción aumentaron un 35 %. Las velocidades de consulta son más de un 20 % más rápidas.
En general, en todas las cargas de trabajo, el equipo de TI ha visto mejoras significativas en varias métricas de rendimiento. Los tiempos de copias de seguridad mejoraron en un 90 %, pasando de horas a minutos. Los tiempos de carga mejoraron un 40 %. Las tasas de transacción aumentaron un 35 %. Las velocidades de consulta son más de un 20 % más rápidas.
Al consolidar las matrices de almacenamiento, Seagate redujo significativamente tanto los gastos de capital (CapEx) como los gastos operativos (OpEx), casi reduciendo a la mitad los gastos generales. La adopción de estos sistemas híbridos ha mejorado las capacidades operativas de TI de la empresa, simplificando la gestión y mejorando la resistencia.
La transición ha permitido a Seagate alcanzar fácilmente sus requisitos de capacidad y rendimiento. Un solo sistema híbrido puede gestionar hasta 17,287 PB de capacidad efectiva, por lo que además de facilitar la consolidación de la carga de trabajo de TI de Seagate en el presente, Seagate puede escalar fácilmente la capacidad de sus sistemas en el futuro en función de múltiples factores, ya que la empresa implementa sus últimas unidades de disco duro Exos con Tecnología Mozaic 3+ que ofrece más de 30 TB por unidad y más de 3 TB por plato.
La simplicidad y la complejidad reducida de la infraestructura del centro de datos de Seagate es otra ventaja significativa. Al consolidar una gama diversa de cargas de trabajo en menos sistemas híbridos, Seagate agilizó las operaciones, reduciendo los gastos generales y los desafíos logísticos asociados con la gestión de un panorama de matrices de almacenamiento heterogéneo. Esta simplificación se tradujo no solo en un ahorro de costes, sino también en una mayor agilidad operativa, lo que permitió al equipo de TI de Seagate centrarse más en la innovación y menos en el mantenimiento. La flexibilidad y la escalabilidad de los sistemas complementaron la dirección estratégica de Seagate, proporcionando la capacidad de escalar dinámicamente la capacidad de almacenamiento en alineación con las necesidades empresariales en evolución, sin las cargas financieras y logísticas típicamente asociadas con la escalabilidad de las soluciones completamente en flash.
Vinod Pasi señala una verdad fundamental que está al centro del proceso de toma de decisiones de Seagate: el equilibrio entre el rendimiento y la capacidad es primordial. Aunque las matrices completamente en flash que se implementaban anteriormente ofrecían un alto rendimiento, las necesidades integrales de empresas como Seagate también requerían capacidades de datos voluminosas. Los sistemas de almacenamiento híbrido cubren hábilmente esta brecha, ofreciendo métricas de alto rendimiento sin sacrificar la capacidad de almacenar petabytes de datos de manera económica. Este equilibrio admite no solo los requisitos operativos inmediatos, sino que también posiciona a Seagate para gestionar el crecimiento de datos y los cambios tecnológicos futuros.
IDC, Estudio multicliente, índice de infraestructura en la nube 2023: Consumo de computación y almacenamiento por parte de 100 proveedores de servicios, noviembre de 2023