A New Way to Data

La gravedad de los datos y su impacto en la infraestructura del almacenamiento de datos

La gravedad de los datos afecta toda la infraestructura de la TI; debe ser una consideración importante al momento de planear estrategias de gestión de datos.

Contenido

Gravedad de los datos Gravedad de los datos Gravedad de los datos

Ahora los datos son un activo esencial para las empresas de todos los sectores, al igual que son capital físico y propiedad intelectual. El crecimiento de los datos, junto con las crecientes cantidades de datos estructurados y sin estructurar, seguirá alcanzando tasas sin precedentes en los próximos años. Por su parte, la expansión de los datos (que es el creciente grado en el que los datos de las empresas dejan de residir en una ubicación y se dispersan a través de los centros de datos y las zonas geográficas) añade complejidad a los desafíos de la gestión del crecimiento, el movimiento y la activación de los datos.

Las empresas deben implementar una estrategia para gestionar de manera eficiente los datos masivos a través de los entornos de nube, periferia y punto final. Y ahora más que nunca es importante desarrollar una estrategia consciente y calculada a la hora de diseñar una infraestructura de almacenamiento de datos a escala.

Lo que funcionó para los terabytes no funciona para los petabytes. A medida que las empresas tengan como objetivo superar el costo y la complejidad del almacenamiento, el movimiento y la activación de los datos a escala, deberán buscar una mejor economía, menos fricción y una experiencia más simple (es decir, que sea sencilla, abierta, sin límites y que esté diseñada para una empresa distribuida y basada en los datos). A New Way to Data.

El concepto de gravedad de los datos es un importante elemento para considerar en estos esfuerzos.

De acuerdo al nuevo informe de IDC patrocinado por Seagate, Almacenamiento preparado para el futuro: modernizar la infraestructura para el crecimiento de los datos a través de ecosistemas híbridos, de la periferia y de la nube, a medida que el almacenamiento asociado a los conjuntos de datos masivos continúe creciendo, también lo hará su fuerza gravitacional en otros elementos dentro del universo de la TI.

Hablando de forma general, la gravedad de los datos es una consecuencia del volumen de los datos y el nivel de activación. La física básica proporciona una analogía adecuada: un cuerpo con mucha más masa tiene un efecto gravitacional más grande sobre los cuerpos que lo rodean. "Las cargas de trabajo con volúmenes más grandes de datos almacenados presentan una masa más grande dentro de su 'universo', y de esta forma atraen más aplicaciones, servicios y otros recursos de infraestructura en su órbita", de acuerdo con el informe de IDC.

Un conjunto de datos grande y activo, por su complejidad e importancia, necesariamente afectará la ubicación y el tratamiento de los conjuntos de datos más pequeños que necesita para interactuar con el. De este modo, la gravedad de los datos refleja la dinámica del ciclo de vida de los datos y debe ayudar a sustentar las decisiones de la arquitectura de la TI.

Considere dos conjuntos de datos: uno es petabyte 1 y el otro es gigabyte 1. Para integrar los dos conjuntos, es más eficiente mover el conjunto de datos más pequeño a la ubicación del conjunto de datos más grande. Como resultado, el sistema de almacenamiento del conjunto petabyte 1 ahora también almacena al conjunto gigabyte 1. Debido a que los grandes conjuntos de datos "atraen" otros conjuntos de datos más pequeños, las bases de datos tienden a acumular datos, incrementando aún más su gravedad de datos en general.

El hecho de gestionar, analizar y activar datos también depende de las aplicaciones y los servicios, si estos son proporcionados por un proveedor de la nube pública o privada o por un equipo de gestión de datos local. Las aplicaciones recopilan y generan los datos, además de consumirlos, analizarlos y agregarlos; los datos deben pasar por mucho trabajo. Naturalmente, si el conjunto de datos crece de forma masiva, será muy difícil utilizar esos datos a menos que estén cerca de las aplicaciones y los servicios que ayudan a gestionarlos o a activarlos. Por lo general las aplicaciones y los servicios se mueven cerca de los conjuntos de datos o se mantienen cerca de ellos. La gravedad de los datos es una propiedad que se extiende a través de toda la infraestructura de la TI, desde los centros de datos locales, hasta las nubes públicas y la computación en la periferia.

Pero de acuerdo con el informe de IDC, estos conjuntos de datos masivos pueden convertirse en agujeros negros, "atrapando los datos almacenados, las aplicaciones y los servicios en una sola ubicación, a menos que los entornos de la TI se diseñen para permitir la migración y la gestión del almacenamiento de los datos, junto con las aplicaciones y los servicios que dependen de ellos, independientemente de la ubicación operacional".

Ya que la gravedad de los datos puede afectar la infraestructura de la TI en su totalidad, debe ser una consideración de diseño importante al momento de planear estrategias de gestión de datos. De acuerdo con IDC, un objetivo importante al momento de diseñar un ecosistema de datos es: "asegurar que ningún conjunto de datos único ejecute una fuerza incontrolable en el resto de la TI ni en el ecosistema de las aplicaciones".

Garantizar que las aplicaciones tengan acceso a los datos, independientemente de la ubicación

La estrategia de arquitectura de la TI debe poner el almacenamiento masivo y el movimiento de los datos en su centro. Esto comienza al optimizar la ubicación de los datos. Una arquitectura centrada en los datos lleva las aplicaciones, los servicios y la interacción del usuario más cerca de la ubicación en la que residen los datos, en vez de confiar en las transferencias de datos masivos de larga distancia hacia y desde los proveedores de servicio centralizado, que por lo general demandan mucho tiempo y son costosas.

IDC afirma que "una forma para mitigar el impacto de la gravedad de los datos es garantizar que el almacenamiento de los datos se sitúe junto a las aplicaciones independientemente de la ubicación".

Este modelo puede llevarse a cabo al aprovechar los centros de datos con alojamiento de colocación que ofrecen proveedores de servicio de varias nubes tanto públicas como privadas, permitiéndole a las empresas vincular su almacenamiento de datos masivos con las mejores soluciones de su clase para las aplicaciones, la computación y las necesidades de red.

El objetivo principal de una arquitectura centrada en datos es la accesibilidad de los datos. La accesibilidad aumenta la facilidad de uso y la fluidez de las operaciones de la segmentación de datos y puede impactar la innovación empresarial en el futuro, mejorar la capacidad de generar metadatos y nuevos conjuntos de datos, habilitar la búsqueda y el descubrimiento de los datos y potenciar aún más a los científicos de datos para implementar dichos datos para el aprendizaje automático y la IA.

Pero poner los datos en el centro de la arquitectura de la TI también puede impactar positivamente la optimización del rendimiento de las aplicaciones, los problemas de latencia de la transferencia, los cargos de entrada y salida, y las necesidades de seguridad y cumplimiento. La fiabilidad y la durabilidad general de los datos también son beneficios importantes. La fiabilidad es la habilidad de acceder a los datos cuando se necesita, y la durabilidad es la habilidad de preservar los datos por prolongados periodos de tiempo.

Poner los datos en el centro de la estrategia de la TI

Juntas, estas consideraciones tendrán grandes implicaciones a la hora de planear la gestión de datos empresariales: desde definir una estrategia de la TI general, hasta formular una iniciativa empresarial. Planear las cargas de trabajo y los empleos necesarios significa que hay que tener en cuenta la gravedad de los datos. Las preguntas principales incluyen: ¿Qué volumen de datos se está generando o consumiendo? ¿Qué es la distribución de los datos a través del centro de datos, las nubes privadas, las nubes públicas, los dispositivos en la periferia, las oficinas a distancia y las oficinas sucursales? ¿Cuál es la velocidad en la que se transmiten los datos a través de todo el ecosistema de la TI? Implementar estas consideraciones incrementará la eficiencia de la infraestructura de los datos y podrá reducir los costosos problemas de la segmentación más adelante.

IDC recomienda en su informe: "No permita que una carga de trabajo única o una ubicación operativa determine el movimiento del almacenamiento o los recursos de los datos". Debido a que los datos tienen gravedad, la infraestructura de los datos debe diseñarse para prevenir que los conjuntos de datos masivos o las grandes cargas de trabajo individuales ejecuten una atracción gravitacional dominante sobre los recursos de almacenamiento, con una arquitectura que mueva de manera eficiente los recursos de almacenamiento, la computación o las aplicaciones cuando sea necesario.

Esto significa estar siempre informado acerca de hacia dónde se extraen los conjuntos de datos, cuál es la forma más eficiente de mover los datos, y qué ayuda para que las cargas de trabajo funcionen mejor. Esto también significa automatizar el movimiento de los datos para reducir los costos del almacenamiento o para mover conjuntos de datos de menor rendimiento que no se necesiten de manera inmediata o activa. También vale la pena considerar la gestión automatizada de los datos. Esto puede habilitar la búsqueda y el descubrimiento a través de almacenes de datos, lo que aumentará la accesibilidad de los datos.

Poner estas ideas en acción significa implementar una arquitectura y una infraestructura de datos y procesos de gestión que sean flexibles. Mientras que una organización puede tener una buena idea de las consideraciones de la gravedad de sus datos hoy, no será lo mismo dentro de cinco años.

"No todas la empresas gestionan varios conjuntos de datos masivos, pero muchas ya lo están haciendo", afirma IDC en el informe. "Y, dado el ritmo de la digitalización de las empresas y la importancia que se le da al valor de los datos empresariales y a la recopilación de los datos, muchas organizaciones se verán gestionando conjuntos de datos masivos en un futuro cercano".

Es importante que cada sistema de gestión de datos pueda cambiar para adaptarse a las nuevas necesidades de los datos. Para soportar esto, la gestión de los datos y la arquitectura de los datos deben ser ágiles y capaces de adaptarse a la transformación de las necesidades de las empresas y a las oportunidades técnicas emergentes.

Conozca más sobre la arquitectura híbrida, cómo superar las limitaciones de la red y la creciente complejidad de la gestión del almacenamiento en el nuevo informe de IDC, que es patrocinado por Seagate, Almacenamiento preparado para el futuro: modernizar la infraestructura para el crecimiento de los datos a través de ecosistemas híbridos, de la periferia y de la nube