DataOps : le chaînon manquant de la gestion des données
Face à l'augmentation du volume, de la variété et de la vitesse de circulation des données, les entreprises ne peuvent plus s’appuyer sur les méthodes traditionnelles de gestion des données. Elles ont besoin au contraire de nouvelles solutions capables de fournir des informations qui apportent une valeur ajoutée à l'entreprise tout en répondant aux attentes changeantes des parties prenantes.
Selon l’analyse du rapport récent Rethink Data de Seagate, le DataOps, un condensé de « data » (données) et d’« operations » (opérations), est le chaînon manquant des chaînes d'informations exploitables, offrant une solution à certains des problèmes les plus urgents auxquels sont confrontés les équipes informatiques et les chefs d'entreprise. Dans le cadre du paysage plus large de la gestion des données, le DataOps aide les entreprises à tirer le meilleur parti de cette ressource d'entreprise essentielle.
Alors que 33 % des entreprises prévoient de renforcer leurs capacités et que 30 % ont commencé le processus de mise en œuvre, seulement 10 % des entreprises, toutes régions et tous secteurs confondus, ont pleinement mis en œuvre des stratégies DataOps.
Comparé au large attrait des autres efforts de transformation numérique (48 % des entreprises ont adopté des stratégies multicloud publiques), les déploiements DataOps sont à la traîne. Cela s'explique en grande partie par la position unique du DataOps dans la pile informatique : bien qu'il s'appuie à la fois sur des nouvelles technologies et des processus en évolution, il se définit mieux comme une discipline de données émergente qui relie les consommateurs et les créateurs pour améliorer la collaboration et favoriser l'innovation.
Pour atteindre cet objectif, les déploiements DataOps utilisent souvent une combinaison de technologies d'intelligence artificielle et d’apprentissage automatique, ainsi que des fonctionnalités d'extraction, de chargement et de transformation (ELT) pour collecter et corréler des données provenant de sources disparates. Mis en œuvre de manière efficace, le DataOps offre un avantage concurrentiel important.
La fonction principale du DataOps est de connecter les consommateurs de données, c’est-à-dire les décideurs d’entreprise, avec les créateurs de données, afin de renforcer le processus décisionnel de l'entreprise.
Les créateurs de données courants comprennent des machines telles que les appareils IoT et les terminaux, ainsi que le personnel chargé de collecter et de saisir les formulaires, les documents et autres données structurées clés. Le marché cible comprend les responsables opérationnels, c'est-à-dire tous ceux qui, au sein d'une entreprise, sont chargés de prendre des décisions au niveau de l'entreprise. Il est essentiel de souligner que les créateurs de données n'ont souvent pas une vision globale de la production de données, tandis que les consommateurs n'ont pas réellement besoin de données, mais plutôt d'informations exploitables.
La fonction principale du DataOps est de combler ce fossé. En corrélant des données disparates provenant de services cloud, centraux et périphériques, toutes produites par des créateurs différents, les initiatives DataOps efficaces peuvent synthétiser des informations exploitables applicables à des groupes spécifiques de consommateurs de données.
Les déploiements DataOps offrent des avantages considérables aux entreprises. Un commentaire récent du cabinet d’études Gartner abonde dans ce sens : « En introduisant les techniques DataOps de manière ciblée, les responsables des données et de l’Gartner abonde dans ce sens : « En introduisant les techniques DataOps de manière ciblée, les responsables des données et de l’analyse peuvent opérer une transition vers un accès plus rapide, flexible et fiable aux pipelines de données. »
Les structures organisationnelles, cependant, présentent souvent des défis pour les efforts de DataOps. Il faut savoir que 47 % des entreprises déclarent aujourd'hui utiliser plusieurs applications de sauvegarde et de récupération dans l'ensemble de l'entreprise. Si ces déploiements disparates ont un sens pour des fonctions géographiquement séparées, l’efficacité du DataOps dépend de le regroupement de ces systèmes de données en une entité unique et gérable. Comme mentionné dans un rapport de Software Development Times, les structures DevOps préexistantes peuvent contribuer à faciliter cette transition grâce au cadre établi de méthodologies agiles et itératives.
En outre, malgré les similitudes de nom, le DataOps n'est pas simplement le DevOps en termes de données. Cette discipline émergente représente plutôt une nouvelle façon d'aborder les données et d'interagir avec elles afin de créer une valeur à long terme. Au lieu d'adopter l'approche axée sur les problèmes privilégiée par les déploiements DevOps, le DataOps opère dans la direction opposée : il s'agit d'obtenir de nouvelles réponses à partir des ensembles de données existants pour cibler l'entreprise et fournir des informations exploitables.
Si la technologie constitue le principal obstacle potentiel entre les entreprises et un DataOps efficace, les défis humains liés à la communication et à la culture du lieu de travail peuvent également avoir un impact sur la mise en œuvre. Les silos sont l'itération la plus courante de ce problème. Les équipes travaillant sur des projets spécialisés sont souvent réticentes à partager le contrôle des ensembles de données critiques, ce qui entraîne le stockage, la gestion et l'analyse des données en silos.
Pour résoudre ce problème humain, il faut une stratégie de données globale axée sur les normes, l'architecture et la gestion à l'échelle de l'entreprise. Pour les déploiements DataOps à grande échelle, cela signifie que les fonctions clés doivent repasser sous le contrôle du service informatique, ce qui permet à toutes les équipes d'accéder aux mêmes pools de données accessibles à l'échelle mondiale et aux initiatives DataOps pour apporter de la valeur à la demande.
Selon l’étude Rethink Data, 42 % des entreprises mondiales déclarent aujourd'hui que les déploiements DataOps sont « très importants », tandis que 23 % les estiment « extrêmement importants » et que seulement 1 % affirment que ces initiatives ne sont pas du tout importantes pour l'avenir des opérations commerciales.
Par conséquent, il n'est pas exagéré de dire que, tout comme leurs homologues DevOps, les solutions DataOps sont non seulement là pour rester, mais aussi pour jouer un rôle essentiel dans l'avenir de la prise de décision à la demande des entreprises. Contrairement aux déploiements DevOps, cependant, le DataOps est essentiel pour son rôle de tissu conjonctif entre les créateurs de données et les consommateurs de données, permettant au personnel et aux parties prenantes de tirer une valeur maximale des actifs informationnels.
Alors que la collecte, le stockage et l’analyse de données à l’échelle du zettaoctet posent désormais des problèmes systémiques et opérationnels lors de la capture de la valeur totale de l'entreprise, le DataOps offre un moyen simple, sûr et économique d'activer le potentiel inhérent des connexions de données à l'échelle.
Pour en savoir plus sur la manière dont les entreprises peuvent exploiter davantage de données, lisez le rapport Rethink Data de Seagate.