DataOps:数据管理的缺失环节
随着数据量、种类和速度的增加,组织无法再依赖传统的数据管理方法。相反,他们需要能够获得洞察的新解决方案,能够在满足不断变化的利益相关者期望的同时,创造业务线价值。
根据 Seagate 最新《数据新视界》报告中的分析,DataOps(“数据”和“运营”的组合)是可操作信息链中缺失的环节,可为某些 IT 团队和企业主所面临的最紧迫问题提供解决方案。作为更大数据管理领域的一部分,DataOps 可帮助组织实现这一重要企业资源的最佳价值。
33% 的企业拥有容量建设计划,30% 的企业已经开始实施过程,但只有 10% 的跨地区和行业的企业已经全面实施了 DataOps 战略。
与广受欢迎的其他数字化转型工作(48% 的企业已采用公有多云战略)相比,DataOps 的部署相对滞后。在很大程度上,这源于 DataOps 在 IT 堆栈中的独特地位:虽然它利用新技术和不断发展的流程,但最好将其定义为一个新兴的数据学科,可将消费者和创作者联系起来,以加强协作并赋能创新。
为了实现这一目标,DataOps 部署通常结合使用 AI 和 ML 技术,以及提取-加载-转换 (ELT) 功能来收集和关联来自不同来源的数据。在进行有效实施后,DataOps 将提供显着的竞争优势。
DataOps 的主要功能是将数据消费者(业务决策者)与数据创建者联系起来,并为企业决策赋能。
常见的数据创建者包括 IoT 和端点设备等机器,以及负责收集和输入关键表格、文档和其他结构化数据的员工。目标市场包括运营经理,即组织中负责制定业务线决策的任何人。需要注意的是,数据创建者通常不了解数据生产的全貌,而消费者实际上并不需要数据;相反,他们需要的是可操作的信息。
DataOps 的主要功能就是弥合这一差距。通过关联来自不同创建者的云、核心和边缘服务的不同数据,有效的 DataOps 计划可以综合适用于特定数据消费者群体的可操作见解。
DataOps 部署为组织提供显着的好处。研究公司 Gartner 最近发表的评论指出:“通过有针对性地引入 DataOps 技术,数据和分析领导者可以影响向更快速、灵活和可靠的数据管道交付的转变。”
然而,组织结构经常会给 DataOps 工作带来挑战。比如,现在 47% 的公司表示他们在整个企业中使用多个备份和恢复应用。虽然这些不同的部署对于地理上分离的功能很有意义,但有效的 DataOps 取决于将这些数据系统组合成一个单一、可管理的实体。正如《软件开发时间》报告中所指出的,由于敏捷、迭代方法的既定框架,预先存在的 DevOps 结构将有助于顺畅地实现这种过渡。
此外,尽管名称相似,但 DataOps 不仅仅是数据的 DevOps。相反,这一新兴学科代表了一种处理数据并与数据交互以提供长期价值的新方式。DataOps 没有采用 DevOps 部署所青睐的以问题为中心的方法,而是朝着相反的方向运作:从现有数据集中得出新的答案,以缩小企业重点并提供可操作的洞察。
虽然技术是企业与有效 DataOps 之间的主要潜在障碍,但围绕沟通和工作场所文化的人类挑战也会影响实施。孤岛是这个问题最常见的迭代。从事专业项目的团队通常不愿意共享对关键数据集的控制,从而导致数据在孤岛中存储、管理和分析。
解决这个人类问题需要一个专注于企业范围标准、架构和管理的全球数据战略。对于大规模的 DataOps 部署,这意味着将关键功能交还给 IT 的权限范围内,从而允许所有团队访问相同的、全球可访问的数据池和 DataOps 计划,以按需交付价值。
根据《数据新视界》调查,42% 的全球组织现在表示 DataOps 部署“非常重要”,而 23% 认为它们“极其重要”,只有 1% 认为这些举措并没有重要到影响业务运营的未来。
因此,可以毫不夸张地说,就像 DevOps 一样,DataOps 解决方案不仅会保留下来,而且还会在按需企业决策的未来发挥关键作用。然而,与 DevOps 部署不同的是,DataOps 作为数据创建者和数据消费者之间的连接组织,使员工和利益相关者能够从信息资产中获得最大价值,因此其作用至关重要。
现在,ZB 规模的数据收集、存储和分析为获取完整的企业价值带来了系统和运营方面的挑战,DataOps 提供了一种简单、安全且经济的方式来激发大规模数据连接的内在潜力。
阅读 Seagate《数据新视界》报告,详细了解企业如何利用更多业务数据。