7个需要避免的数据管理陷阱

7个需要避免的数据管理陷阱

大多数企业都知道将应用程序和工作负载迁移到云的好处。在当今的大数据领域中,云技术是必不可少的。但是,伴随变化而来的是风险。当IT系统出现故障或无法有效管理时,整个业务都会收到损失。

大数据投资显然是有利的,但是管理不善可能意味着一团糟。了解其他人所犯的常见错误,对于避免数据管理危机就容易了。可以提前准备好解决方案。

在数据管理中常见的7个陷阱下面一起来了解一下。

  1. 没有数据保护或治理 

所有公司数据在存储或传输时必须是安全的。无论如何,您都需要确保在出现问题时可以恢复。保持警惕,以防出现勒索软件,人为错误和其他风险。 

在开始数据传输之前,必须确保实现了有效的数据治理框架。这只有在创建治理机构时才可能实现,由具备在需要时监督适当的数据管理、传输和恢复能力的人员组成。

Data Governance Cycle

资料来源:  Informatica

2.将治理视为“项目”

一些企业将数据治理计划视为传统项目。数据永远在变化,流动,并具有多个交互点。因此,标准的项目管理方法不适合。程序方法更有效。通过这种方式,可以定义一系列独立的项目流,它们都专注于具有不同方法和技能的单个任务。只要有新的数据进出组织,该数据的治理就应该持续进行,并且没有明确的目的。

3.企业数据的不同解释 

如果数据的定义和使用之间各部门之间存在差异,则可能意味着输入,处理和报告的数据质量不足。数据质量策略必须结合一般业务人员,数据治理团队和外部专家。 

然后,这些人可以协作定义稳定且普遍认可的定义,以提高数据质量。屏幕共享等现代协作功能使这种协作更加容易。当企业将其数据视为组织资产时,数据治理进程才成为可能。

4.分析不良数据

数据分析对于推进数据集成应用程序是必需的。提取,转换,加载(ETL)开发人员专门从事数据传输。他们研究当前的数据集以清洗和处理它们。但是,这只是工作的一半。

例如,如果客户A将他们的电话号码添加到邮政编码字段,则指示ETL从邮政编码字段中提取电话号码并将其放在电话号码字段中。对于您当前的数据集,这是可行的,但是如果将来客户B做同样的事情,是否会重复该方法?

如果不考虑将来的数据集,而仅支持已经存在的数据集,那么将无法正确处理客户B的信息。无法预测数据,因此数据集中的灵活性至关重要。为了解决这个问题,在任何项目开始时进行深入的性能分析,就意味着在将来更新ETL的数据清理部分时所花费的时间更少。

5.没有创建和使用数据质量标准

如果数据评估既规范又可靠,那么每个应用程序中的数据质量将具有更高的标准。此外,基于持续监控和报告的类别的数据质量策略将更易于创建和管理。 

6.忽略数据质量管理

可以通过收集治理团队,开发人员,支持人员和业务社区的意见来定义数据质量。这样可以确保已定义项目的万无一失。该路线图考虑了应用程序的大小,稳定性和时间成本。以及合适的团队成员是否可以参与合适的项目。然后,所有步骤都具有业务和技术意义。 

偏离此路线会在未来产生问题。 

7.没有互操作性策略

许多组织正在采用混合基础架构来优化效率并降低成本。如果是这样,必须完全了解数据管理选项以及新策略可能对您的业务产生的影响。  

更换供应商有多容易?什么样的代码需要重写?云供应商的最大利益是用专有api和服务将您锁定。尽管如此,您和治理团队仍有责任保持所有数据和应用程序的多云能力。这样,你就会更灵活,有更多的选择。

作者:John Allen

免责声明:凡未注明来源或者来源为网络的信息均转自其它平台,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。网站只负责对文章进行整理、排版、编辑,不承担任何法律责任。若有侵权或异议请联系我们删除,谢谢。

发表评论

您的电子邮箱地址不会被公开。