我们现在生活在一个由数据驱动的世界中,每天收集和存储大量的信息。组织生成的数据越多,有效访问和分析数据的能力就越重要。

不幸的是,数据分析被认为是当今许多公司的薄弱环节。这主要是因为在执行无效分析时选择了选择了错误的数据存储系统类型。

改进分析的一种方法是收购企业级数据仓库。这就是数据仓库中的 OLAP 的用武之地。

☌ 什么是 OLAP?

在线分析处理,简称 OLAP,是一种计算方法,允许用户有选择地获取和查询信息,以便从不同的角度进行研究。OLAP BI(商业智能)查询通常有助于分析趋势、财务报告、销售预测和其他规划活动。

☌ OLAP 系统如何工作?

为了便于数据分析,OLAP 系统从多个来源收集信息并将这些信息存储在数据仓库中。然后,它会将数据清理并组织到数据立方体中。

每个 OLAP 多维数据集都包含按维度分类的数据,如地理销售区域、客户和时间段。然后用客户名称和国家/地区等详细信息填充这些维度,并根据层次结构进行组织。

执行所有这些操作后,数据分析人员可以执行四种类型的 OLAP 分析操作:

  • Roll-up:也称为整合或聚合,它可以通过两种方式执行操作:通过减少维度或通过提升概念层次结构。
  • Drill-down:向下钻取方法与汇总过程相反,它将信息分成更小的部分。
  • Slice and dice:在 Slice 中,分析师可以采取单一级别的信息进行显示。在 dice 中,分析师可以从多个维度中选择数据供他们评估。
  • Pivot:在 Pivot 中,分析师旋转数据轴以获得对正在研究的信息的新观点。

☌ OLAP 系统有哪些类型?

OLAP 等级结构从 OLAP 开始,然后是另外三种类型。这些是罗拉普、莫拉普和霍拉普。

  • ROLAP

Relational OLAP(ROLAP)是一种扩展的 RDBMS,它处理可以在关系数据库中找到的信息。所有事实和维度表都作为关系表保存,同时还允许进行多维数据分析。

ROLAP 的两个主要优点是它在处理大数据方面效率很高,并且具有可扩展性。它的主要缺点是需要更多的资源来执行,并且此 OLAP 系统的查询性能比其他系统慢。

  • MOLAP

Multidimensional OLAP(MOLAP)是一种经典的 OLAP 方法,它利用多维数据集促进数据分析。使用 MOLAP,用户可以从不同方面查看其数据。

MOLAP 的主要优点是其快速的查询性能、较小的数据量以及自动计算更高级别数据的能力。至于缺点,它比 ROLAP 的可扩展性更差,而且这种方法本身以引入数据冗余而闻名。

  • HOLAP

Hybrid OLAP(HOLAP)是 ROLAP 和 MOLAP 的组合。它允许快速计算 MOLAP,同时结合了 ROLAP 的高可扩展性。

使用 HOLAP 的主要好处是它有助于提高磁盘空间经济性,同时利用立方体技术,促进所有数据类型的更快性能。HOLAP 的主要缺点是,它是使用最复杂的类型,因为它同时支持 ROLAP 和 MOLAP。

☌ OLAP vs OLTP

OLAP 代表在线分析处理,与 OLTP 不同。

OLTP 能够遵循三层架构来支持面向交易的应用程序。OLTP 最常见的用途是管理组织内发生的日常交易,数据处理是其主要目标。

例子:假设有一对夫妇在他们的银行使用联名账户。有一天,两人决定同时在不同的自动取款机取款。无论两人谁先完成认证过程,都能得到他们想要的钱。在这种情况下,OLTP 系统确保取款金额不超过银行当前金额。

现在正在使用的其他一些 OLTP 系统的例子可以在下面找到:

  • 网上银行
  • 订单条目
  • 在购物车中添加物品
  • 发送短信
  • 在线预订机票

这里的关键是 OLTP 系统专为交易优势而设计,而不是为数据分析而设计。

为了更好地了解 OLTP 与 OLAP 的区别,让我们来看看下面的表。

参数OLTPOLAP
过程OLTP 是一个在线交易系统,处理数据库修改。OLAP 专注于在线分析和数据检索。
功能性OLTP 作为修改数据的在线数据库。OLAP 作为数据库查询管理系统。
查询OLTP 从存档中插入、更新和删除数据。OLAP 主要是选择操作。
来源OLTP 中的数据来源是发生的交易。不同的 OLTP 数据库是 OLAP 的数据源。
数据完整性OLTP 数据库必须保持数据完整性约束。OLAP 数据库不存在数据完整性问题
响应时间OLTP 响应时间为毫秒。OLAP 的响应时间为秒到分钟。
备份OLTP 具有完整的数据备份以及增量备份。OLAP 只需不时执行备份。
目的OLTP 是为处理实时业务操作而制作的。OLAP 专为分析业务措施而设计。
性能指标性能指标是交易吞吐量。性能指标是查询吞吐量。
生产力OLTP 有助于提高用户的自助服务和整体生产力。OLAP 提高了组织分析人员的生产率。

☌ 数据仓库中的OLAP用例

OLAP 在满足组织的分析需求方面发挥着至关重要的作用。以下是 OLAP 在各个领域的使用案例。

  • 市场营销:当 OLAP 用于营销时,它使营销分析师能够更多地了解他们的客户、哪些产品是有价值的、区域和季节性趋势等等。
  • 医疗保健:医疗保健数据仓库使用 OLAP 可用于预测健康风险和结果、与保险公司共享信息并生成报告。
  • 金融服务:公司首席财务官可以利用 OLAP 多维数据集为他们提供将数据转换为所需信息的方法,同时允许他们轻松生成定制财务报告。

☌ OLAP 的优势

以下是在数据仓库中使用 OLAP 的好处:

  • 高速数据处理:OLAP 以其快速的查询执行速度而闻名。设计良好的数据集通常可以在几秒钟内处理用户查询。
  • 多维数据表示:此能力允许用户从不同的角度或切片查看数据。
  • 平坦学习曲线:OLAP 供应商通常为客户提供广泛的教程和文档。他们通常也有一个专业团队,随时准备处理可能出现的任何问题。
  • 汇总和详细数据:OLAP 的另一个主要优点是向用户提供的信息是汇总的,非常详细。这意味着这些表格具有多个维度,使任何人都可以轻松浏览海量数据。

☌ 结论

如你所见,OLAP 在数据仓库中起着至关重要的作用,因为它可以帮助确保向用户提供的数据得到快速处理,从多个角度提供,并且详细无序。除此之外,它还有一个平坦的学习曲线,因为大多数供应商都提供了关于如何入门的深入教程。

作者:Vakul Gotra

免责声明:凡未注明来源或者来源为网络的信息均转自其它平台,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。网站只负责对文章进行整理、排版、编辑,不承担任何法律责任。若有侵权或异议请联系我们删除,谢谢。

发表评论

您的电子邮箱地址不会被公开。