风险分析的数据工程

风险分析的数据工程

什么是风险分析?

风险无处不在。这种风险会对人、资产、声誉和其他方面造成冲击。

下面是2011年泰国洪水和2012年纽约洪水的照片。当时,西部数据公司(Western Digital)提供了HW组件的关键比例,右图中,飓风桑迪(Hurricane Sandy)影响了纽约和美国东北部的许多人和企业。为这些事件提供保护需要出色的风险分析。理解这种风险对于防范它至关重要。保护不仅来自于更好的建筑法规,也来自于经济复苏。金融保护是金融服务和保险业的工作。鉴于我们需要关注的风险越来越多,提高我们对风险分析领域的理解和实践是当今大数据领域重要的问题之一。

风险分析如何工作?

风险有很多种类型,当谈到影响时,大多面对的是人或者资产的风险,很少有自然灾害和人为灾害在损害上的。

风险分析的最初步骤是从了解风险敞口开始的——特定资产、个人等所面临的风险。理解暴露意味着详细说明导致这些损害的事件和这些事件可能导致的损失。从这里开始,公式变得更加复杂。围绕该领域的数据繁忙。数据工程师、数据科学家和其他参与风险分析工作的人员预测、建模、选择和定价风险,计算如何提供有效的保护。

风险分析的数据工程

以房地产为重点的风险分析为例。风险分析,首先要了解房地产的风险敞口。有风险的可能是商业或住宅建筑。哪些事件可能构成风险,这些事件可能导致什么损失取决于许多变量。 

在当今的企业中,如果您想处理公开数据,就必须使用多个竖井系统,这些系统具有自己的数据格式和表示。这些系统说的不是同一种语言。为了让用户获得完整的图像,他们需要遍历这些系统,并不断地在它们之间转换和转换数据。作为数据工程师,如何提供跨所有系统的统一数据视图?你如何让一个风险分析师理解各种各样的风险从飓风到冰雹到风暴潮,并把这些汇总起来,这样你就能保证这些损失的承保范围。

业界使用了许多标准来集成、传输和交换这类信息。这些格式中最流行的是EDM -Exposure Data Model。然而,EDM和一些不太受欢迎的同行(CEDE – Catastrophe Exposure Database Exchange和OED – Open Exposure Data)没有很好地老化,也没有跟上行业的需求。

  • 这些旧的标准是以财产为中心,风险分析需要理解新的风险,如网络攻击、责任风险和供应链风险。
  • 这些较老的标准是专用的——它们是为单一系统设计的,而这些系统没有考虑到在其词汇表中需要新动词的各种系统的需求。比如它们就不能支持新的预测风险模型。
  • 这些标准没有提供正确的高保真数据的可移植性——公开数据格式通常不表示用于产生可允许数据完整性的丢失信息的丢失、参考数据和设置。
  • 这些标准没有可扩展性。版本控制和对特定产品格式(如SQL Server X版本的数据库格式等)的依赖不断使数据的可移植性变得更加困难。

免责声明:凡未注明来源或者来源为网络的信息均转自其它平台,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。网站只负责对文章进行整理、排版、编辑,不承担任何法律责任。若有侵权或异议请联系我们删除,谢谢。

发表评论

您的电子邮箱地址不会被公开。