数据分析的未来是什么?

当前的AI和ML(机器学习)方法本质上是统计的,无法生成模型或从数据中发现因果机制(有时科学家确实在AI和ML的帮助下提供了帮助,但AI或ML本身没有提供帮助,人们感到困惑,认为这是AI或ML )。

包括深度学习(和深度神经网络)在内的趋势和方法都是黑匣子方法,可以很好地描述数据,但是对生成机制的了解却很少。结果,它们也无法扩展到未经培训的领域,并且在进行任何有趣的操作之前需要对大量数据进行培训,并且每次展示(甚至略有不同)数据时都需要进行培训。 

希望AI和ML将更多地应用于模型驱动的方法中,而将传统的统计方法抛在后面,并结合算法通用的第一原则。这意味着推动基础科学,而不是像当前的AI和ML那样简单地投入更多的计算资源来解决所有问题。

以前模型驱动方法的强大示例包括微分方程建模,但是这些方法还缺少探索和更新(从而改进和扩展)模型的机制,因此需要强大的模型数据循环驱动方法。幸运的是,我们正在朝这个方向努力,这里是我们基于动态计算推断的基于因果的方法:因果发现和重新编程系统的算法信息演算。

首先,与Go上击败人类的深度学习(DL)的新闻相比,结果看起来似乎不太令人印象深刻。并且有理由对DL作为一种非常强大的工具来挖掘和分析数据感到兴奋。DL最终将被整合到数据分析家默认将使用的一组工具中,就像今天人们进行线性回归分析一样(DL实际上是对类固醇的回归分析)。然而,基础科学家继续从相反的方向推动建模和理解,而不是从大数据中获取大量数据。

例如,上述论文演示了推理算法引擎如何根据自然或诱发的观测结果生成近乎最佳的模型,以创建可再现系统的生成机制,该系统又可以再现观测到的数据,从而阐明原因,而不仅仅是效果,这才是我们想做的事情。

发表评论

您的电子邮箱地址不会被公开。