什么是探索性数据分析

探索性数据分析是为了形成值得假设的检验而对数据进行分析的一种方法,是对传统统计学假设检验手段的补充。通俗地讲,就是说你不清楚数据中包含了什么模型或者隐含了什么关系,因此尝试各种方法来探索发现数据中可能存在的关系等。

探索性数据分析能帮助我们从看似混乱无章的原始数据中筛选出可用的数据;探索性数据分析在数据清理中发挥重要作用;探索性数据分析是建立算法和过滤模型的第一步; 探索性数据分析能通过数据碰撞发现新假设,通过机器学习不断的改进和提高算法的精准度。

探索性数据分析的技术手段包括:汇总统计和可视化。汇总统计是量化的(如均值和方差等),用单个数和数的小集合来捕获数据集的特征。可视化技术能够让人快速吸收大量可视化信息并发现其中的模式,是十分直接且有效的数据探索性分析方法,但可视化技术具有专门性和特殊性,采用怎样的图表来描述数据及其包含的信息与具体的业务紧密相关。

     

类似文章

发表评论

您的电子邮箱地址不会被公开。