EDA的类型

EDA的类型

EDA 类型的技术要么是图形的,要么是定量的(非图形的)。图形方法涉及以图表或视觉方式汇总数据,而定量方法则涉及汇总统计的计算。这两种方法又分为单变量方法和多变量方法。 

单变量方法一次考虑一个变量(数据列),而多变量方法一次考虑两个或多个变量来探索关系。因此,共有四种类型的 EDA——单变量图形、多变量图形、单变量非图形和多变量非图形。图形方法提供更多的主观分析,定量方法更客观。

  • 单变量非图形:这是四个选项中最简单的数据分析形式。在这种类型的分析中,被分析的数据只包含一个变量。此分析的主要目的是描述数据并找到模式。
  • 单变量图形:与非图形方法不同,图形方法提供了数据的全貌。这种类型下的三种主要分析方法是直方图、茎叶图和箱线图。直方图表示一系列值的案例总数。除了数据值外,茎叶图还显示了分布的形状。箱线图以图形方式描绘了最小值、第一四分位数中位数、第三四分位数和最大值的汇总。
  • 多元非图形:多元非图形类型的EDA一般通过交叉制表或统计来描述数据的多个变量之间的关系。
  • 多元图形:这种类型的EDA显示两组或更多组数据之间的关系。条形图,其中每个组代表一个变量的水平,组内的每个条形代表其他变量的水平。

发表评论

您的电子邮箱地址不会被公开。