数据分析的方法(一)

数据分析的方法(一)

至今,数据分析师的行业依然很火热,但是大部分人还是不清楚数据分析的目的是什么,分析的步骤、方法都有哪一些。数据分析主要就是为了从海量的数据中提取有用的信息和形成结论,从而对数据加以详细的研究和概括总结。

数据分析的步骤主要是以下几步:

1、确定数据的准确性

2、明确影响数据的因素

3、重视长期的数据检测

4、保持客观的视角

5、注意剔除干扰项

在分析过程中主要运用的方法有以下16种:

描述统计

描述统计主要是通过图表或者数学方法,对已有的数据资料进行整理、分析,把数据的分布状态、数字特征和随机变量三者之间的关系进行估计和描述呈现。描述统计主要集中在趋势分析、离中趋势分析和相关分析三个部分。

我们举一个简单的例子,环境会影响植物的生长,那么如何增加植物的增长高度呢?我们需要把不同的温度、湿度、光照时间、降水量等环境因素进行排列组合,然后把每一种环境作为实验单独进行处理,从而用因素分析法找出与植物增长的相关系数最高的环境因素。

二、假设检验

1、参数检验

2、非参数检验

假设检验一般分为三个步骤:建立假设,确定检验水平;选择检验方法,计算统计量大小;根据统计量确定P值,做出推断统计。假设检验的方法主要分为t-检验、z-检验和F-检验,与此相关的统计学知识也是数据分析师需要学习掌握的。

三、信度分析

数据分析中的信度分析主要多用于SPSS中,那其实就是信度检验和效度检验。这两种检验方式相互独立但是检验结果相辅相成。SPSS也是数据分析中一个非常重要的软件,信度分析是需要各位数据分析师好好掌握的一种分析方法。

四、列联表分析

列联表是指对一组观察对象分别观察其两种分类变量的表现,归纳成双向交叉排列的统计表,这一类统计表用的描述行变量和列变量之间的关系就叫做列联表或者交叉表。

五、相关分析

相关分析作为数据分析的一个基本的方法,常用语发现不用的变量之间的关联性,也就是相似性,从而可以帮助我们预测未来。

六、方差分析

方差分析也叫做单因素方差分析,一种因素是认为可以控制的测量出来的因素,另一种就是不可控的随机因素。而因素所在的状态则称为因素的水平,那么如果在试验的过程中,只有一个因素在改变,就称此实验为单因素试验。方差分析主要是用来验证两组及以上不同的样本中的样本均值是否有显著性的差异。

举个例子来首,一共有6台机器用来生产规格相同的铝合金铜板,铝合金铜板的厚度就是实验的指标,机器就是因素,不同的6台机器是因素的6个水平。那这个实验的目的就是考察每台机器生产出来的铝合金铜板的厚度是不是有非常明显的差异。

今天就先介绍上面6中数据分析的常见方法,剩下的几种我们下一篇再继续。

发表评论

您的电子邮箱地址不会被公开。