企业端数据分析的顾客价值体系到底有多重要!

双十一已然过去不久,双十二又笃笃笃即将来临。橙色软件、红色软件也都有针对消费者的优惠活动,其实就是出于对顾客价值的一种管理。企业内部建立完善的顾客价值体系会在业务增长上有帮助。

21世纪企业发展的核心——客户导向,一个企业的发展方向由市场来决定,客户评价一个企业是否有竞争力从企业能否持续不断地创造客户认同的价值出发,客户决定一个品牌是否值得忠诚从企业能否持续不断地得到优异的价值出发,客户的认同是品牌资产增值的前提,而能否获得客户的认同在于企业能否为企业和客户提供可持续的价值。

举个例子,我们来看GM策略中的价值错位。可能出于美国情节,钟情于大排量汽车,其中包括31%的毛利率,从而忽略了市场对高质量、小排量、更贴近生活的家用小轿车的需求。我们从中可以看出几个问题,首先,GM没有跟市场与时俱进,没有向他们的忠诚用户提供所需要的产品,从而就为他们的竞争对手提供了机会。其次,错误的饱和渠道策略也使得客户的服务质量下降,代理商无利可图,如此,便导致了三输的局面。

再看GM品牌资产的损耗。GM的历史已经近百年,近年来的营销预算甚至高达13亿美金,具有较高的市场认知度。但是过多地注重企业的自身利益,而忽略了向产业价值链中其他成员比如经销商、客户等输送价值,导致品牌资产和忠诚客户的双向流失,最终失去了市场。

从GM的例子中,我们可以汲取经验教训。以企业/产品/利润为中心的营销策略往往会过于注重短期的利益,从而在面临具备客户智能、注重长期效益的竞争者的挑战的时候,容易出现品牌资产和忠诚客户双向流失的局面。尤其是大型的老牌企业,如果过于信赖以往成功的经验然后忽略了市场的变化。

我们再来看看星爸爸的问题。2007年2月14日,星爸爸前CEO Howard Schultz注意到大量的忠诚客户出现流失现象,同时品牌号召力出现下降,对此批评说:我们做出的许多关于企业发展的决策在当时是非常正确的。但是随着时间的推移,这些决策的长期效果堆积起来却产生了巨大的破坏力。片面追求发展使我们忘记了是什么让星巴克如此深受欢迎。现在,让我们回到我们的核心价值中来吧。

从中我们可以看出星巴克的快速扩张已经对其品牌效应造成了严重的影响。

数据分析师在进行数据分析的过程中对顾客和市场怎么进行细分?又是什么驱动了客户的需求?构建细分的过程是什么样的?感兴趣的小伙伴可以深入思考一下,我们下一篇文章继续讨论。

数据分析师如何在项目管理中大显身手?

在如今的大数据时代,很多企业都开始利用大数据所产生的的价值来为自身盈利所服务。不同的行业,不同的企业,大数据能够起到的角色和作用也是各不相同。那在企业的数据分析部门中,项目管理起到一个什么样的作用呢?

项目管理是什么?把各种知识、技能、工具和技术应用于项目各项活动中,以达到项目的要求。简单说来,项目管理是对变化的管理,既是科学,又是艺术。项目管理不仅仅是一门学科、职业、专业,更是一种理念、一种方法。

  那在数据分析过程中项目管理有多重要呢?他能帮助数据分析师在数据分析的过程中极大地提高效率、保证工作结果和质量、控制住进度和成本、提高工作的执行力、改变我们的生活。反之,如果数据分析师没有掌握项目管理的能力,在工作中难免会因为繁杂的头绪而产生混乱甚至疏漏,还可能造成同事间的协作不良,风险和意外都会影响项目的进度。

那么项目管理具体包含的内容有哪些呢?

项目管理基础

项目整体管理

项目范围管理

项目时间管理

项目成本管理

项目质量管理

项目人力资源管理

项目沟通管理

项目风险管理

10、项目采购管理

当我们在一开始的时候设定一个愿打的理想,却总感觉遥不可及不愿迈出第一步的时候:

1、 整合管理会告诉你实现目标所需要做的所有的事情

2、 范围管理会让你做需要做的工作

3、 时间管理会让你在有生之年即使无法实现也起码能看到阶段性的进展

4、 成本管理不会让你的收入增加但是绝对会让你减少很多不必要的开支

5、 质量管理会让你有一个清晰明确的验收标准

6、 人力资源管理让你能更好的经营自己的朋友圈

7、 沟通管理会让你变成一个很有魅力的人

8、 风险管理会让你提前预防甚至规避掉那些本应该吃亏的弯路

9、 采购管理会让你在未来的日子里更有目的和节制地消费

10、干系人管理会让你在遇到困难时能第一时间找到对的人

  那一个成功的项目的定义是什么呢?项目成功有三个定义——按时完成、预算内、质量符合预期要求,包括功能和性能。

在数据分析的过程中,项目管理受制于时间、质量、成本这三个因素的影响。

在启动、计划、执行、控制、收尾这五大过程组中,要注意主要项目干系人的影响,数据分析师接触到的每个项目里都会包含有项目经理、客户、项目实施组织、项目管理团队、项目团队成员、项目发起人和出资方、施加影响者、PMO。而项目的整体管理过程从制定一个项目的章程出来,然后再制定项目的初步范围说明说,接着制定项目的管理计划。随之,就是相关部门的指导与管理项目执行阶段了。在监视和控制项目启动、计划、执行和结束的过程中,数据分析师需要帮助实现范围说明书中定义的项目要求。在整体变更控制的环节就可以把成果交付出去和组织过程中涉及到的资产,审查所有的变更请求,批准与控制变更。最后在项目收尾的过程中,完成所有项目管理过程中的所有活动,正式结束项目。

项目管理是一个非常复杂的过程,但是数据分析师在分析的过程中在海量数据的支持下,把握好每个项目的进度,对于数据分析师们也是一个不大不小的挑战。

透过数据看看美国大选的“笑话”

作为数据分析的参考,这是我在其他网站上看到的图形:

这是我从其发布的数据集中创建的相同数据的图表:

数据范围实际上一直上升到6,但是为了与它们的版本保持一致,在这里我将他们裁剪为2。需要注意的一件事是,它们的版本似乎包含一些额外的要点。

我在这里把网格线包含在内,是因为我想指出一点:这些应该是每个批次的D / R投票比率,并且我们知道比赛是摇摆的,因为延迟计数的批次很大程度上是拜登的那一方数据。但是此图显示了后期批次几乎没有突破1.0 D / R比率。如果批量投票比率如上所述,拜登绝不可能卷土重来。

此外,在整个州的数据统计中,选票并没有“洗牌”。他们被送到县投票中心,而不是一个州级办公室。因此,各个批次会受到县的高度偏见,无法得到公正的数据分析。并且趋势线应比我们在这里看到的嘈杂得多。举个例子,对于宾夕法尼亚州来讲,该州有两个主要的延迟计数县,阿勒格尼和蒙哥马利,数据分析师们希望看到的是两个重要趋势,而不仅仅是一个。

最后,选举结果的数据打击到了我。这些不是作者声称的逐批D / R投票比率。这些实际上是累积的D / R投票比率。这是当我们向散点图添加漂亮的线条时的样子。

现在,我们看到的不仅仅是在开始时随机绘制散布的D / R批次,我们只是在查看累积比率中的早期噪声,该噪声是由于到目前为止计数的票数少而最终稳定到接近的比率,然后趋势随着邮寄票数的支持而上升。它们趋于上升的原因仅仅是因为后期批次的绝大多数是支持拜登的那一方。向上趋势并没有意味着批次后期变得更加亲拜登随着时间的推移作为作者的权利要求。

今天我们从一位数据分析师的角度来分析了一下美国大选背后的数据问题,如果有感兴趣的小伙伴可以来九道门商业数据分析学院了解更多呦~~~

数据分析师如何使用统计数据?

我们开门见山,这是数据分析师使用统计数据的7种方式

1.设计和解释实验以指导产品决策

观察:广告变体A的点击率比变体B高5%。

数据分析师可以帮助确定这种差异是否足够显着,以致需要引起更多的关注,关注和投资。

它们可以帮助你了解实验结果,这在你测量多个指标,运行相互影响的实验或结果中发生某些Simpson悖论时特别有用。

假设你是一家全国性的零售商,并且你正在尝试测试新的营销活动的效果。数据分析师可以帮助你确定应分配给实验组的存储,以在实验组和对照组之间取得良好的平衡,应分配给实验组的样本量以获得清晰的结果,以及如何进行研究支出尽可能少的钱。

使用的统计数据:实验设计,频率统计(假设检验和置信区间)

2.建立预测信号而非噪声的模型

观察:12月的销售额增长了5%。

数据分析师可以告诉你可能的原因,为什么销量增长了5%。数据分析师可以帮助你了解推动销售的因素,下个月的销售情况以及需要注意的潜在趋势。

请参阅什么是过度拟合的直观解释,尤其是对于少量样本集?过度拟合实际上是在做什么?高R²,低标准误差的过高承诺如何发生?了解为什么仅适合信号这一点很重要。

使用的统计数据:回归,分类,时间序列分析,因果分析

3.将大数据变成全局

观察:一些顾客只购买健康食品,而另一些顾客仅在有销售时才购买。

任何人都可以观察到该企业有100,000个客户在你的杂货店购买10,000个项目。

数据分析师可以帮助你标记每个客户,将他们与相似的客户分组,并了解他们的购买习惯。这样一来,你便可以查看业务发展如何影响特定人群,而不必整体看待每个人或单独看待每个人。

邓恩比(Dunhumby)将杂货店购物者分为以下几个组:“预算购物者”,“最精打细算”,“以家庭为中心”,“观看腰围”和“挥霍与保存” 。

使用的统计信息:聚类,降维,潜在变量分析。

4.了解用户的参与度,保留率,转化率和潜在客户

观察:很多人都在注册我们的网站,而且再也没有回来。

为什么你的客户从你的网站上购买商品?你如何保持客户回头客?为什么用户退出你的渠道?他们什么时候出来?你公司最喜欢哪种电子邮件来吸引用户?参与,活动或成功的一些主要指标是什么?有哪些好的销售线索?

使用的统计数据:回归,因果分析,潜在变量分析,调查设计

5.给用户他们想要的东西

给定用户(客户,客户,用户)及其与公司项目(广告,商品,电影)之间的互动(点击,购买,评级)的矩阵,你能否建议用户接下来要购买哪些项目?

使用的统计信息:预测建模,潜在变量分析,降维,协作过滤,聚类

6.智能估算

观察:我们有一面横幅,其印象数为100,点击次数为0。

0%可以很好地估算点击率吗?

数据分析师可以结合数据,全局数据和先验知识来获得理想的估计值,告诉你该估计值的属性,并总结该估计值的含义。

使用的统计数据:贝叶斯数据分析

7.用数据讲故事

数据分析师在公司中的角色是充当数据与公司之间的大使。沟通是关键,并且数据分析师必须能够以公司可以使用的方式解释他们的见解,而又不牺牲数据的保真度。

数据分析师不仅简单地总结了数字,还解释了数字为何如此重要以及从中可以得到哪些可行的见解。

数据分析师是公司的讲故事者,负责传达数据的含义及其对公司的重要性。

前六点的成功可以衡量和量化,但是这一点不能。我想说这个角色是最重要的。

使用的统计信息:呈现和交流数据,数据可视化

做数据分析的常用工具有哪些

现在市面上用的软件工具比较多,数据可视化多用Tableau、smartbi、Chart.js、Raw、Datawrapper,当然还有我们最熟悉的Excel了。

当下十分火热的大数据行业因为其数据量巨大的特点,传统的工具已经难以应付,因此需要我们开发并使用更为先进的现代化工具来提高工作效率。那么数据分析常用的工具都有哪些呢?

Tableau Public是现在用的比较多的一种可视化工具。它不仅支持各种图表、图形、地图还有其他图形,制作出来的图表可以轻易地嵌入其他网页中。而且上手很容易,对新手友好,就是需要付费。

PowerBi作为微软最新的商业智能概念,功能十分强大。其核心理念就是不需要用户掌握强大的技术能力,就可以简单上手商业数据分析的可视化。

SmartBi作为一个成熟的大数据分析平台,具备可复用、动静结合的独特展示效果,可以使得数据可视化的展示效果更加的强大,给使用者提供了更大的应用能力和想象空间。

Chart.js就比较适合小型项目,可以使用HTML 5 canvas元素绘制图表,可以创建响应式平面设计。

在数据库里面,关系型数据库是目前最受欢迎的数据库管理系统,技术比较成熟,而常见的关系型数据库有Mysql、SQL Server、Oracle、Sybase、DB2等。

SQL Server是一种可扩展的、高性能的、为分布式客户机/服务器计算所设计的数据库管理系统,有机结合了WindowsNT,提供了基于事务的企业级信息管理系统方案。

SPSS是一款非常著名的数据统计分析管理软件,也是世界上最早采用图形菜单驱动界面的统计软件,其最突出的特点就是操作界面极其的友好,输出结果也很美观。用户只要掌握一定的Windows操作技能,同时精通统计分析原理,就可以使用该软件为特定的科研工作服务。

SAS是一个模块化、集成化的大型应用软件系统,是SAS把数据存取、管理、分析和数据展现有机结合。它由数十个专用模块构成,功能包括数据访问、应用开发、报告编制、计量经济学与预测、数据储存及管理、图形处理、数据分析、运筹学方法等等。主要完成以数据为中心的四大任务——数据访问、数据管理、数据呈现、数据分析。

Power Query是负责抓取和整理数据的,可以抓取几乎市面上所有格式的源数据,然后再按照我们需要的格式整理出来。通过Power Query我们可以快速将多个数据源的数据合并、追加到一起,任意组合数据、将数据进行分组、透视等整理操作。

以上的工具都是比较常用且好用的,希望各位数据分析师们都能够好好利用起来~~~

不会成本管理,老板怎敢聘你做数据分析师?

2020年由于疫情的影响,企业纷纷开始缩减经营成本,不少人因此下岗、失业。企业成本管理是以企业的全局为对象,根据企业总体的发展战略而制定的。而企业成本管理的首要任务是需要数据分析部门来关注企业成本的战略空间、过程和业绩,将诚本信息贯穿于战略管理整个循环过程之中。数据分析部门通过对公司成本结构和成本行为的全面了解,从而加以控制与改善,寻求长久的竞争优势,把企业内部结构和外部环境综合起来!

作为数据分析师最关心的当然是数据了。那不同的企业是如何使用企业的成本数据呢?从决定预算开始,到决定价格,再到决定工作人员。这属于计划阶段。执行阶段包括增加或减少产品线、竞价进货、协商销售价格。评估阶段包括计算成本变化程度和分析成本失控的原因。报告阶段包括报告正式运营的活动、报告库存成本、报告产品的绩效。不同行业的企业对于成本数据的用法不一样,拿制造业、零售业和服务业来讲,企业管理层关心的成本信息是不同的,但是使用成本评估经营历史和估算未来的盈利,为产品或服务定价,以及促销的降价幅度,为库存和制作完成的产品核定价值这是共同需要关注的重点。

成本都有哪些呢?我们可以从可追溯性、行为、价值创造、财务分类这几个方面去进行分类。从可追溯性可分为直接成本和间接成本,从行为可以分为变动成本和固定成本,从价值创造可以分为价值创造、非价值创造,从财务分类可分为产品成本和时间成本。

例如,从行为成本分析来说,固定成本指的是无论经营顺利开展都必须付出的成本,比如房租、工资、水电、保险、固定资产折旧、资金拆借利息等等。变动成本是指在经营过程中随着经营业绩的变化而变化的成本,如购货成本、物流、营销宣传、维修、设备维护、交通等。

从不同的成本数据出发进行分析,是一个企业的数据分析部门重要工作之一,帮助企业进行更高效的成本管理,进行定价分析等,提高企业经营回报。

SWOT在数据分析中如何应用?

SWOT分析法即强弱危及综合分析法,也称TOWS分析法、态势分析法、道斯矩阵。常用于企业制定战略、分析竞争对手等场合,现在也多用于产品分析和评估产品机会。SWOT是数据分析师必须掌握的一种数据分析方法。

在SWOT中,S(strengths)是优势、W(weaknesses)是劣势、O(opportunities)是机会、T(threats)是威胁。按照企业竞争战略的完整概念,战略应是一个企业“能够做的”和“可能做的”,即组织的强项与弱项和环境的机会和威胁之间的有机组合。

从某种意义上来说,SWOT分析方法隶属于企业内部分析方法,这就要求企业的数据分析部门根据企业自身的条件在既定的范围内来进行数据分析。著名的竞争战略专家迈克尔·波特提出的竞争理论从产业结构入手对一个企业“可能做的”方面进行了透彻的分析和说明,而能力学派管理学家则运用价值链解构企业的价值创造过程,注重对公司的资源和能力的分析。SWOT分析方法是在此基础上形成的,数据分析师们对其也是不陌生。

SWOT分析法就是在前两者的基础上,以资源学派学者为代表,数据分析师们通常会将公司的内部分析与以能力学派为代表的产业竞争环境的外部分析相结合,从而形成数据分析师自己结构化的平衡系统分析体系。

优劣势分析主要是着眼于企业自身的实力及其与竞争对手的比较,它们是在公司与其发展中自身存在的积极和消极因素,属于主动因素。由企业竞争的角度来看,所谓的优势与劣势即是企业与其竞争者或是潜在竞争者的比较结果,或是某一技术,或是某一产品,亦或是某一服务。企业本身的优势就是竞争对手的劣势,而竞争对手的优势就是本身的劣势,因此优劣势互为表里。

竞争优势可以是以下几个方面:

1、 技术技能优势

2、 有形资产优势

3、 无形资产优势

4、 人力资源优势

5、 组织体系优势

6、 竞争能力优势

可能导致内部劣势的因素有:

1、 缺乏具有竞争意义的技能技术

2、 缺乏有竞争力的有形资产、无形资产、人力资源、组织资产

3、 关键领域里的竞争能力正在丧失

竞争优势是一个企业在商场竞争中超越其竞争对手的能力,当几个企业处于同一市场,

并且它们都有能力向同一顾客群体提供相同或者相类似的产品和服务的时候,我们就可以认为这个企业比另外一个企业更具有市场竞争优势。竞争优势可以指一个企业或其产品有别于甚至高于其竞争对手的任何优越的因素,这些因素主要包括生产的规模、产品的设计、质量、适用性、可靠性、企业形象以及服务质量等等。其中特别要明确企业究竟在哪一个方面具有绝对优势,只有这样,企业才可以扬长避短、避实击虚。

影响企业竞争优势的持续时间,主要包括三个基本因素:

1、 这种优势的建立需要多长时间?

2、 竞争对手做出相应的优势需要多长时间?

3、 企业能够获得的优势有多大?

企业的数据分析师们只有理清了这三个问题,才能明确自己在建立和维持这种优势中

所处的地位。企业的数据分析部门在做优劣势分析师,必须从整个价值链的每个环节上,将企业与竞争对手进行详细的对比数据分析。如产品是否新颖,制造工艺是否复杂,销售渠道是否畅通,价格是否具有竞争性等。

EDA在数据分析中的使用(二)

今天我们重点来讲一下EDA分析在数据分析师手中都是怎么玩出花来的,举一个例子跟大家简单说一下。

本例调查研究了巴西一家大型国际银行的信用卡部门。这家银行发行的大多数信用卡都有年费。

不想支付这些费用的客户可致电银行要求取消或减少费用。在这种情况下,银行客户代表与客户就费用进行谈判。最后,根据客户的背景情况,客户代表可以提供适当的折扣。在折扣谈判过程中,银行客户代表应遵循银行的折扣政策,即,他们不能提供高于其权限的折扣。而在其管辖范围内,在提供客户可接受的最低折扣的同时,银行客户代表也应该优先考虑银行的利益。那这些因素也是数据分析师在数据分析的时候是需要引起重视的。

该银行建议的初始审计范围是识别银行客户代表在年费谈判过程中的哪些危险行为可能导致银行收入损失。数据分析师在进行数据分析的时候需要注意的危险行为包括:

  1、提供高过银行标准的折扣;

2、直接提供客户高折扣而没有努力协商降低折扣率;

3、没有和客户进行过协商就提供折扣。

基于这些危险行为,制定了三个审计目标:

1、所有银行客户代表在提供折扣时均遵守银行政策;

2、银行客户代表提供尽可能低的折扣率以留住客户(保护银行的利益);

3、银行客户代表在提供最后的折扣之前与客户进行过有效协商。

除了这些问题之外,审计范围还扩展到调查发现在设定客户信用卡年费过程中潜在的运营风险,诸如:

1、缺乏有效的内部控制之类的非人为因素也可能导致收入损失;

2、即使某些案例与当前的收入损失没有直接关系,但业务流程风险可能会导致未来的收入损失。

3、为了实现这一审计目标,需要彻底探讨所有相关领域的不规范性。审核员需要了解银行流程,识别此流程中的风险和问题及其内部控制系统。

这个例子使用了两个数据集:

一、客户留存数据集

客户留存数据集里包含了某一个月内拨打的所有客户电话信息,该数据集总共包含195,694系记录。每条记录代表一个客户的电话,包含162个数据字段,这些数据对于数据分析师来说都是非常可贵的。

二、客户帐户主数据集

客户帐户主数据集是n个包含60,309,524条记录和504个字段的大型数据集。每条记录代表一个信用卡帐户,包括了过去30多年在该银行开立的所有账户。帐户主数据中的字段涵盖与账户和帐户持有人相关的各种信息:

1、帐户信息,例如帐户类型和帐户状态;

2、人口统计信息,如帐户持有人的年龄和性别;

3、财务信息,如信用额度和延迟支付金额。

银行客户代表提供的折扣在收入损失分析过程中发挥着重要作用。但是,在原始留存数据集中,没有直接反映折扣的字段。与折扣相关的两个属性变量是原始年费和实际年费。两者的差异代表折扣,这个数字必须在数据分析师进行EDA数据分析之前计算。具体而言,折扣是原始年费与实际年费之间的差额除以原始年费。用于计算折扣的公式如下:

任务一:用EDA探索分析遵守银行政策情况

任务二:用EDA探索分析懒惰的银行客户代表

任务三:探索分析代表是否执行了有效的沟通

具体的解决方法在此就不赘述了,数据分析师在进行数据分析的时候需要多方注意。如果有不清楚的,可以来九道门商业数据分析学院了解更多信息。

EDA在数据分析中的使用(一)

时至今日,虽然大数据分析师这个岗位已然成为2020最火热的岗位之一,但是还有部分小伙伴分不清统计分析和数据分析的区别。传统的统计分析一般是指假设数据符合某种分布,例如正态分布,然后参数估计,再对假设进行检验。贝尔实验室的John Turky在1977年写的《Exploratory Data Analysis》一书中认为作为数据分析从业者应该更多地把重点放在让数据来揭示需要检验的假设上面去。我们常用的EDA就是一种探索性数据分析法,主要探索数据的结构和规律。

探索性分析的目的是揭示数据的形态和性质,对数据的了解始于非常仔细地“观察”数据,所以会使用到可视化的技术,如果采用这种方法首先就要排除任何关于数据的先入为主的概念,对于复杂的统计方法、机器学习、数据挖掘的方法使用比较少。

数据分析师在进行EDA分析时可以简单地分为探索和验证两个阶段。探索阶段强调灵活探索线索和证据,发现隐藏在数据中有价值的信息,而验证阶段侧重于评估证据和相对准确地研究某些具体情况,在验证阶段,主要方法是传统的统计方法。

那EDA数据分析法有什么特点呢?

  首先,让数据在分析中告诉数据分析人员它的特征属性,而不是强调对数据的处理。其次,EDA分析方法是灵活的,而不是坚持传统的统计方法。第三,EDA分析工具简单直观,更加易于推广。

EDA作为你在数据建模分析之前一个相当关键的步骤,它是帮助我们熟悉数据并且探索数据的过程。可以从单一变量和多变量来分析。单变量的探查,或者叫描述性统计分析。它是使用一个单一的数值来代表一个变量的重要特征与属性。常见的关于集中趋势的统计变量有:众数、中位数和平均数。系统化的探查数据变量,是从探查数值的分布开始的,数据分析师寻求一个变量里面数值的分布情况,了解什么是该变量最普遍或典型的数值?每一个数据变量所代表的经营业务的绩效数值与典型的数值之间的区别在哪里?这个变量是否包含了一些极端的数值呢?这个经营业务或者数值是否是平均的分布在一个典型的数值周围?再或者说,这些数值的分布中是否有一些偏向于某些非典型数值的情况?

集中趋势是一个说明同质总体各个体变量值的代表值,其代表性如何,取决于被平均的变量值之间的变异程度。在统计上,把反映现象总体中各个体之间差异程度的指标称为离散程度指标。反映离散程度的指标有绝对数和相对数。

多变量非图形EDA技术通常以交叉制表或统计的形式显示两个或多个变量之间的关系。关联性检验的主要目的是检查两个变量之间是否有关联性,没有关联即是独立。两个类变量之间的关联性分析是基于交叉表来进行卡方检验得出结论的。

在数据分析项目中,因为分析的目的和所要描述的事情不同,有时候要对指标的表现形式进行设计。指标的这种多样化的表现形式能够有效地帮助分析师组织逻辑化的分析故事。除了前面EDA过程中大量使用的平均指标,其他常用的指标表现形式还可以有总量指标和相对指标。数据分析师应该针对不同的项目场景选用最恰当的指标体系进行分析。

窥探数据分析中的市场研究

数字技术的迅速发展,使得传统行业的壁垒正在逐渐的消除,教育、金融服务、制造业、医疗卫生、零售和交通等行业数字化竞争市场已然崛起。在全球进入大数据时代之后,移动互联、大数据、云技术等不断涌现,令市场研究也变得日益便捷。

市场研究在数据分析领域中有一个重要的因素是针对产品的战略制定。产品战略是企业对其所生产与经营的产品进行的全局性谋划,它与市场战略密切相关,两者都是企业经营战略的重要基础。产品战略的制定是否正确,这直接关系企业的胜败兴衰和生死存亡。因此数据分析师需要对市场有一定的了解从而给出成熟的建议。

作为数据分析师,在思考产品战略的时候需要考虑到的元素有:企业资源的审计、现有市场的触达、新兴市场的触达和竞争因素的考虑。企业资源包括有企业的财务优势、原材料获得难易程度、工厂与制造水平、营运效率、管理水平、工程与技术能力、专利与授权。在考虑现有市场的触达方式上可以考虑销售更多现有的产品,在产品质量级别、大小和包装上做差异化,开发新产品来扩展或补充现有的产品线,结束或下线产品。对新兴市场的触达,区域扩展、新顾客群体、现有产品的新用法、补充性产品、收购都是需要数据分析师在数据分析的过程中加以考虑的重要因素。而对于产业的新玩家,产品与顾客的感情,竞争性对手收购这些需要在竞争考虑模块加以思考。

市场竞争环境的不断变化造成企业需要制定实施的夺取或者保持市场领先地位或竞争优势的策略。企业在市场上的竞争地位和可能采取的竞争策略,往往要受到企业所在行业竞争结构的影响。能够影响行业竞争结构的基本因素有行业内部的竞争力量、供货厂商的评议能力、替代产品的压力、顾客的评议能力、潜在竞争对手的威胁。

GE矩阵法又称通用电器公司法、麦肯锡矩阵、九盒矩阵法、行业吸引力矩阵,是美国通用电气公司(GE)于70年代开发的新的投资组合分析方法,是数据分析师在进行数据分析时常用的方法,对企业进行业务选择和定位具有重要的价值和意义。GE矩阵属于“行业吸引力-竞争力”战略分析模型,与波士顿矩阵不同,采用多个因素综合评价,解释市场吸引力与品牌产品市场竞争能力之间的关系。

市场吸引力基于多个吸引力因素,例如市场规模,市场增长,竞争强度。根据重要性对每个指标进行加权计算。市场竞争地位基于多个竞争因素,例如市场份额,产品性能,品牌声誉,根据重要性对每个指标进行加权计算。

数据分析师在对竞争市场进行分析的时候需要考虑到以上的因素,综合分析出适合企业目前发展的战略建议。