如何像数据分析师一样思考?

如何像数据分析师一样思考?

我写这篇文章是为了帮助有抱负的数据分析师掌握正确的心态,帮助他们开始像数据分析师一样思考。

这个答案还包括七个挑战,这些挑战帮助你发展出像数据分析师一样思考的能力。

(1) 通过数据满足你的好奇心

作为一名数据分析师,你写自己的问题和答案。数据分析师自然对他们正在查看的数据感到好奇,并创造性地探索和解决任何需要解决的问题。

大部分数据分析不是分析本身,而是发现一个有趣的问题并找出如何回答它。

以下是使用公共数据集的两个很好的例子:

希拉里:美国历史上毒性最大的婴儿名字

查看火灾响应数据

挑战:想想你感兴趣的问题或话题,并用数据来回答!

(2) 持怀疑态度地阅读新闻

数据分析师的大部分贡献(以及为什么用机器取代数据分析师真的很难)是,数据分析师会告诉你什么是重要,什么是虚假的。这种持续的怀疑论在所有科学中都是健康的,特别是在快节奏的环境中,很容易被误解虚假的结果。

你可以通过批判性地阅读新闻来接受这种心态。许多新闻文章都有内在缺陷的主要前提。试试这两篇文章。示例答案可在评论中找到。

更容易:你喜欢你的 iPhone。名副其实。

哈德:谁预测到俄罗斯的军事干预?

挑战:每天当你遇到一篇新闻文章时,都要这样做。评论这篇文章,并指出缺点。

(3) 将数据视为改善消费品的工具

访问消费互联网产品(可能你知道还没有进行广泛的 A/B 测试),然后想想它们的主要漏斗。他们有结账漏斗吗?他们有注册漏斗吗?他们有阳刚之气的机制吗?他们有订婚漏斗吗?

多次浏览漏斗,并假设它可以通过不同方式更好地增加核心指标(转换率、股票、注册等)。设计一个实验,以验证您建议的更改是否真的可以更改核心指标。

挑战:与消费者互联网网站的反馈电子邮件共享!

(4) 像贝叶斯人一样思考

要像贝叶斯人一样思考,请避免碱度谬误。这意味着要形成新的信念,你必须既包括新观察到的信息,也包括通过直觉和经验形成的事先信息。

在检查仪表板时,用户参与数字今天显著下降。以下哪项最有可能?

1.用户突然少参与

2.网站功能崩溃了

3.记录功能中断

尽管第 1 号的解释完全解释了下降的可能性,但第 2 号和 3 号应该更有可能,因为它们之前的概率要高得多。

你在特斯拉担任高级管理层,特斯拉的 S 型公司有五人在过去五个月中起火了。哪个更有可能?

1.制造业质量有所下降,特斯拉斯现在应被视为不安全。

2.安全没有改变,特斯拉 S 型车的火灾仍然比汽油车的同类车少得多。

虽然 #1 是一个容易的解释(非常适合媒体报道),但由于您定期进行质量测试,您之前应该对 #2 有很强的影响。然而,你仍然应该寻找可以更新你对 #1 和 #2 的信念的信息(并仍然可以找到改善安全的方法)。思考问题:你应该寻求什么信息?

挑战:确定你上次犯基地利率谬误并尽量避免它。

(5) 了解工具的局限性

“知识知道西红柿是一种水果,智慧不把它放在水果沙拉里。”- 迈尔斯·金顿

知识是知道如何进行普通的线性回归,智慧正在意识到它在实践中是多么罕见地干净地应用。

知识正在了解 K 均值聚类的五种不同变体,智慧正在意识到实际数据如何很少能被干净地聚类,获得具有许多特征的良好结果有多困难。

知识是知道各种各样的尖端技术,但智慧能够选择在合理时间内为公司提供最大影响的技术。

在完成 Coursera 或 EdX 课程时,您可以开发大量工具,但在您知道使用哪些工具之前,工具箱没有用。

挑战:将几个工具应用于真实数据集,并发现每个工具的权衡和局限性。哪些工具效果最好,你能弄清楚为什么吗?

(6) 教导一个复杂的概念

理查德·费曼如何区分他理解哪些概念和不理解哪些概念?

费曼是一位真正伟大的老师。他为自己能够设计出方法来解释甚至最深刻的初学者的想法而自豪。有一次,我对他说:“迪克,向我解释一下,这样我就能理解,为什么旋转一半的粒子服从费米-狄拉克统计。”费曼把他的听众打得一清二,他说:“我会准备一场关于它的新生讲座。”但几天后他回来说:“我做不到。我无法将其降低到大一水平。这意味着我们并不真正理解它。”-大卫·L。古德斯坦,费曼迷失的讲座:行星绕太阳而动

理查德·费曼的杰出是他将复杂概念提炼成可理解想法的能力。同样,顶尖数据分析师的区别在于他们能够说服自己的想法并解释他们的分析。

查看陈德温对这些问题的回答,以了解令人作风解的技术概念示例:

Netflix 奖有顶级模特摘要吗?顶级团队最终用于合奏学习的获胜模型背后的高层次和直观想法是什么?

对 Latent Dirichlet Allocation 有什么很好的解释?

什么是最小的角回归?什么时候应该使用?

挑战:向朋友或公共论坛上(如 Quora 或 YouTube)教授技术概念。

(7) 说服别人重要的事情

也许比数据分析师解释其分析的能力更重要的是他们传达可操作洞察力的价值和潜在影响的能力。

随着数据分析工具越来越好,数据分析的某些任务将实现商品化。新工具将使某些任务过时,如编写仪表板、不必要的数据扭动,甚至特定类型的预测建模。

然而,数据分析师提取和交流重要内容的必要性永远不会过时。随着数据量和潜在洞察力的增加,公司总是需要数据分析师(或从事数据分析类角色的人)来修剪所有可以做的事情,并根据影响确定任务的优先顺序。

数据分析师在公司中的作用是担任数据和公司之间的大使。衡量数据分析师成功与否的标准是他/她能讲故事和产生影响的程度。这种能力放大了所有其他技能。

挑战:用统计数据讲故事。在数据集中传达重要结果。做一个观众关心的令人信服的演讲。

如果你有兴趣成为一名数据分析师,可以了解九道门商业数据分析学院的项目实训课程,希望会对你有帮助。

发表评论

您的电子邮箱地址不会被公开。