浅谈:数据分析工作技能的深度与广度

发布时间: 2020-08-22

当你开始学习基础数据分析之后,你会去哪里?您已经使用Python或R进行了一些探索性的数据分析,还学了一些建模和机器学习。您甚至可以使用R、PythonSQL、Unix和其他软件的组合来构建数据流水线。问题是——你下一步要去哪里?

问5个数据分析家,你会得到6个意见,在知乎、悟空问答这些地方问这个问题,可能会得到更多不同的意见,你会想“哪些意见会对我有用?”。你可能不是去思考下一步要做什么,而是打开了20多个选项卡,添加了6个书签,添加了几个GitHub库,并尝试学习多个项目思想。

这是为什么呢?为什么下一步这么难做?而且,对你的数据分析求职来说,最重要的是——这和找工作有什么关系?

数据分析工作的深度与广度

如果你看一下数据分析的招聘启事,通常会有10-30个“关键词”被列为与该职位直接相关的。它们的范围从Excel到Hadoop,甚至可能是特定类型的算法或研究领域。雇主想让数据分析家熟悉什么工具?我们在30个招聘广告中看到了38种完全不同的技术,这通常是招聘广告引起焦虑的一部分原因。

所有这些工具的揭示了数据分析工作的“广度”,可以想象,“广度”数据分析工作要求你熟悉的工具比“深度”数据分析工作多得多。

接下来要去哪里以及接下来要学习什么,这取决于向你提供建议的是什么类型的数据分析家——是“深度”的,还是“广度”的。此外,他们的观点会随着他们对工具的选择而发生变化。

宽度数据分析工作技能:

最近在Reddit上,一位评论者建议,如果有人想知道下一步该怎么做,可以这样做:

1.学习Python来抓取网站

2.学习SQL获取数据并将其存储在数据库中

3.学习PostgreSQL以最佳地存储该数据

4.学习Unix/Linux命令行工具来运行cron作业

5.学习Python数据处理包(panda、Scikit-learn等)

6. 学习Flask、Bottle或Django将数据库分析打包成RESTful API

7.学习如何在云上部署应用程序

8.学习使用AngularJS并呈现结果

9.学习D3.js创建可视化

似乎需要学习很多东西:不同的技术、方法、知识库和平台。这不仅包括完整的数据流水线,还包括数据洞察的表达方式,这个学习路线图听起来足够让您成为一名数据工程师、数据分析家、后端Web开发人员、前端Web开发人员和数据可视化人员。

然而,在某些数据分析工作和团队中,这将是您的责任,并且完全在您的掌握之中。所以所有这些对于你的数据分析工作技能来说都是100%重要的。

深度数据分析工作技能

同样在最近的Reddit上,一位评论者建议:

1.学习统计学

2.阅读Agresti的《分类数据分析简介》

3.阅读Hastie & Tibshirani的《统计学习导论》

4.阅读Hastie & Tibshirani的《统计学习的要素》

5.阅读Bishop的《模式识别与机器学习》

6.阅读Murphy的《机器学习:概率视角》

7.阅读Koller的《概率图形模型:原理和技术》

你将学习大量机器学习和数据分析技术背后的统计、数学和算法。评论者进一步建议完成书中所有练习,以及构建自己版本的算法。这个学习路线图听起来好像足够做博士水平的工作。

是的,在某些数据分析工作和团队中,这将是您所期望的基本知识,并且在您的掌握范围之内。所以所有这些对于你的数据分析工作技能来说都是100%重要的。

独角兽并不存在

这就是为什么“数据分析家”有时被称为“独角兽”。因为拥有“深度工作”所需的“深度”和“广度工作”所需的“广度”的人少之又少。因此,独角兽并不存在。这有好有坏。但很糟糕的是,公司确实需要这两种类型的数据分析家,而且他们常常花费太多的时间和精力去寻找合适的人,而不是雇佣两个人——一个“宽度”和一个“深度”。当公司意识到他们需要的是团队而不是单个的独角兽时,他们会雇佣更多的人,雇佣拥有正确技能、正确背景和正确期望的正确的人。

回到问题上——你下一步要去哪里?

选择的权利完全属于你。看看上面的两个列表,然后判断哪个听起来更吸引你。如果算法、统计模型和机器学习让你兴奋不已,那么“深度”选项列表就是你的选择。如果您对“广度”选项列表的可能性感到兴奋,那么这就是正确的方法。重要的是,在寻找数据分析工作时,没有错误的答案,你所要做的就是拥有它,并对自己的选择感到满意。公司目前正在招聘各种类型的数据分析家——所以你越早做出选择和决定,你就越容易找到工作。你对那个列表更感兴趣,这将是关于你成长为一名数据分析家的旅程中下一步应该做什么的答案。最后,别忘了你可以改变主意。如果过了一段时间,你想从其他列表中学习一些技能——继续,你可能会成为那些神秘的独角兽之一!

发表评论

您的电子邮箱地址不会被公开。