如何用数据讲出色的数据分析故事

发布时间: 2020-09-05

数据分析成为未来职业的发展趋势,无论什么岗位都需要拥有数据分析的能力,因此数据分析培训学习成为了潮流,学数据分析的人越来越多,学习的过程中遇到的问题也很多,专业的答疑,是职业生涯最重要的一环。那么,结果做出来后,如何用数据给决策者讲出出色的数据分析故事,这也是有一定技巧的。

爱德华·塔夫特(Edward Tufte)认为,出色数据分析师可以用可视化表示“以清晰,准确和高效的方式传达的复杂想法”。我还要补充说,出色的可视化效果还可以通过统计信息的图形化描述来讲述一个数据分析故事。正如我在之前的文章中所讨论的那样,可视化在其教育或确认角色中确实是一种动态的说服形式。很少有形式的交流能像令人信服的叙述一样具有说服力。为此,可视化需要向听众讲一个故事。讲故事有助于观看者从数据中获得洞察力。(举一个很好的例子,您认为类固醇对棒球有多大影响?)

那么视觉设计师如何通过可视化方式讲数据分析故事呢?数据分析必须找到数据支持的故事。传统新闻一直在这样做,而新闻记者已经非常擅长通过信息图表可视化讲故事。有鉴于此,这里有一些讲故事的新闻策略也适用于数据可视化

1.找到引人入胜的叙述。除了说明事实并建立事实之间的联系之外,别无聊。您正在争夺观众的时间和注意力,因此请确保叙述具有钩子,动量或迷人的目的。找到叙事结构将帮助您决定是否确实有故事要讲。如果您不这样做,那么这种可视化也许应该支持探索性数据分析(EDA),而不是传达信息。但是,对于探索性可视化的设计者而言,激发观众的想象力以鼓励检查数据之间的关系并促进与数据的交互仍然很重要-考虑游戏化。

2.想想你的听众。观众对这个话题了解什么?是给决策者,一般利益相关方还是其他人使用?可视化需要围绕受众已经掌握的正确和不正确的信息级别进行构架:

(1)新手:第一次接触主题,但不想过分简化

(2)通才:知道该主题,但正在寻求概述理解和主要主题

(3)管理:对复杂性和相互关系的深入,可行的理解,并能获取详细信息

(4)专家:更多的探索和发现,更少的故事讲述

(5)行政人员:只有时间来收集加权概率的意义和结论

3.要客观,提供平衡。可视化应该没有偏见。即使争论影响,它也应该基于数据的内容,而不是您想要的内容。Tufte发现了许多图表,这些图表误导了观众有关基础数据的知识,并创建了一个公式来量化这种误导性的图形,称为“ 谎言因素”。说谎因子等于图中所示效果的大小除以数据中效果的大小。有时它是无意的-如果以3D表示,则该数字是另一个数字的三倍,将被感知为大九倍。有一些简单的方法可以提高客观性:避免歧义的标签,使图形尺寸与数据尺寸匹配,使用标准化单位以及防止设计元素损害数据。平衡可以来自同一可视化中数据的替代表示(多个聚类;置信区间而不是线条;更改的时间线;替代调色板和分配;可变缩放)。保持客观性和平衡不是一个微不足道的努力,很容易无意中侵犯。观众和决策者最终都会发现不一致之处,无论故事多么出色,反过来都会导致设计师失去信任和信誉。

4.不要审查。不要对包含或排除的数据保持选择性,除非您有信心将数据“说”的内容最好地呈现给听众。这种选择性包括在数据连续时使用离散值。您如何处理缺失值,离群值和超出范围的值;任意时间范围;上限值,数量,范围和间隔。观众最终将发现并失去对可视化(以及您可能产生的任何其他可视化)的信任。

5.最后,编辑,编辑,编辑。另外,请务必真正尝试解释数据,而不仅仅是修饰它。当它不是解释数据的最佳方法时,请不要陷入“看起来很酷”的陷阱。正如记者和作家所知道的,如果您花在编辑和改善可视化上的时间多于创建它,则可能是在做正确的事情。

所以,数据分析是一个综合能力要求比较强的职业,但是对技术要求相对又没有那么高的职业,只能通过工具将数据分析结果做出来还是远远不够的,还要会通过数据讲故事,将自己的数据分析结果讲给老板听,并能让他接受,这才是一个真正优秀的数据分析师

发表评论

您的电子邮箱地址不会被公开。