什么是均值回归?

什么是均值回归?

以下是我过去读过、听到或说过的一些事情。你能发现这些陈述有什么问题吗?

  • 一位老师感叹:“当我表扬我的学生做得好时,他们下次尝试时,往往就不那么好了。当我惩罚我的学生做不好的作业时,他们下次尝试时往往会做得更好。因此,惩罚有效,但奖励无效。”
  • 一位有抱负的运动员惊叹道:“哇,昨天我的脚真的很痛,我把它泡在一碗热大蒜水里,现在感觉好多了。那大蒜水里,一定有治愈的功效!”
  • 一位影评人指出:“获得奥斯卡金像奖这一演艺界最负盛名的奖项,只会让演员的事业走下坡路,而不是上升。”

很明显这些陈述句是有问题的,大蒜水不能治愈脚痛!本文通过回归均值的概念解释了为什么这些陈述有问题,并建议你可以采取一些步骤来避免犯这种谬论。

均值回归

让我们看一下这些语句中谈到的事件模式。在所有这些陈述中,事件的发展如下:一个“极端”事件(无论是好的或坏的方向)紧随其后的是一个更典型的事件。

我们经常以这种模式观察事件(极端的、典型的、典型的、极端的……),这是因为一种被称为“回归均值”或“回归平庸”的统计现象。回归均值指的是,在罕见或极端事件之后,可能会出现更典型的事件。随着时间的推移,结果会“回归”到平均水平。

这个说法是由 Sir Francis Galton提出的,他注意到高个子父母的孩子往往比他们矮,而矮个子父母的孩子往往比他们高。图形,这意味着,如果我们把父母的高度在x轴和轴上的身高的孩子和画一条线的所有数据点,我们得到一条线的斜率小于1(或相当于一个角度小于45度)。

这张图表显示,一个比人口中平均男性高的父亲,其儿子的平均身高将比他略矮。一般来说,一个比一般男性矮的父亲会有一个比他略高的儿子。

这个概念不仅有助于观察父母身高与子女身高之间的关系。如果反思自己的经历,很可能会发现这种现象随处可见。例如,回归均值解释了为什么你第二次访问你上次评价如此高的餐厅时未能达到期望。当然,不可能只有你觉得上次的的 某样东西会更好吃!

解释这种现象的统计特征是,连续获得多个极端结果就像硬币多次正面朝上——不寻常且难以重复。使餐厅体验达到最佳状态的各种因素——食物的质量、光顾时餐厅的繁忙程度、服务员的友好程度、当天的心情——很难在第二次完全重复。

谬论

一般的统计规则是,只要两个变量之间的相关性不完美(即在上图中,斜率不是 1),就会回归均值。但是……那又怎样?

回归均值是一个关于世界的统计事实,既容易理解又容易忘记。因为事件的顺序是这样展开的(极端的、典型的、典型的、极端的……),我们的大脑会自动地在“极端”事件和“典型”事件之间画出某种关系。我们(错误地)推断是极端事件导致了典型事件(例如,奥斯卡获奖导致了随后的平庸电影),或者这两个事件之间的某些事情导致了典型事件(例如,大蒜水使脚感觉“正常”)。

简而言之,当我们忘记回归均值的作用时,我们最终会将某些结果归因于特定原因(人、先前事件、干预),而实际上这些结果最有可能是偶然造成的。换句话说,即使我们删除了之前出现的“极端”结果,“正常”结果也会发生。

让我们回想一下本文中的前 3 个陈述。回归均值对这些陈述的真实性意味着什么?

老师的错误:

老师的建议是,奖励学生会让他们下次表现得更差。但从均值回归的框架来看,教师对奖惩制度的要求过高。

正如Daniel Kahneman在Thinking, Fast and Slow 中指出的,成功=天赋+运气。这个等式中的“运气”意味着一连串的成功(或失败)是很难重复的,即使一个人有很多天赋(或没有天赋)。

这个等式中的“运气”意味着一连串的成功(或失败)是很难重复的,即使一个人有很多天赋(或没有天赋)。

以两个学生Jane和Joe为例。在第一年,Jane成绩很差,但Joe很出色。Jane的排名是倒数1%,而Jane的排名是前99%。如果他们的结果完全是由天赋决定的,那么就不会出现倒退——Jane在第二年的表现应该一样差,而Joe在第二年的表现应该一样好(在下面的图表中可能是A)。如果他们的结果是运气和天赋,我们希望一半回归:Jane应该上升到25%左右,Joe应该下降到75%左右(B)可能性。如果他们的结果完全是由于运气(如抛一枚硬币),然后2年后我们希望Joe和Jane倒退回到50%(可能性C)。

成功=天赋+运气式的手段,最有可能的情况是某种程度的回归。第一年表现很差的 Jane 在第二年可能会做得更好(无论她是否受到惩罚),而在第一年表现非常出色的 Joe 在第二年可能会做得更差(无论他是否受到惩罚)得到奖励)。老师的惩罚和奖励制度可能没有她想象的那么好。

运动员的错误:

这位运动员暗示大蒜水治愈了她痛苦的脚。假设有一天运动员的脚伤得很厉害。无奈之下,她尝试了一切,包括临睡前的大蒜水。她醒来,发现她的脚感觉好多了。也许水确实有一些治疗作用。但回归均值似乎是一个同样合理的故事。

由于身体疾病有自然的潮起潮落,真正痛苦的一天很可能会伴随着痛苦较少的一天。疼痛如何上升和下降的模式可能使它看起来好像大蒜水是一种有效的治疗方法。但更有可能的是,大蒜水没有做任何事情。由于生物学的自然过程,疼痛无论如何都会消退。

这个例子展示了如何使用回归均值使无效的治疗看起来有效。一个庸医看到他们的病人处于最低点可能会提供一种无效的药物,打赌他们的病人第二天病情会减轻,并推断出药物是起作用的。

影评人的错误:

影评人暗指奥斯卡诅咒,即一旦你赢得了奥斯卡奖,你的下一部电影和表演就不会那么好(甚至可能很糟糕)。几位对演员的采访表明,他们也相信诅咒,称赢得如此着名奖项所带来的压力和期望最终会损害他们的职业生涯。

虽然压力和期望可以解释他们下一部电影的成功(或失败),但“诅咒”也可能在很大程度上是由于回归均值。演员有时真的有很好的表演——好的剧本、好的导演、与其他演员的良好化学反应以及适合这个角色的组合。从统计学上讲,所有这些因素以相同的剂量和相同的方式汇集到他们的下一个电影项目中的几率很低。因此,期待他们的下一场表演比他们获得奥斯卡奖的表演更糟糕似乎很自然。毕竟,“诅咒”并不那么神秘。

回归均值描述了“极端”结果往往跟随更“正常”结果的特征。这是一个既容易理解又容易忘记的统计概念。当我们目睹诸如不太可能的成功或失败之类的“极端”事件时,我们会忘记此类事件是多么罕见。当这些事件之后是更多“正常”事件时,我们试图解释这些“正常”事件发生的原因——我们忘记了这些“正常”事件是……正常的,我们应该期待它们发生。这常常导致我们将因果关系归因于可能在导致“正常”事件中没有发挥作用的人、事件和干预。

为了避免犯这种谬论,当我们试图解释一些(正面或负面)事件或结果时,我们应该首先抓住自己。那么,我们应该问自己以下问题:

  1. 从统计上讲,这个结果是否有任何“异常”,或者这是我应该期待的吗?
  2. 这个事件之前是否有一些“极端”的结果,让“正常”的人相比之下显得“奇怪”?
  3. 即使我们删除了之前的事件,“正常”事件还是会发生吗?” 例如,即使她没有将脚气浸泡在大蒜水中,她的脚也会感觉更好吗?

问题1让我们考虑正常事件发生的可能性。问题2鼓励我们思考彼此之间的关系,而不是孤立的观察结果。问题3促使我们进行反事实思考,想象一个世界,在这个世界里,我们认为造成“正常”事件的实体已经被移除。通过问自己这三个问题,我们不太可能将不必要的权力归因于事件、人员、系统和干预。

作者:Ines Lee

免责声明:凡未注明来源或者来源为网络的信息均转自其它平台,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。网站只负责对文章进行整理、排版、编辑,不承担任何法律责任。若有侵权或异议请联系我们删除,谢谢。

发表评论

您的电子邮箱地址不会被公开。