想象一下,有一辆公交车平均每30分钟到达一次,你到达公交车站时不知道上一辆公交车何时离开。你会预计要等多久才能等到下一辆车呢?直观地说,30分钟的一半听起来是对的,但如果你只等15分钟,那就非常幸运了。
比如说,有一半的时间公交车是以20分钟的间隔到达,有一半的时间是以40分钟的间隔到达。现在的总体平均时间是30分钟。然而,从你的角度来看,你在40分钟间隔内出现的可能性是20分钟间隔内的两倍。
除了公交车以精确的30分钟间隔到达外,在所有情况下都是如此。随着平均数周围分散度的增加,预期等待时间超过平均等待时间的数量也会增加。这就是“检查悖论”(Inspection Paradox),它指出,每当你“检查”一个过程时,你很可能会发现事情的时间(或持续时间)比其“未检查”的平均时间更长。其实,看似持续的坏运气只是概率和统计学的规律在发挥其自然作用。
一旦意识到这个悖论,它似乎就会出现在所有的地方。
例如,假设你想对一所大学的平均班级规模进行调查。假设这所大学的班级规模为10人或50人,而且每种班级的数量相等,所以总体的平均班级规模是30人。但是在选择一个随机的学生时,他或她来自50人的班级的可能性是10人的5倍。因此,对于每一个回答“10人班级”的学生,将有五个回答“50 人班级”的学生。
因此,你的调查所得出的平均班级规模是接近50人,而不是30人。因此,检查班级规模的行为大大增加了与真实的、未检查的平均数相比得到的平均数。唯一的情况是,当每个班级人数相等时,检查和未检查的平均数才会重合。
还可以在所谓的基于长度的抽样背景下研究同样的悖论。例如,在挖土豆的时候,为什么叉子会穿过很大的那个土豆?为什么在下载最大的文件时,网络连接会中断?这不是因为你生来不走运,而是因为这些结果发生的空间或时间的延伸,比空间或时间的平均延伸更大。
又比如,你在医疗机构排队接受病毒检测。测试的准确度为99%,你的测试结果为阳性。现在,你感染病毒的几率是多少?直观的答案是99%。但这是正确的吗?我们得到的信息涉及在你有病毒的情况下检测出阳性的概率。然而,我们想知道的是,在你检测结果呈阳性的情况下,拥有该病毒的概率。一般的直觉将这两种概率混为一谈,但它们是非常不同的。这是一个逆向或检察官谬误的例子。
测试结果的重要性取决于你在接受测试前感染病毒的概率,这被称为先验概率。从本质上讲,我们在病毒的罕见程度(基本率)和测试出错的罕见程度之间存在竞争。
假设根据当地的流行率,有1/100的机会,你在接受测试之前就已经感染了病毒。现在,请记住,测试有100分之一的错误。这两个概率是相等的,因此,尽管测试的准确率为99%,但当测试呈阳性时,你有病毒的概率为2分之1。
但是,如果你在接受检测之前就出现了病毒的症状怎么办?在这种情况下,我们应该将先验概率更新为高于受检人群的流行率。当你检测结果呈阳性时,你感染病毒的机会就会相应增加。我们可以使用贝叶斯定理(Bayes’ Theorem)来进行计算。
总之,直觉常常让我们失望。尽管如此,通过应用概率和统计方法,我们可以无视直觉。 我们甚至可以解决许多人认为最大的谜团——为什么似乎经常发现自己被困在较慢的车道或队列中。直觉上,我们生来就倒霉。当直觉失效时,可以利用概率和统计学来寻找真正的答案。
前瞻经济学人APP资讯组
本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com)