有个问题是,一枚硬币,扔了一亿次都是正面朝上,扔第一亿零一次的时候,反面朝上的概率是多少?
讲这个问题之前先铺垫一下。
有一个段子:“有一次我在飞机场,前面起飞的一架飞机掉下来了,这时候周围的人都内心很惶恐不敢登机,而我则泰然自若,并告诉他们一个道理,一架飞机掉下来的概率是一千万分之一,那么连续两架飞机掉下来的概率就是一千万分之一乘以一千万分之一,相当于比你平时随便坐飞机出事的概率又小了一千万倍,你们怕什么,这时反而应该更加确信自己安全才对!”
评论区一片叫好。(简直智障......)
小概率事件发生,说明很可能出大问题了!!!
《三体》里的大史说过类似的话:“我多年的刑侦经验让我明白一个道理,邪乎到家必有鬼!”
而我们的老祖宗也早就总结过:事出反常必有妖。
这个段子的误区思维误区,以及对投硬币问题不假思索回答 50% 的人的思维误区是一样的。
那就是: 用理想物理模型来思考复杂现实问题 。
假设飞机起飞、飞行不受任何外界因素影响,连续两架掉下的概率的确是一千万分之一乘以一千万分之一,或者说,乘坐第二架飞机时掉下来的概率仍是很小的一千万分之一。但这是理想物理模型, 而现实中会有各种情况影响来影响结果 ,比如:
这些都是瞎编的,但此时请记住那句话 小概率事件发生,说明很可能出大问题了!!!
在那个时段那个地点,极有可能出现了一个未知的致命问题,才导致出现概率为千万分之一的极小概率事件发生。
此时,在不明真相的情况下,如果仍然去立即起飞下一趟飞机,那么发生事故的概率是很大的!
再举一个生活中有机会体会到的例子。站在路边看一辆辆经过你的车的尾号,通常情况下,应该是单号和双号各 50%,而你却连续看到 100 辆单号。如此小概率的事件发生,说明很可能有一个外界强干扰因素出现,比如你站在北京的路边,今天限单号出行。
同理回到这个投一亿次硬币的问题,一般情况下正反面出现概率各为 50%,而连续一亿次正面是一个极小概率事件,那么很有可能出现了一个未知的巨大干扰因素导致每次都是正面。所以, 第一亿零一次依然是正面的概率是极高的!
如果读者是一个程序员的话,这个例子就很好理解。程序员写的程序出 bug 了,有了反常行为,那么此时,无论程序员把这个程序跑多少遍,都会得出同样的反常结果。那么迁移到丢硬币问题,假设丢硬币这个程序没出问题,但程序连续输出了一亿个正面,这行为太反常了 (违反概率常识),所以这个程序指定哪有毛病。所以,再把丢硬币程序跑一遍,得出来肯定还是一个反常的结果 (正面)。
这不就是程序员 debug 的正常思路么。
或者换个思路,比如说,哪一天女神突然和你表白,很可能你要喜当爹了。。。
看到这里,再想想 祸不单行 这个成语,读者估计能有更深刻的理解。hhhhhhhh
概率论的核心支撑为信息不对称。而理想物理模型是指没有任何外界信息干扰时的概率。而小概率事件的出现,为 出现外界干扰 这一观点提供了支撑,因此理想模型不再适用。
回到抛硬币,如果能准确描述硬币从被抛出,到出现正反面结果这段时间之内的抛掷力度、角度,硬币的重量分布、空气流动等等条件,那么硬币落下来的轨迹,速度,当然包括正反面都是可以预测的,是确定的。
那为什么一般说抛硬币正反面的概率是一半一半呢?
因为一般来说很难掌握影响一个事件的全部信息,即使有了所有信息,我们也无法提供计算结果所需要的算力。所以只能说在什么也不知道 (理想物理模型) 的情况下,说概率才是一半一半。
真正有趣的问题是,在一亿零一次的时候,投出了反面,那么第一亿零二次投出哪一面的概率较大?
先来分析一下这个情况。一亿次正面,第一亿零一次投出了反面,原因无非是这两种:
但很多时候我们无从判断到底是那个因素影响了第一亿零一次的结果。所以,此时最好假设两种原因出现的概率是各 50%。因为我们现在除了第一亿零一次的结果之外,什么都不知道,只能按理想物理模型处理。
现在做一个加权处理:
原因 1 出现的概率 * 原因 1 下事件 a 的概率 + 原因 2 出现的概率 * 原因 2 下事件 a 的概率
- 出现正面的概率: 50% * 50% + 50% * 0 = 25%
- 出现反面的概率: 50% * 50% + 50% * 100% = 75%
所以第一亿零二次出现反面的概率比较大。
如果读者是这么分析的,那么就又出现 用理想物理模型来思考复杂现实问题 的情况了。
(如果这问题是个脑筋急转弯,这么分析倒也没毛病)
但我们现在讨论的是一个现实世界中的问题,一个离谱的,发生在现实世界的问题。我们对于导致第一亿零一次投出反面的原因的分析没有问题,但我们对原因出现的概率的判断,很有问题。
当第一亿零一次出现反面的结果时,应该停止空想,去调查,去走访,弄清到底是这两个因素中的哪个导致了第一亿零一次的结果,才有可能在现实世界中有理有据地对第一亿零二次的结果进行预判。