懂贝叶斯定理,学会理解生活

我们都听过一句俗语,叫做“好人不长命,祸害遗千年”。每当遇到什么天灾人祸,老人们就爱说这话,就像遇到

我们都听过一句俗语,叫做“好人不长命,祸害遗千年”。每当遇到什么天灾人祸,老人们就爱说这话,就像遇到车祸的人,大多数是好人,然而车子真的会选人来撞吗?

显然是不可能的。在这件事情上,我们大多数人都犯了谬误,忘记了一个客观的情况:坏人只占这世界上的一小部分,绝大多数人都是好人,所以车祸中受伤害的自然是好人多了。我们在理解生活中一些问题时,经常会忘记一些事情的先决条件。

除此之外,在更多的情况下,我们甚至根本不知道这些先决条件(信息),这不光会影响我们对事物的理解,还会影响我们做出任何决定。

此时,你一定在想有没有什么方法,能让我们更好地“摸着石头过河”?

没错,答案就是题目中的贝叶斯定理。高中的读者在概率的部分应该会学习到它。当然,没有听说过也不要紧,在下面的文章中,会有关于它的解释。就是这样的一个数学定理,能让我们更好地做出决定,更好地理解事物。

接下来,就让我们一起来了解一下这个定理,以及它如何能让我们的生活变得更好吧!

贝叶斯定理

要理解贝叶斯定理,我们先来看一个“对方到底喜不喜欢你?”的例子。李雷经常单独找韩梅梅聊天,而韩梅梅想知道李雷是不是喜欢自己。在这里,李雷喜欢韩梅梅是事件A,而李雷经常和韩梅梅聊天是事件B。

在这里,我们先认识一些数学符号,P(A)表示A发生的概率,P(B|A)表示在A发生的条件下,B发生的概率,P(A∩B)则表示A和B两事件都发生的概率,其他同理。

根据条件概率的定义,在事件 B 发生的条件下事件 A 发生的概率为:

同样地,在事件 A 发生的条件下事件 B 发生的概率为:

通过P(A∩B),我们可以得到:P(A)×P(B|A)=P(B)×P(A|B),进行简单的变换,就可以得到著名的贝叶斯定理了:

以上是我们得到最基本的贝叶斯公式的推导过程。在贝叶斯定理中,A是你要考察的目标事件(如喜不喜欢韩梅梅),P(A)是在没有其他任何信息帮助下,这个目标事件的概率,被称为初始概率。公式左边P(A|B)是指当发生B事件(如单独聊天)后,我们得到的新的观察,被称为后验概率,也就是我们最终寻求的事件概率。

在现实生活中,我们大脑决策的过程就是应用贝叶斯定理的过程。我们的手中只有有限的信息,而决策就是要利用有限的信息,尽量做出一个最优的预测。正如法国著名的天文学家和数学家皮埃尔·西蒙·拉普拉斯所说的一样:“人生最重要的问题,在绝大多数情况下,真的就只是概率问题。”

概率是个主观值,完全就是我们自己的判断,我们可以先估计一个初始概率 ,然后每次根据出现的新情况,掌握的新信息,对这个初始概率进行修正,随着信息的增多,慢慢逼近真实的概率。这个方法完美的解决了信息少的问题,我们不用等样本累积到一定程度,先猜一个就行动起来了。

让我们回到李雷和韩梅梅身上。韩梅梅如何推测李雷喜欢自己的概率呢?首先,韩梅梅只能主观想出一个初始概率,在没发生B(李雷单独找韩梅梅聊天)之前,韩梅梅推测李雷喜欢自己的概率很低,只有5%(P(A))。

假设如果一个人喜欢另一个人,那么他经常找对方聊天的概率是80%;一个人不喜欢另外一个人,他经常找对方聊天的概率只有20%。即P(B|A)=0.8,P(B|非A)=0.2。

注意经常找对方单独聊天的情况存在两种:喜欢并单独聊天或不喜欢也单独聊天,因此P(B)=P(B|A)×P(A)+P(B|非A)×P(非A)=0.8×0.05+0.2×0.95=0.23。

在李雷喜欢找韩梅梅聊天的情况下,李雷喜欢韩梅梅的概率涨到了:P(A|B)=P(A)×P(B|A)/0.23=0.05×0.8÷0.23=17.4%。

如果随着韩梅梅后来的观察,她又发现了别的“蛛丝马迹”,如李雷经常偷看自己,那么利用贝叶斯定理,李雷喜欢韩梅梅的概率肯定还会进一步上升。

别忘了先决条件

或许有人会说,这不就是常识嘛,新情况(信息)和自己原来预期得一致,就强化原来的看法,否则就弱化,用得着弄这么复杂吗?

的确,人脑思维的方式和贝叶斯定理是一致的。但是我们的大脑有一种证实倾向,即我们往往会高估了新情况的作用,但是贝叶斯定理不会,它会纠正我们的认知偏差。

我们再举一个贝叶斯定理的经典例子。现在的医药检测手段越来越先进,某种罕见病检测结果的准确度为99%。如果小张去医院做检查,检测结果为阳性,那么小张真的得病了的概率是多少呢?

如果缺少贝叶斯思维,你肯定会想当然地说出来,不是99%吗?可是你别忘了,该疾病是一种罕见病。

我们使用贝叶斯定理,A表示“真的患病”,B表示“检测呈阳性”。根据现有条件,P(B|A)=99%,P(B|非A)=1%。假设一般人群中罕见病患者的比例为0.5%,即P(A)=0.005。代入公式:

尽管检测的准确度高达99%,但贝叶斯定理告诉我们,哪怕这个人真的被检测到阳性,他真的患病的可能性也只有33%左右,没有患病的可能性比较大。在医学中,没病,但是检测结果显示有病的情况称为假阳性。一般,像艾滋病等罕见疾病检测第一次呈阳性的人,还需要做第二次检测,第二次依然为阳性的还需做第三次检测。

同样地,我们也可以从中得到一些启示,贝叶斯定理可不仅仅是计算,更是一种思考方式。

首先,初始概率其实很重要,初始概率越准确,得到真实的概率就越快速、越容易。

其次,我们在生活中,遇到一些问题,不应该反应过度,因为事情可能并没有我们想象得那么糟。在思考时,不要忘记将客观情况考虑在内。

再次,我们要充分重视突然出现的特殊情况。在例子中,我们已经看到了,千分之几概率的事情,因为特殊情况出现,概率一下子就提高了60多倍。因此,每当出现特殊、罕见情况的时候,我们要保持高度警惕,当然,这也要结合检测精度来考虑。

最后就是一定要先行动起来,大胆假设,小心求证,不断调整自己的看法。当信息不完全时,我们要先做一个预判,先行动起来,而不是干等着,白白错过时机。

除了对我们生活的指导,贝叶斯定理在基因分析,预测基因变化的概率方面也有非常重要的应用。教育学家也发现,孩子学习的过程也是一个贝叶斯预测的过程。股票市场、期货市场、垃圾邮件过滤和人工智能等也会用到贝叶斯定理,感兴趣的小伙伴可以多多了解一下。

打开APP阅读更多精彩内容