引言
从日常生活的简单决策,比如选择午餐吃什么,到复杂的问题,如科学家预测疾病的传播,我们都在使用概率来指导我们的行动。而在这其中,有一种概率理论不仅在数学和统计学中占有举足轻重的地位,更在决策过程中发挥了作用,这就是贝叶斯定理。然而,与它在我们生活中的重要性相比,大多数人对它了解的程度却并不深。
我对贝叶斯定理的喜欢,源自于它的简洁性,优雅性,以及其在面对不确定性时的巨大威力。它指导我们解决一个问题:我们应该如何改变我们的观点来面对新的数据或信息?
在这篇博文中,我希望带你一起探索贝叶斯定理的魅力,理解它的工作原理,以及我们如何应用它来更好地理解和处理世界。无论你是在寻找一种更好的决策方法,还是想要深化对数学的理解,我相信贝叶斯定理都会为你带来新的视角和洞见。
贝叶斯定理的历史
面对贝叶斯定理的威力和优雅,你可能会想知道,它是如何被发现和发展的。这个定理的名字来源于18世纪的英国数学家托马斯·贝叶斯,他还是一位虔诚的牧师。
托马斯·贝叶斯出生于1701年,与牛顿同时代。他不仅是一位传教士,还是一位业余数学家,在暇余时间里,细心研究并思考数学问题。也正是在这样的背景中,推导出了这个伟大的条件概率公式——贝叶斯定理。据说他是为了反驳对上帝存在的质疑而推导出贝叶斯定理。
值得一提的是,贝叶斯定理在首次提出后,并未受到广泛的重视。长时间范围内,它并没有获得主流的认可,甚至受到统计学界的排斥。尽管历史的表面看起来并不被看好,贝叶斯定理的重要性却在逐渐显现。直到1950年代,”贝叶斯”这个术语才开始被使用,以此纪念托马斯·贝叶斯为条件概率作出的贡献。这一时期也标志着贝叶斯定理的重要性开始被广泛认知,尽管其广泛的解释和应用,仍在不断的探索和发展中。
贝叶斯定理的基本概念
在探讨贝叶斯定理之前,需要了解四个主要概念:先验概率、后验概率、似然、全概率。
- 先验概率:这是在尚未获取新的数据之前,我们对一件事情发生的原始判断。以投掷一枚正面和反面均等可能出现的硬币为例,未投掷前我们对硬币在一次投掷中翻成正面的预判为0.5。
- 后验概率:这是在获取新的数据之后,我们对一件事情发生可能性的更新判断。比如,如果我们投掷了10次硬币,结果有7次正面,我们可能会稍微调整我们的预判,认为硬币翻成正面的概率略高于0.5。
- 似然:这给出了在给定某个假设下,观察到目前的数据的概率。在硬币例子中,假设硬币是均匀的(即,正面和反面的概率都是0.5),那这个假设下观察到7次正面出现的概率就是似然。
- 全概率:这是所有可能情况下的概率之和。在硬币的例子中,所有可能性,即硬币翻到正面和硬币翻到反面的概率总和是1。
贝叶斯定理本质上是一个更新信念的规则。它告诉我们,在得到新的数据后,我们应该如何适当地调整我们对相应事件发生概率的预测。一方面,如果新的数据支持我们的假设,我们就应该增加对应假设的信念;另一方面,如果新的数据不支持我们的假设,我们就应该降低对这个假设的信念。
贝叶斯定理的公式和推导
表达式
贝叶斯定理的数学表达:
$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$
P(A|B) 是表示在给定 B 的前提下 A 发生的概率,这就是我们所说的“后验概率”, 因为它是在事件 B 已经发生的情况下,我们对事件 A 发生概率的重新评估。
P(B|A) 则是表示在给定A的前提下B发生的概率,也就是我们前面提到的“似然”,因为它表示了在已知事件 A 发生的情况下,事件 B 发生的可能性。
P(A) 代表的就是A发生的“先验概率”, 就是在不知道B事件的前提下,我们对A事件概率的一个主观判断 。这是在考虑任何其他因素之前,我们对事件 A 发生可能性的初始估计。
P(B) 代表的是B发生的全概率,即在考虑任何特定条件的情况下,事件 B 发生的总体可能性。这包括所有可能导致事件 B 发生的情况,无论是否与事件 A 有关。
每个概念的阐述如此,再看一遍贝叶斯公式,就能明白这个公式背后的关键思想了:
我们先根据以往的经验预估一个”先验概率”P(A),然后加入新的信息(实验结果B),这样有了新的信息后,我们对事件A的预测就更加准确。
推导
接下来,我们来看看贝叶斯定理是如何从概率论的基本原理推导出来的。
先从条件概率的定义开始,
$$
P(A|B) = P(A,B)/P(B)
$$
这里的 P(A,B)是A和B同时发生的概率。利用乘法法则,我们可以写出 P(A,B)=P(B|A)P(A),这是因为我们可以把A和B同时发生的事件看作是先发生A这个事件,然后在给定A发生的条件下再发生B这个事件。
把上述两步结合便可以得到最终公式
全概率公式
$$
P(A) = P(A|B_1)P(B_1) + P(A|B_2)P(B_2) + P(A|B_3)P(B_3) + …
$$
这个公式的含义是,事件 A 的概率可以通过考虑在每个可能情况下,事件 A 发生的条件概率乘以该情况发生的概率,然后将所有情况的结果相加而得到。换句话说,它告诉我们如何将一个事件的概率拆分成多个不同情况下的概率之和。
知道这些后,接下来就是具体案例去感受贝叶斯定理了~
贝叶斯定理的应用
在现实生活中,我们很少能够拥有完整的信息来做出决策,我们必须学会在信息有限的情况下进行预测和决策。这就需要我们依靠我们已有的信息和经验,以及一定的推理能力来做出尽可能明智的选择。这也是为什么在面对未知情况时,常常需要依靠直觉和经验来做出判断。
无论是在医学、商业、市场预测,还是在电子邮件过滤等领域,贝叶斯定理都有着广泛的应用。在医疗领域,医生们依赖贝叶斯定理诊断疾病,结合患者的症状,精确判断患者是否真正患病,有效控制假阳性的可能性。在商业区块,企业则运用贝叶斯定理进行全面的员工或者合作伙伴资质评估,通过应聘者的面试表现、历史经验等信息,合理预估应聘者在公司的表现。在市场预测上,市场研究人员可以借助贝叶斯定理来预测产品或服务的市场需求,这些预测可以基于已收集的用户反馈数据,以帮助公司做出更准确的决策。贝叶斯定理在电子邮件过滤方面也发挥了重要作用。通过贝叶斯定理,我们能判断接收到的邮件是否为垃圾邮件,比如,邮件中的“免费”等关键词可能会提高其被标记为垃圾邮件的概率。这样一来,电子邮件的自动分类与过滤也就实现了。
医学检测中的贝叶斯
医学领域中的诊断和检测往往涉及到不同程度的不确定性,其中包括假阳性率和假阴性率等因素。接下来将探讨一种医学检测的案例,以展示贝叶斯定理在解决此类问题中的卓越功效。
案例背景:
考虑一种疾病的医学检测,该检测具有一定的假阳性率(False Positive Rate)和假阴性率(False Negative Rate)。假阳性率是指在没有患病的情况下,测试结果显示为阳性的概率;假阴性率则是指在患病的情况下,测试结果显示为阴性的概率。
案例详述:
假设某种很少见的疾病,人群中患有这种病的概率为千分之一,某检验方法的准确率为0.99,假阳性率为0.05。但是,对于健康的人,有5%的概率也会被检测为阳性。
现在,一个人的检测结果为阳性,请问:他患病的可能性有多大?
贝叶斯定理运用:
定义事件:
- A:这个人患有该疾病
- B:检测结果为阳性
已知条件:
- P(A) = 0.001(疾病在人群中的患病率)
- P(B|A) = 0.99(检测结果为阳性,且实际患病)
- P(B|¬A) = 0.05(检测结果为阳性,但实际健康)
使用贝叶斯定理来计算 P(A|B),即这个人患病的可能性。首先先用全概率公式计算P(B):
$$
P(B) = P(B|A) \cdot P(A) + P(B|\neg A) \cdot P(\neg A)
$$
$$
P(B) = 0.99 \cdot 0.001 + 0.05 \cdot 0.999
$$
使用贝叶斯定理计算患病的可能性:
$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$
$$
P(A|B) = \frac{0.99 \cdot 0.001}{0.99 \cdot 0.001 + 0.05 \cdot 0.999}≈1.92\%
$$
这个人患有该疾病的可能性约为1.92%。虽然检测结果为阳性,但考虑到疾病在人群中的罕见程度和检测方法的假阳性率,这个患病可能性并不高。很明显,就是某人如果查出阳性后,他是病人的概率,这个概率并不高,而是非常低。这是不是有点反直觉?
在这个情景中,有些人可能会认为当一个人的检测结果为阳性时,他患病的可能性应该更高。这种直觉上的偏差可能是因为我们对于概率和条件概率的直觉理解有所偏差。
直觉偏差:
1信息偏见: 人们往往更容易记住或关注阳性结果,而忽略了患病率低和假阳性率的影响。因此,他们可能会过度估计阳性结果的意义。
2直觉误判: 人们往往会依赖直觉来评估事件的概率,但直觉可能受到各种因素的影响,包括个人经验、情感和社会环境等。在这种情况下,直觉可能会导致对患病可能性的错误估计。
3不完整的信息: 有时候,人们可能只关注部分信息,而没有考虑所有相关因素。在这个例子中,如果只看到阳性结果而没有考虑疾病的罕见程度和检测方法的准确率,就容易产生错误的直觉。
这种直觉偏差提醒我们,在评估概率和做出决策时,需要充分考虑所有相关因素,并尽量避免受到直觉的影响。使用工具如贝叶斯定理可以帮助我们更客观地评估信息,做出更准确的判断。
贝叶斯之眼
通过以上的公式与具体案例的认识,我们能意识到,在生活中涉及到预测的事情,是可以利用贝叶斯思维来提高预测的概率的,用贝叶斯的思维去思考,让自己独具贝叶斯之眼。
明确问题与已知条件: 首先,明确要解决的问题是什么,已知条件有哪些?将问题具体化,并列出已知的信息。
建立贝叶斯模型: 根据已知条件,建立贝叶斯模型,包括定义事件、计算先验概率、似然度以及全概率等。
给出主观判断: 根据自己的经验、知识和直觉,给出一个初步的主观判断,作为先验概率。
搜集新的信息: 持续关注与问题相关的信息源,包括新闻报道、研究论文、专家观点等。收集到的新信息可能会支持或者反驳你的初步判断。
更新主观判断: 根据搜集到的新信息,不断地调整和优化自己的主观判断。如果新信息与初步判断一致,可以提高判断的可信度;如果新信息与初步判断相悖,需要重新评估并降低判断的可信度。
应用贝叶斯定理: 最后,使用贝叶斯定理将主观判断与新收集到的信息结合起来,得出更新后的预测。这样做可以更客观地考虑到先验信息和新的观察结果,提高预测的准确性。
不断循环迭代: 随着时间的推移和信息的更新,持续地观察、收集信息,并不断地优化自己的预测。通过不断地循环迭代,可以不断提高预测的准确性和可靠性。
大致是这么个步骤,本质上就是一个不断纠正的反馈循环,正如马斯克回应面对最大的挑战是什么的时候,他的回答
人生最大的挑战,就是确保自己能有纠正反馈循环,并且一直保持它—— 埃隆·马斯克
在不确定性和变化不断的挑战下,贝叶斯定理为我们指引了一条通向真相的道路,让我们能够在纷繁复杂的信息中找到方向,不断完善自己的认知与决策。统计学和概率论中的一颗璀璨明珠,更是我们探索未知、解决难题的得力工具。正如
结语
博学而笃志,切问而近思,是我们需要有的生活态度。同样地,理解贝叶斯定理,运用贝叶斯定理,融入贝叶斯定理,不断形成迭代反馈的过程,也是一件很好的事。