0%

概率论与数理统计复习:一、概率论基本概念 ~ Prepare for exam

第一章 概率论基本概念

1.随机试验

世界上,没有两片相同的叶子。在没有时间倒流的情况下,严格上来讲,我们无法在完全一样的条件下做同一件事情。

然而,由于生活中许多事情的性质相同,我们在不同时间重复做这一件事,可以看成是在一个时间多次做这件事产生了多个结果。

而随机试验则是可以在相同条件下重复进行、结果不定、不可预知的试验。

这一小节很水,我们赶快把它跳过。

2.样本空间、随机事件

这一小节的讨论全部是基于集合的。

我们把一个试验的结果用集合表示,这个集合被赋予了高贵的名字:样本空间,记为$S$。$S$中的子集也有了别名,叫事件。空集叫不可能事件,全集叫必然事件,单个元素的集合叫做基本事件。事件就是集合,你可以做 $\bigcup \bigcap \subset - =$等基本运算。由于有全集,你还可以做补运算,结果等价于用全集减该集合。

集合有一堆运算律,比如德摩根律。这些东西应该是集合论讲的,这里就不复习了,考试也不会考。事实上,集合定律不用特别去记,集合定律和逻辑运算定律基本一样,而后者广泛存在于我们在生活中的一些思维方式里。

特别的,两个交为空的事件互为互不相容事件,并集是全集的互不相容事件叫做对立事件

这一小节我们取了很多名字。但是这些名字记不住也没关系,因为这些名字非常容易从字面上理解它们的定义。快进入下一节吧。

3.频率与概率

为什么要学概率呢?明明结果不可预知啊!

恰恰相反,正是因为结果不可预知,我们才需要学习概率,掌握事情发生背后的规律,从而更好地掌控随机事件。

概率有用的证据就是,无数次重复同一随机试验后,试验结果会十分接近其概率。

那概率是什么呢?概率就是个0~1的数。你硬要把它规定成0~10000里的数也可以,但没什么意义,因为概率是一个相对的概念——相对于样本空间这个全集而言。我们强行做了一个集合到数的映射,这个数越靠近1,表示它越接近必然事件,越可能发生。

要定义概率,就要对「集合到数」这个函数做一些规定。对于集合函数$P$,任意事件$A$,$P(A)\geq0$;$p(S)=1$,其中$S$为样本空间;任意个彼此互不相容事件之并的函数值是每个事件函数值之和。满足了这三个条件,概率的一切东西都可以推出来了。

考试与生活的应用中肯定不会取管定义。我们这里只注意概率的一个有用的性质:$P(A\bigcup B)=P(A) + P(B) - P(AB)$。这个性质由容斥原理而来,不仅概率函数P满足这个式子。第一章出的题目应该都会围绕这个式子出。两个事件各自的概率、两个事件并与交的概率,知道其中3个就可以推出剩下的。

例题:设$A,B,C$是三个事件,$P(A) = P(B) = P(C) = 1/4, P(AB) = P(BC) = 0, P(AC) = 1/8$, 求$A,B,C$至少有一个发生的概率。

解:
最后一句中文太不和谐了,把它转换成数学语言:求$P(A+B+C)$

由容斥原理,$P(A+B+C) = P(A) + P(B) + P(C) - P(AB) - P(AC) + P(ABC)$

$\because ABC\subset AB$

$\therefore P(ABC) \leq P(AB)$

$\because P(AB) = 0$

$\therefore P(ABC) = 0$

$\therefore P(A+B+C) = 1/4 + 1/4 + 1/4 - 1/8 = 5/8$

这题太水了,下一节。

4.古典概型

生活中最常见的概率模型是:事件由有限个基本事件组成,基本事件概率相同。比如一百个人抽签,每个人抽中的概率就是1%。如果其中有二十个人是我派过去的抽签小队,那么这个签被二十个人中某个人抽中的概率就是20%。这个概率模型非常容易理解。

换个角度来看,求概率问题就变成了计数问题。计算出所有基本事件的个数,这个数就是所有概率的分母。再计算出你要求的事件包含的基本事件数,把这个数作为分子。最终就可以计算出概率。

这一小节理论上属于组合数学的范畴了,不太像概率论。但考试还是会考,我们还得复习。只要有高中的排列组合基础,这一小节就基本不用学了。看几道水题:

例4.1:
从1~10中随机挑3个数,求:
(1)最小数为5的概率
(2)最大数为5的概率

解:

$(1) C(5, 2) / C(10, 3) = 10 / 120 = 1 / 12$
$(2) C(4, 2) / C(10, 3) = 6 / 120 = 1 / 20$

例4.2:
五双鞋子,随机取4只,求至少配成一双的概率

解:

不妨求出配不成一双的概率,再求其对立事件。

$P(至少配成一双) = 1-P(配不出一双) = 1 - C(5, 4)\times2^4 / C(10, 4) = 1 - 80 / 210 = 13/21$

5.条件概率

条件概率又是一个生活中常出现的概念。当一个事件极其复杂时,我们只能下一个大致的判断;但当你掌握的信息越来越多时,你之前下的判断的概率会越来越大。比如你掷两次骰子,你说你可以丢2次6出来,这个概率仅仅是1/36。当你第一次丢完,已经丢出了一个6后,你成功的概率就变成了1/6。

从整体的角度来看,条件概率就是知道了某些条件后,原来的样本空间缩小了。满足这个条件的事件,它自己包含的基本事件不变,而整个样本空间又缩小,它发生的概率也会随之变大。

设A,B为两个事件,$P(A) > 0,P(B|A) = \frac{P(AB)}{P(B)}$称为A发生的条件下B发生的条件概率

这个定义不是特别直观,因为我们在生活中用的一般是条件概率的性质——乘法原理,即$P(AB) = P(A | B) \times P(B)$。

比如,对面有3个怪和一个英雄,其中一个怪的效果是,你的英雄获得免疫。现在你可以造成两次无穷大的伤害,但是目标随机选定。求对面英雄死亡概率。我们通过直觉去考虑,我们要杀死对面英雄,必须要先杀死对面的特殊怪。杀死特殊怪的概率是1/4,在杀死特殊怪的条件下,杀死英雄的概率是1/3。所以杀死对面英雄的概率是$1/4\times1/3=1/12$.

条件概率还有一些重要应用,比如全概率公式。设$B_1,B_2…B_n$互不相容,且并集为全集,则$P(A) = \sum_{i = 1}^nP(A|B_i)P(B_i)$。

换句话说,某件事的概率不好求,我们只能在知道一些条件后才能确定该事件的概率。这个时候,我们要算无遗策,把所有下一步的情况考虑了,再算出每一个下一情况下,我们要求的事件的概率。最后乘一下,求个和。不过比较常见的是,我们下一步情况只有两种,因此我们只要算出下一个事件和其对立事件下,我们最后要求的事件的概率。我描述得比较抽象,不妨看一道例题:

例5.1:

甲袋中n白球m红球,乙袋中N白球M红球。从甲袋中取一个放到乙袋中,再从乙袋中取一个球。问取到的这个球是白球的概率。

解:

我们必须讨论一下从甲袋中取出的是什么,才好确定从乙袋中取白球的概率。

从这里也可以看出,条件概率和全概率公式是十分符合我们生活中的思维方式的。

全概率公式加上条件概率定义可以组合出一个很厉害的公式——贝叶斯公式:

这个公式乍一眼看很复杂,但仔细观察后发现,等式右边分子就是$P(AB_i)$,分母就是$P(A)$。这个式子给我们的直观感受是:我不知道B在A情况下发生的概率,但我知道A在B情况下发生的概率,那我再知道一些关于事件A发生的信息就可以求出B在A情况下发生的概率了。

这个公式在生活也是非常实用的,通过它或许可以得到一些反直觉的结论。这也是数学的奇妙之处:源于生活中的直觉,又超过了直觉。(暂时没有找到说明这个的例子)

看一个例题:

例5.2
假设男性色盲率5%,女性色盲率0.25%,从男女相等的人群中随机挑一人,其为色盲。问该人是男性的概率。

解:
设事件A:人是色盲,B:这人是男人,C:这人是女人。
则题目表述变为:$P(A|B) = 5\%, P(A|C)=0.25\%,P(B)=P(\overline B)=P(C)= 1/2,求P(B|A)$
由贝叶斯公式:$P(B|A) = \frac{P(A|B)P(B)}{P(A|B)P(B)+P(A|C)P(C))} =0.05\times 0.5 \div(0.05\times0.5+0.0025\times0.5) = 500/525 = 20/21$

6.独立性

在生活中,我们喜欢把没什么关系的时候瞎关联起来。比如,有人说,喝水会让人死亡,因为所有人活着的时候都喝了水。

为了驳斥这个观点,我们提出了独立性的概念,用以了解两件事事件是否会有关联。具体来说,也就是一件事发生或不发生,另一件事发生的概率是否发生改变。

若$P(AB) = P(A)P(B)$,则称A,B独立

由$P(AB) = P(A | B) \times P(B)$可知,A,B独立,意味着$P(A) = P(A|B)$,也就是B发生对A发生的概率毫无影响,符合我们直观上的感觉。

回到之前提出的例子,我们可以用独立性的概念来不严格地解释这个问题。$P(喝水的人死亡) = P(喝水)P(人死亡)$,因为所有人喝水,这个式子显然成立。因此我们可以说明,喝水和死亡没有半毛钱关系,它们是独立的。

独立性的运用也很广。我们生活中经常把两件事都发生的概率直接用两件事单独发生的概率乘起来,就是因为我们不自觉地假设两事情是独立的。

定义独立性也没有什么的意义,就是为了方便说明。比如题目提到,这两件事是独立的,就是在说明你在算这两件事的概率时分开来算就行,不用考虑它们的影响。

例6.1:

一个盒子有3个A,2个B,2个C,另一个盒子有2个A,3个B,4个C,独立地分别地在两只盒子中各取一个东西,求
(1)至少一个A的概率
(2)1A1C的概率
(3)已知至少有一个A,求1A1C的概率

解:
$(1) P = 1 - P(无A) = 1 - 4/7\times7/9 = 1 - 28/63 = 35/63 = 5/9$
$(2) P = 3/7\times4/9+2/7\times2/9 =16/63$
$(3) P = P(2) / P(1) = 16/35$

可以看出,独立性什么新的概念也没有提出,就是方便以后的说明而已。

学习总结

概率论第一章主要介绍了概率的基本定义,并且介绍了古典概型这一贴近生活的概率模型。

这一章前半部分涉及集合运算、排列组合计数,这个东西比较看基本功,不需要特别地复习。后半部分一些条件概率的公式比较重要,需要理解记忆。最简单的条件概率公式倒也好理解,但贝叶斯公式和全概率公式如果忘记了推导的原理,还是挺麻烦的。题型应该也就按内容分成这两种。古典概型求概率,用排列组合靠大脑做;碰到需要用到概率公式的题目,用符号表示题目给的量,最后放进公式一算就行了。

参考资料

浙江大学 盛骤 谢式千 潘承毅,《概率论与数理统计》 第四版,高等教育出版社
例题来自于我们老师给我们布置的书后习题