概率
概率分为两类:
名称 |
事件 |
概率 |
古典概型 |
离散 |
|
几何概型 |
连续 |
|
古典概型确定样本空间可分为以下几种几种情况:
古典概型常见问题 |
方式 |
样本空间 |
将n个质点随机地分配到N个盒中 |
每盒可容纳任意多个质点 |
|
每盒容纳至多一个质点 |
|
自含N个元素的总体中n次简单随机抽样 |
有放回取n次 |
|
无放回取n次 |
|
任取n个 |
|
古典概型确定A中样本点个数通常需要具体问题具体分析,但无非依据下面两个原则:
对立
条件概率
独立
独立是指两个事件不相关,两个事件完全没有联系。
若 A、B独立,则
结合对立知识有:
互斥
互斥是指一个事件发生,另一个事件不发生。
若 A、B互斥,则
没有互斥条件时,可以制造互斥条件,然后用互斥的性质:
利用全集分解,制造互斥:
全概率公式,在全集分解制造互斥的基础上增加条件概率:
只有两个的全集分解:
下面这两个公式用互斥或几何意义来理解都可以:
分布律与概率密度
数学家不满足于计算某一个随机事件的概率,而是想对整体有一个了解。随机事件并不是数字,为了方便研究,将事件映射到实数域:
映射后的数字叫做随机变量,这么做之后,用横轴代表随机事件,纵轴代表概率,作图。
对于离散型随机变量,得到如下图像,叫做分布律:
注:分布律经常以表格、矩阵的形式给出。
对于连续型随机变量,得到如下图像,对应区间的面积表示概率,这个函数被成为概率密度:
由概率之和等于1,得:
离散型 |
|
连续型 |
|
分布函数
分布律与概率密度表达所有概率的大小,我们可以通过“观察”这两幅图,来了解概率的分布情况。
但是“观察”不利于表达,分布函数可以将分布情况转化为数值,从而定量反应概率分布情况:
分布函数是概率的累加,所以有单调不减、右连续、介于0~1直接这三条性质。
考试常考分布函数性质的推广:
- 是分布函数
- 是分布函数
- 是概率密度函数
多维随机变量
联合概率是指多个随机变量同时发生的概率。
多个离散型随机变量的概率称为联合分布律,联合分布律的图形不太好画,但是完全可以想象,它是二维的平米上面几个点上有概率。下面我们用表格列举出来:
多个连续型随机变量的概率称为联合概率密度,下图的x轴和y轴是随机变量,z轴为联合概率密度:
为了定量反应多个随机变量的概率分布情况,定义联合分布函数:
边缘分布与条件分布
边缘分布
|
|
|
|
条件分布
|
|
|
期望与方差
协方差
协方差表达的是两个随机变量的偏差。例如:X是父母的身高,Y是孩子的身高。孩子的身高通常与父母的身高偏差比较小,即Cov(X,Y)比较小。
可作为衡量X,Y关系程度的出发点,但还需作些修正.首先,像衡量“程度”这种概念的数字,一般要求不超过1.协方差不一定满足这个要求,尤其是协方差的值与个体指标的单位有关.例如,X和Y分别为人的身高、体重,分别以米和千克为单位.若改用厘米和克为单位,则X和Y的值分别增大100和1000倍,而其协方差将增大100000倍!克服这一点的办法是进行规格化:
仅能反应X,Y的线性关系,不能反映曲线型相关,因此叫做线性相关系数。
期望、方差、协方差的性质
期望:
方差:
协方差: