概率论(二)常见概率分布

0-1分布

X \sim\left(\begin{array}{cc}1 & 0 \\p & 1-p\end{array}\right)

这个很好理解,检测某产品,合格的概率为p,不合格的概率就是1-p。只有这两种情况。

EX=p\qquad DX=(1-p)p

二项分布

还拿检查产品举例,连续检查n个产品,合格的情况是怎样的?

image

如图所示,当合格概率为0.5时,检查10个产品,合格5个的概率最大。

概率其实也很容易理解:

P\{X=k\}=C_n^k p^k (1-p)^{n-k}

期望和方差不要用上面的概率公式求,而是将二项分布看成n次0-1分布分布,所以期望和方差直接乘n:

EX=np\qquad DX=np(1-p)

x = 0:10;
y = binopdf(x,10,0.5);
figure
bar(x,y,1)

泊松分布

假设我是个老板,想计算明天能卖几个馒头,我们可以把一天分成很多小段,只要这段时间足够小,这段时间里只有卖出或不卖出,那么这件事情就可以用二项分布来计算了。当

n\rightarrow+\infty\qquad p\rightarrow 0

np\rightarrow \lambda

二项分布就转化为泊松分布(泊松分布的k并不在指数上,指数分布的x在指数上):

P\{X=k\}=\frac{\lambda^{k}}{k !} \mathrm{e}^{-\lambda}

泊松分布的期望和方差可通过二项分布的期望和方差求极限得来:

EX=\lambda\qquad DX=\lambda

image

x = 0:15;
y = poisspdf(x,4);
figure
bar(x,y,1)

正态分布

在卖馒头的例子中,卖出馒头的期望固定(根据历史数据计算),所以n越大,p就越小。如果是统计全国人民的身高呢, n\rightarrow+\infty ,而p不变,这二项分布将趋近于正态分布。(棣莫弗-拉普拉斯中心极限定理说的就是这个事)

f(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^{2}}{2 \sigma^2}}

EX=\mu\qquad DX=\sigma^2

image

x = [-3:.1:3];
y = normpdf(x,0,1);
plot(x,y)

指数分布

泊松分布描绘的是发生k次的概率。指数分布描绘的是事件时间间隔的概率。发生次数越多,时间间隔越短,所以泊松分布与指数分布的期望是倒数关系:

EX=\frac{1}{\lambda}\qquad DX=\frac{1}{\lambda^2}

其实指数分布就是由泊松分布推导来的,推导过程用的了随机过程,我们不去深究了。概率密度为(泊松分布的k并不在指数上,指数分布的x在指数上):

f(x)=\left\{\begin{array}{ll}\lambda \mathrm{e}^{-\lambda x}, & x>0 \\ 0, & \text { 其他 },\end{array}\right.

F(x)=\left\{\begin{array}{ll}1-\mathrm{e}^{-\lambda x}, & x \geqslant 0 \\ 0, & x<0\end{array}\right.

image

x = 0:0.1:10;
y = exppdf(x,2);
figure;
plot(x,y)

几何分布

P\{X=k\}=p (1-p)^{k-1}

EX=\frac{1}{p}\qquad DX=\frac{1-p}{p^2}

image

x = 0:20;
y = geopdf(x,0.25);
figure
bar(x,y,1)

均匀分布

f(x)=\left\{\begin{array}{ll}\frac{1}{L}, & a<x<b \\ 0, & \text { 其他 }\end{array}\right.

EX=\frac{a+b}{2}\qquad DX=\frac{(b-a)^2}{12}

posted @ 2024/04/10 04:18:49