0-1分布
这个很好理解,检测某产品,合格的概率为p,不合格的概率就是1-p。只有这两种情况。
二项分布
还拿检查产品举例,连续检查n个产品,合格的情况是怎样的?
如图所示,当合格概率为0.5时,检查10个产品,合格5个的概率最大。
概率其实也很容易理解:
期望和方差不要用上面的概率公式求,而是将二项分布看成n次0-1分布分布,所以期望和方差直接乘n:
x = 0:10;
y = binopdf(x,10,0.5);
figure
bar(x,y,1)
泊松分布
假设我是个老板,想计算明天能卖几个馒头,我们可以把一天分成很多小段,只要这段时间足够小,这段时间里只有卖出或不卖出,那么这件事情就可以用二项分布来计算了。当
二项分布就转化为泊松分布(泊松分布的k并不在指数上,指数分布的x在指数上):
泊松分布的期望和方差可通过二项分布的期望和方差求极限得来:
x = 0:15;
y = poisspdf(x,4);
figure
bar(x,y,1)
正态分布
在卖馒头的例子中,卖出馒头的期望固定(根据历史数据计算),所以n越大,p就越小。如果是统计全国人民的身高呢,,而p不变,这二项分布将趋近于正态分布。(棣莫弗-拉普拉斯中心极限定理说的就是这个事)
x = [-3:.1:3];
y = normpdf(x,0,1);
plot(x,y)
指数分布
泊松分布描绘的是发生k次的概率。指数分布描绘的是事件时间间隔的概率。发生次数越多,时间间隔越短,所以泊松分布与指数分布的期望是倒数关系:
其实指数分布就是由泊松分布推导来的,推导过程用的了随机过程,我们不去深究了。概率密度为(泊松分布的k并不在指数上,指数分布的x在指数上):
x = 0:0.1:10;
y = exppdf(x,2);
figure;
plot(x,y)
几何分布
x = 0:20;
y = geopdf(x,0.25);
figure
bar(x,y,1)
均匀分布