数理统计

image

常见统计量及统计量分布

统计量就是随机变量的函数(不含总体参数)。

卡方分布 X_{i} \sim N(0,1) \sum_{i=1}^{n} X_{i}^{2} \sim \chi^{2}(n) EX=n DX=2n

t分布

X \sim N(0,1)
Y \sim \chi^{2}(n)

\frac{X}{\sqrt{Y / n}} \sim t(n)

Et=0

F分布

X \sim \chi^{2}(n_1)
Y \sim \chi^{2}(n_2)

\frac{X/n_1}{Y/n_2} \sim F(n_1,n_2)

正态分布总体下的常用结论

X_{1}, X_{2}, \cdots, X_{n} 是取自正态总体 N\left(\mu, \sigma^{2}\right) 的样本,\overline{X},S^{2} 分别是样本的均值和方差,则:

\sum_{i=1}^{n}\left(\frac{X_{i}-\mu}{\sigma}\right)^{2} \sim \chi^{2}(n) \sum_{i=1}^{n}\left(\frac{X_{i}-\overline{X}}{\sigma}\right)^{2} \sim \chi^{2}(n-1) \frac{(n-1)S^2}{\sigma^2} \sim \chi^{2}(n-1)
\overline{X} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) \frac{\sqrt{n}(\overline{X}-\mu)}{\sigma} \sim N(0,1) \frac{\sqrt{n}(\overline{X}-\mu)}{S} \sim t(n-1) \frac{n(\overline{X}-\mu)^{2}}{S^{2}} \sim F(1, n-1)

\overline{X}与S^{2}相互独立

点估计

估计量的评价

E \hat{\theta}=\theta,则称\hat{\theta}\theta的无偏估计量,否则是有偏估计。

矩估计

期望和方差的无偏估计量为:

\overline{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i}

S^{2} =\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}

注:总体的方差S^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}与方差的无偏估计量S^{2} =\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}不同,前者是知道总体计算均值,后者是知道样本估计均值,用前者作为方差的估计量是有偏估计,后者是做了适当修正的无偏估计。

矩估计的思路是直接用估计量代表总体的特征,从而求出模型中的参数,即令:

\overline{X}= EX

S^{2}= DX

以上的均值和方差其实是一阶矩和纠偏后的二阶中心矩,所以这种估计方式被称为矩估计。

最大似然估计

如果总体模型中有参数\theta未确定,写出样本发生的概率L,此时L必定是关于\theta的函数。

实际上我们已经得到样本了,所以我们假设此时L发生的概率是最大的,只需求出使L取得最大值的参数\theta,即为估计的模型参数。

区间估计

因为:

\frac{\overline{X}-\mu} {\sigma/\sqrt{n}}\sim N\left(0, 1\right)

查标准正态分布表可知:

P\left\{-z_{\frac{\alpha}{2}} \leqslant \frac{\overline{X}-\mu} {\sigma/\sqrt{n}}\leqslant z_{\frac{\alpha}{2}}\right\} = 1-\alpha

从而:

P\left\{\overline{X}-z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \leqslant \mu \leqslant \overline{X}+z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\right\}= 1-\alpha

所以\mu的置信度为1-\alpha的区间估计为

\left(\overline{X}-z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} ,~\overline{X}+z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\right)

若方差未知,此时可以用样本方差代替总体方差,则有:

\frac{\overline{X}-\mu} {S/\sqrt{n}}\sim t(n-1)

查表得:

P\left\{-t_{\frac{\alpha}{2}}(n-1) \leqslant \frac{\overline{X}-\mu} {S/\sqrt{n}}\leqslant t_{\frac{\alpha}{2}}(n-1)\right\} = 1-\alpha

从而:

P\left\{\overline{X}-t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}} \leqslant \mu \leqslant \overline{X}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}\right\}= 1-\alpha

所以\mu的置信度为1-\alpha的区间估计为

\left(\overline{X}-t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}} ,~ \overline{X}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}\right)

假设检验

因为:

\frac{\overline{X}-\mu_{0}} {\sigma/\sqrt{n}}\sim N\left(0, 1\right)

查标准正态分布表可知:

P\left\{-z_{\frac{\alpha}{2}} \leqslant \frac{\overline{X}-\mu_{0}} {\sigma/\sqrt{n}}\leqslant z_{\frac{\alpha}{2}}\right\} = 1-\alpha

从而:

P\left\{\mu_{0}-z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \leqslant \overline{X} \leqslant \mu_{0}+z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\right\}= 1-\alpha

所以\mu=\mu_{0}的拒绝域为:

\left(-\infty ,~\mu_{0}-z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}\right]\cup\left[\mu_{0}+z_{\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} ,~ +\infty\right)

若方差未知,此时可以用样本方差代替总体方差,则有:

\frac{\overline{X}-\mu_{0}} {S/\sqrt{n}}\sim t(n-1)

查表得:

P\left\{-t_{\frac{\alpha}{2}}(n-1) \leqslant \frac{\overline{X}-\mu_{0}} {S/\sqrt{n}}\leqslant t_{\frac{\alpha}{2}}(n-1)\right\} = 1-\alpha

从而:

P\left\{\mu_{0}-t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}} \leqslant \overline{X} \leqslant \mu_{0}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}\right\}= 1-\alpha

所以\mu=\mu_{0}的拒绝域为:

\left(-\infty ,~ \mu_{0}-t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}}\right]\cup\left[\mu_{0}+t_{\frac{\alpha}{2}}(n-1)\frac{S}{\sqrt{n}} ,~ +\infty\right)


posted @ 2021-09-08 21:38:19
评论加载中...

发表评论