第六章 抽样及样本分布
6.2 抽样分布
定义 6.2.1 设$(X_1, X_2,...,X_n)$时来自总体$X$的一个样本,$g(X_1,X_2,...,X_n)$是样本的函数,若$g$中不含任何参数,则称$g(X_1,X_2,...,X_n)$是样本的一个统计量。
6.2.2 正态总体的抽样分布
设$(X_1, X_2,...,X_n)$是来自总体$X \sim N(\mu, \sigma^2)$的一个样本,由于$(X_1, X_2,...,X_n)$相互独立且与总体分布相同,
所以$X_i \sim N(\mu, \sigma^2), (i=1,2,...n)$,故 $$E(\overline{X}) = \Sigma_{i}^{n} \frac{1}{n}E(X_i) = \frac{1}{n} \Sigma_{i}^{n}E(X_i) =\mu$$
$$D(\overline{X}) = \Sigma_{i}^{n}\frac{1}{n}D(X_i) = \frac{1}{n^2} \Sigma_{i}^{n}D(X_i) = \frac{\sigma^2}{n}$$
由于线性分布的线性运算结果仍服从正态分布,由此得出 $$\overline{X} \sim N(\mu, \frac{\sigma^2}{n}), Z= \frac{\overline{X} - \mu}{\sigma/\sqrt{n}}$$
可以证明样本方差$E(S^2) = \sigma^2$
6.2.3 几种常见的抽样分布
1. $\chi^2$ 分布
定义 6.2.2 设$(X_1, X_2,...,X_n)$是来自总体$X \sim N(0,1)$的一个样本,则统计量$$\chi^2 = \Sigma_{i}^{n}X^2_i$$服从自由度为$n$的 $\chi^2$ 分布 记作$$\chi^2 \sim \chi^2(n)$$。
$\chi^2$ 分布的性质
(1). $\chi_1^2 \sim \chi^2(n_1), \chi_2^2 \sim \chi^2(n_2)$, 且$\chi_1^2 , \chi_1^2$相互独立,则 $\chi_1^2 + \chi_1^2 = \chi^2(n_1 + n_2)$
(2). $E(\chi^2) = n, D(\chi^2) = 2n$ 证明暂时省略
一般的,若$(X_1, X_2,...,X_n)$为来自总体$X \sim N(\mu, \sigma^2)$的一个样本则统计量$$\chi^2 = \Sigma_{i=1}^{n}\big(\frac{X_i-\mu}{\sigma}\big)^2 = \chi^2(n)$$
定理 6.2.1 设$(X_1, X_2,...,X_n)$是来自总体$X \sim N(\mu, \sigma^2)$的一个样本,则样本均值$\overline{X}$与样本方差$S^2$相互独立,且统计量$$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$$。证明略
定义 6.2.3 设随机变量$X$的分布函数为$F(X)$,对于给定的正数$\alpha(0 \lt \alpha \lt 1)$,若有数$c$满足$P(X>c)=\alpha$,则称$c$为$X$的$\alpha$分位点。
2. $t$分布
定义 6.2.2 $X \sim N(0,1), Y\sim \chi^2(n)$的, 且$X,Y$相互独立,则统计量$$ T = \frac{X}{\sqrt{\frac{Y}{n}}} $$服从自由度为$n$的 $t$ 分布 记作$$T \sim t(n)$$。
定理 6.2.2 设$(X_1, X_2,...,X_n)$是来自总体$X \sim N(\mu, \sigma^2)$的一个样本,则样本统计量$$T = \frac{\overline{X}-\mu}{S/ \sqrt{n} } \sim t(n-1)$$。证明略
2. $F$分布
定义 6.2.3 $X \sim \chi^2(m), Y\sim \chi^2(n)$的, 且$X,Y$相互独立,则统计量$$ F = \frac{X/m}{Y/n} $$服从自由度为$n$的 $F$ 分布 记作$$F \sim F(m,n)$$。
显然若$T \sim t(n)$, 则$T^2 = \frac{X^2/1^2}{[\sqrt{\frac{Y}{n}]^2}} \sim F(1,n)$
$F$ 分布的性质
(1). 若$F \sim F(m,n)$,则 $\frac{1}{F} \sim F(n,m)$
(2). $F_\alpha(n,m) = \frac{1}{F_{1-\alpha}(m,n)}$ 证明暂时省略
定理6.2.4 设$(X_1, X_2,...,X_n)$是来自总体$X \sim N(\mu_1, \sigma_1^2)$的一个样本,$(Y_1, Y_2,...,Y_n)$是来自$Y\sim N(\mu_2, \sigma_2^2)$的一个样本,且$X,Y$相互独立$S_1^2, S_2^2$分别是它们的方差,则样本统计量$$F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2 } \sim F(m-1, n-1)$$