第二部分:统计推断体系(Ch7 Ch9)
这一部分是你的重中之重。正如你所说,“枢轴量” (Pivot Quantity) 是贯穿这三章的唯一灵魂。
只要你能写出枢轴量,抽样分布(求概率)、区间估计(求范围)、假设检验(求拒绝域) 其实是同一个公式的三种不同写法。
第七章:统计量与抽样分布(准备工作)¶
这一章的任务是**认识枢轴量的零件**。你不需要去证明它们,只需要死记硬背它们的**构造形式**。
1. 三大分布的构造(【背诵】形状)¶
- \(\chi^2\) 分布:\(n\) 个标准正态的平方和。
- 形式:\(\sum Z_i^2 \sim \chi^2(n)\)
- 期望:\(n\),方差:\(2n\)。
- \(t\) 分布:正态除以 \(\sqrt{卡方除以自由度}\)。
- 形式:\(\frac{X}{\sqrt{Y/n}} \sim t(n)\),其中 \(X \sim N(0,1), Y \sim \chi^2(n)\)。
- 关键特征:\(t\) 分布是“样本均值”和“样本方差”混合的产物。
- \(F\) 分布:两个卡方除以各自自由度之比。
- 形式:\(\frac{U/n_1}{V/n_2} \sim F(n_1, n_2)\)。
- 性质:\(F_{1-\alpha}(n_1, n_2) = \frac{1}{F_{\alpha}(n_2, n_1)}\) (查表用)。
2. 正态总体的“费雪定理”(【背诵】枢轴量的来源)¶
设总体 \(X \sim N(\mu, \sigma^2)\),样本为 \(X_1...X_n\),则: 1. 样本均值:\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\) \(\Rightarrow\) 标准化后 \(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\) 2. 样本方差:\(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\) 3. 独立性:\(\bar{X}\) 与 \(S^2\) 相互独立(这是构造 \(t\) 分布的基础)。
3. 真题实战¶
【真题 7.6】(23-24 春夏, 4)
题目:设 \(X_i\) 来自 \(N(\mu, \sigma^2)\)。问 \((\frac{X_1+X_2-X_3-\mu}{X_2+X_3-X_4-\mu})^2\) 服从什么分布?
解法:“凑”定义。 * 分子、分母都是正态变量的线性组合,还是正态。 * \(U = X_1+X_2-X_3-\mu \sim N(0, 3\sigma^2)\)。 * \(V = X_2+X_3-X_4-\mu \sim N(0, 3\sigma^2)\)。 * 标准化:\(\frac{U}{\sqrt{3}\sigma} \sim N(0,1)\)。 * 原式平方 \(= \frac{U^2}{V^2} = \frac{(U/\sqrt{3}\sigma)^2}{(V/\sqrt{3}\sigma)^2}\)。 * 这是两个标准正态平方之比 \(\Rightarrow \frac{\chi^2(1)}{\chi^2(1)} = \frac{\chi^2(1)/1}{\chi^2(1)/1} \sim F(1,1)\)。
第八章:点估计(计算大题前奏)¶
这章不涉及枢轴量,纯计算。
1. 矩估计 (MME)¶
- 方法:用样本的一阶矩(均值)等于总体一阶矩(期望)。
- 公式:令 \(\bar{X} = E(X)\),解出参数 \(\theta\)。
- 如果有两个参数,再加一个方程:\(\frac{1}{n}\sum X_i^2 = E(X^2) = D(X) + [E(X)]^2\)。
2. 极大似然估计 (MLE) —— 必考¶
- 步骤(死步骤):
- 写似然函数:\(L(\theta) = \prod_{i=1}^n f(x_i; \theta)\)。
- 取对数:\(\ln L(\theta) = \sum \ln f(x_i; \theta)\)。
- 求导置0:\(\frac{d \ln L}{d \theta} = 0\),解出 \(\hat{\theta}\)。
- 难点:如果是均匀分布 \(U(0, \theta)\),密度函数不是连续可导的。
- \(L(\theta) = \frac{1}{\theta^n}\),条件是所有 \(x_i \le \theta\)。
- 要使 \(1/\theta^n\) 最大,\(\theta\) 必须尽可能小,但必须大于所有样本。
- 结果:\(\hat{\theta}_{MLE} = \max(X_1, ..., X_n)\)。
3. 估计量评价¶
- 无偏性:计算 \(E(\hat{\theta})\),看是否等于 \(\theta\)。
- 相合性:当 \(n \to \infty\) 时,\(\hat{\theta}\) 是否依概率收敛于 \(\theta\)(通常看方差是否趋于0)。
第九章:区间估计与假设检验(以枢轴量为纲)¶
必杀技:记住下面 4个表格中的枢轴量,你就通关了。 逻辑: * 区间估计:\(P(-k < \text{枢轴量} < k) = 1-\alpha\),反解出参数范围。 * 假设检验:计算枢轴量的值,看它是否落在拒绝域(尾巴)里。
场景一:单个正态总体 \(N(\mu, \sigma^2)\),测均值 \(\mu\)¶
| 条件 | 枢轴量 (统计量) 【背诵】 | 95% 置信区间 | 检验 \(H_0: \mu = \mu_0\) |
|---|---|---|---|
| \(\sigma^2\) 已知 | \(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\) | \(\bar{X} \pm 1.96\frac{\sigma}{\sqrt{n}}\) | $ |
| \(\sigma^2\) 未知 (考得最多) | \(T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)\) | \(\bar{X} \pm t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}\) | $ |
【真题 9.1】(24-25 春夏, 6)
题目:\(n=10, \bar{X}=5, \sum X^2=300\)。\(\sigma\) 未知,求 \(\mu\) 的下限。
解法: 1. 算 \(S^2\):\(S^2 = \frac{1}{9}(300 - 10 \times 5^2) = \frac{50}{9}\)。 2. 选枢轴量:\(\sigma\) 未知,用 \(T = \frac{\bar{X}-\mu}{S/\sqrt{n}}\)。 3. 求下限:\(\mu > \bar{X} - t_\alpha(n-1)\frac{S}{\sqrt{n}}\)。
场景二:单个正态总体 \(N(\mu, \sigma^2)\),测方差 \(\sigma^2\)¶
| 条件 | 枢轴量 (统计量) 【背诵】 | 95% 置信区间 | 检验 \(H_0: \sigma^2 = \sigma_0^2\) |
|---|---|---|---|
| \(\mu\) 未知 | \(\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\) | \([\frac{(n-1)S^2}{\chi^2_{0.025}}, \frac{(n-1)S^2}{\chi^2_{0.975}}]\) | \(\chi^2\) 太大或太小则拒绝 |
- 注意:\(\chi^2\) 分布不对称,置信区间不对称。求下限用 \(\chi^2_{1-\alpha}\)(大的分位点),求上限用 \(\chi^2_{\alpha}\)(小的分位点),因为 \(\sigma^2\) 在分母上,翻上来会变号。
【真题 9.4】(22-23 秋冬, 9)
题目:\(n=16, S^2=36\)。检验 \(H_0: \sigma^2 = 84\)。
解法: 1. 枢轴量:\(\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} = \frac{15 \times 36}{84} \approx 6.429\)。 2. 临界值:查 \(\chi^2_{0.025}(15) \approx 27.5, \chi^2_{0.975}(15) \approx 6.26\)。 3. 判断:\(6.26 < 6.429 < 27.5\),统计量在中间(接受域),不拒绝。
场景三:两个正态总体,比较均值 \(\mu_1 - \mu_2\)¶
| 条件 | 枢轴量 (统计量) 【背诵】 |
|---|---|
| \(\sigma_1^2 = \sigma_2^2\) 但未知 | \(T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2)\) |
- 合并方差 \(S_w^2\):\(S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}\) (就是两个样本方差的加权平均)。
【真题 9.6】(24-25 春夏, 12)
题目:两组数据 \(S_1^2, S_2^2\)。先检验方差齐性,再求均值差的区间。
解法: 1. 检验方差:用 \(F\) 检验(见场景四)。 2. 求均值差区间:确认方差相等后,计算 \(S_w\),构造 \(T\) 枢轴量。 区间 \(= (\bar{X}-\bar{Y}) \pm t_{\alpha/2}(df) \cdot S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\)。
场景四:两个正态总体,比较方差 \(\sigma_1^2 / \sigma_2^2\)¶
| 条件 | 枢轴量 (统计量) 【背诵】 |
|---|---|
| \(\mu\) 未知 | \(F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n_1-1, n_2-1)\) |
- 检验 \(H_0: \sigma_1^2 = \sigma_2^2\):
- 统计量 \(F = S_1^2 / S_2^2\)。
- 如果 \(F > F_{\alpha/2}\) 或 \(F < F_{1-\alpha/2}\),则拒绝(即两个方差差别太大)。
考试最后提醒¶
- P值怎么算?
- \(P\_value = P(|T| > |t_{算}|)\)。
- 也就是:在 \(t\) 分布图上,你算出来的统计量外面的**尾巴面积**。单侧检验算一边,双侧检验乘2。
- 单侧还是双侧?
- 题目问“是否相等”、“是否有差异” \(\to\) 双侧 (\(\alpha/2\))。
- 题目问“是否大于”、“是否优于” \(\to\) 单侧 (\(\alpha\))。
- 手算开根号:考试允许带计算器最好,如果不让带,遇到 \(\sqrt{10}\) 这种,保留根号或者近似 \(3.16\) 即可。
把这四个场景的表格记在纸上,考试前看最后一遍,统计推断的大题就是**完形填空**。祝你满分!