第二部分：统计推断体系（Ch7 Ch9）

这一部分是你的重中之重。正如你所说，“枢轴量” (Pivot Quantity) 是贯穿这三章的唯一灵魂。

只要你能写出枢轴量，抽样分布（求概率）、区间估计（求范围）、假设检验（求拒绝域） 其实是同一个公式的三种不同写法。

第七章：统计量与抽样分布（准备工作）¶

这一章的任务是**认识枢轴量的零件**。你不需要去证明它们，只需要死记硬背它们的**构造形式**。

1. 三大分布的构造（【背诵】形状）¶

$\chi^2$ 分布：$n$ 个标准正态的平方和。
- 形式：$\sum Z_i^2 \sim \chi^2(n)$
- 期望：$n$，方差：$2n$。
$t$ 分布：正态除以 $\sqrt{卡方除以自由度}$。
- 形式：$\frac{X}{\sqrt{Y/n}} \sim t(n)$，其中 $X \sim N(0,1), Y \sim \chi^2(n)$。
- 关键特征：$t$ 分布是“样本均值”和“样本方差”混合的产物。
$F$ 分布：两个卡方除以各自自由度之比。
- 形式：$\frac{U/n_1}{V/n_2} \sim F(n_1, n_2)$。
- 性质：$F_{1-\alpha}(n_1, n_2) = \frac{1}{F_{\alpha}(n_2, n_1)}$ （查表用）。

2. 正态总体的“费雪定理”（【背诵】枢轴量的来源）¶

设总体 $X \sim N(\mu, \sigma^2)$，样本为 $X_1...X_n$，则： 1. 样本均值：$\bar{X} \sim N(\mu, \frac{\sigma^2}{n})$ $\Rightarrow$ 标准化后 $Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$ 2. 样本方差：$\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ 3. 独立性：$\bar{X}$ 与 $S^2$ 相互独立（这是构造 $t$ 分布的基础）。

3. 真题实战¶

【真题 7.6】(23-24 春夏, 4)

题目：设 $X_i$ 来自 $N(\mu, \sigma^2)$。问 $(\frac{X_1+X_2-X_3-\mu}{X_2+X_3-X_4-\mu})^2$ 服从什么分布？

解法：“凑”定义。 * 分子、分母都是正态变量的线性组合，还是正态。 * $U = X_1+X_2-X_3-\mu \sim N(0, 3\sigma^2)$。 * $V = X_2+X_3-X_4-\mu \sim N(0, 3\sigma^2)$。 * 标准化：$\frac{U}{\sqrt{3}\sigma} \sim N(0,1)$。 * 原式平方 $= \frac{U^2}{V^2} = \frac{(U/\sqrt{3}\sigma)^2}{(V/\sqrt{3}\sigma)^2}$。 * 这是两个标准正态平方之比 $\Rightarrow \frac{\chi^2(1)}{\chi^2(1)} = \frac{\chi^2(1)/1}{\chi^2(1)/1} \sim F(1,1)$。

第八章：点估计（计算大题前奏）¶

这章不涉及枢轴量，纯计算。

1. 矩估计 (MME)¶

方法：用样本的一阶矩（均值）等于总体一阶矩（期望）。
公式：令 $\bar{X} = E(X)$，解出参数 $\theta$。
- 如果有两个参数，再加一个方程：$\frac{1}{n}\sum X_i^2 = E(X^2) = D(X) + [E(X)]^2$。

2. 极大似然估计 (MLE) —— 必考¶

步骤（死步骤）：
1. 写似然函数：$L(\theta) = \prod_{i=1}^n f(x_i; \theta)$。
2. 取对数：$\ln L(\theta) = \sum \ln f(x_i; \theta)$。
3. 求导置0：$\frac{d \ln L}{d \theta} = 0$，解出 $\hat{\theta}$。
难点：如果是均匀分布 $U(0, \theta)$，密度函数不是连续可导的。
- $L(\theta) = \frac{1}{\theta^n}$，条件是所有 $x_i \le \theta$。
- 要使 $1/\theta^n$ 最大，$\theta$ 必须尽可能小，但必须大于所有样本。
- 结果：$\hat{\theta}_{MLE} = \max(X_1, ..., X_n)$。

3. 估计量评价¶

无偏性：计算 $E(\hat{\theta})$，看是否等于 $\theta$。
相合性：当 $n \to \infty$ 时，$\hat{\theta}$ 是否依概率收敛于 $\theta$（通常看方差是否趋于0）。

第九章：区间估计与假设检验（以枢轴量为纲）¶

必杀技：记住下面 4个表格中的枢轴量，你就通关了。逻辑： * 区间估计：$P(-k < \text{枢轴量} < k) = 1-\alpha$，反解出参数范围。 * 假设检验：计算枢轴量的值，看它是否落在拒绝域（尾巴）里。

场景一：单个正态总体 $N(\mu, \sigma^2)$，测均值 $\mu$¶

条件	枢轴量 (统计量) 【背诵】	95% 置信区间	检验 $H_0: \mu = \mu_0$
$\sigma^2$ 已知	$Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)$	$\bar{X} \pm 1.96\frac{\sigma}{\sqrt{n}}$	$
$\sigma^2$ 未知 (考得最多)	$T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)$	$\bar{X} \pm t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}$	$

【真题 9.1】(24-25 春夏, 6)

题目：$n=10, \bar{X}=5, \sum X^2=300$。$\sigma$ 未知，求 $\mu$ 的下限。

解法： 1. 算 $S^2$：$S^2 = \frac{1}{9}(300 - 10 \times 5^2) = \frac{50}{9}$。 2. 选枢轴量：$\sigma$ 未知，用 $T = \frac{\bar{X}-\mu}{S/\sqrt{n}}$。 3. 求下限：$\mu > \bar{X} - t_\alpha(n-1)\frac{S}{\sqrt{n}}$。

场景二：单个正态总体 $N(\mu, \sigma^2)$，测方差 $\sigma^2$¶

条件	枢轴量 (统计量) 【背诵】	95% 置信区间	检验 $H_0: \sigma^2 = \sigma_0^2$
$\mu$ 未知	$\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$	$[\frac{(n-1)S^2}{\chi^2_{0.025}}, \frac{(n-1)S^2}{\chi^2_{0.975}}]$	$\chi^2$ 太大或太小则拒绝

注意：$\chi^2$ 分布不对称，置信区间不对称。求下限用 $\chi^2_{1-\alpha}$（大的分位点），求上限用 $\chi^2_{\alpha}$（小的分位点），因为 $\sigma^2$ 在分母上，翻上来会变号。

【真题 9.4】(22-23 秋冬, 9)

题目：$n=16, S^2=36$。检验 $H_0: \sigma^2 = 84$。

解法： 1. 枢轴量：$\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} = \frac{15 \times 36}{84} \approx 6.429$。 2. 临界值：查 $\chi^2_{0.025}(15) \approx 27.5, \chi^2_{0.975}(15) \approx 6.26$。 3. 判断：$6.26 < 6.429 < 27.5$，统计量在中间（接受域），不拒绝。

场景三：两个正态总体，比较均值 $\mu_1 - \mu_2$¶

条件	枢轴量 (统计量) 【背诵】
$\sigma_1^2 = \sigma_2^2$ 但未知	$T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2)$

合并方差 $S_w^2$：$S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}$ （就是两个样本方差的加权平均）。

【真题 9.6】(24-25 春夏, 12)

题目：两组数据 $S_1^2, S_2^2$。先检验方差齐性，再求均值差的区间。

解法： 1. 检验方差：用 $F$ 检验（见场景四）。 2. 求均值差区间：确认方差相等后，计算 $S_w$，构造 $T$ 枢轴量。区间 $= (\bar{X}-\bar{Y}) \pm t_{\alpha/2}(df) \cdot S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$。

场景四：两个正态总体，比较方差 $\sigma_1^2 / \sigma_2^2$¶

条件	枢轴量 (统计量) 【背诵】
$\mu$ 未知	$F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n_1-1, n_2-1)$

检验 $H_0: \sigma_1^2 = \sigma_2^2$：
- 统计量 $F = S_1^2 / S_2^2$。
- 如果 $F > F_{\alpha/2}$ 或 $F < F_{1-\alpha/2}$，则拒绝（即两个方差差别太大）。

考试最后提醒¶

P值怎么算？
- $P\_value = P(|T| > |t_{算}|)$。
- 也就是：在 $t$ 分布图上，你算出来的统计量外面的**尾巴面积**。单侧检验算一边，双侧检验乘2。
单侧还是双侧？
- 题目问“是否相等”、“是否有差异” $\to$ 双侧 ($\alpha/2$)。
- 题目问“是否大于”、“是否优于” $\to$ 单侧 ($\alpha$)。
手算开根号：考试允许带计算器最好，如果不让带，遇到 $\sqrt{10}$ 这种，保留根号或者近似 $3.16$ 即可。

把这四个场景的表格记在纸上，考试前看最后一遍，统计推断的大题就是**完形填空**。祝你满分！

条件	枢轴量 (统计量) 【背诵】	95% 置信区间	检验 \(H_0: \mu = \mu_0\)
\(\sigma^2\) 已知	\(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\)	\(\bar{X} \pm 1.96\frac{\sigma}{\sqrt{n}}\)	$
\(\sigma^2\) 未知 (考得最多)	\(T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)\)	\(\bar{X} \pm t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}\)	$