跳转至

第二部分:统计推断体系(Ch7 Ch9)

这一部分是你的重中之重。正如你所说,“枢轴量” (Pivot Quantity) 是贯穿这三章的唯一灵魂。

只要你能写出枢轴量,抽样分布(求概率)、区间估计(求范围)、假设检验(求拒绝域) 其实是同一个公式的三种不同写法。


第七章:统计量与抽样分布(准备工作)

这一章的任务是**认识枢轴量的零件**。你不需要去证明它们,只需要死记硬背它们的**构造形式**。

1. 三大分布的构造(【背诵】形状)

  • \(\chi^2\) 分布\(n\) 个标准正态的平方和。
    • 形式:\(\sum Z_i^2 \sim \chi^2(n)\)
    • 期望:\(n\),方差:\(2n\)
  • \(t\) 分布:正态除以 \(\sqrt{卡方除以自由度}\)
    • 形式:\(\frac{X}{\sqrt{Y/n}} \sim t(n)\),其中 \(X \sim N(0,1), Y \sim \chi^2(n)\)
    • 关键特征\(t\) 分布是“样本均值”和“样本方差”混合的产物。
  • \(F\) 分布:两个卡方除以各自自由度之比。
    • 形式:\(\frac{U/n_1}{V/n_2} \sim F(n_1, n_2)\)
    • 性质:\(F_{1-\alpha}(n_1, n_2) = \frac{1}{F_{\alpha}(n_2, n_1)}\) (查表用)。

2. 正态总体的“费雪定理”(【背诵】枢轴量的来源)

设总体 \(X \sim N(\mu, \sigma^2)\),样本为 \(X_1...X_n\),则: 1. 样本均值\(\bar{X} \sim N(\mu, \frac{\sigma^2}{n})\) \(\Rightarrow\) 标准化后 \(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\) 2. 样本方差\(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\) 3. 独立性\(\bar{X}\)\(S^2\) 相互独立(这是构造 \(t\) 分布的基础)。

3. 真题实战

【真题 7.6】(23-24 春夏, 4)

题目:设 \(X_i\) 来自 \(N(\mu, \sigma^2)\)。问 \((\frac{X_1+X_2-X_3-\mu}{X_2+X_3-X_4-\mu})^2\) 服从什么分布?

解法“凑”定义。 * 分子、分母都是正态变量的线性组合,还是正态。 * \(U = X_1+X_2-X_3-\mu \sim N(0, 3\sigma^2)\)。 * \(V = X_2+X_3-X_4-\mu \sim N(0, 3\sigma^2)\)。 * 标准化:\(\frac{U}{\sqrt{3}\sigma} \sim N(0,1)\)。 * 原式平方 \(= \frac{U^2}{V^2} = \frac{(U/\sqrt{3}\sigma)^2}{(V/\sqrt{3}\sigma)^2}\)。 * 这是两个标准正态平方之比 \(\Rightarrow \frac{\chi^2(1)}{\chi^2(1)} = \frac{\chi^2(1)/1}{\chi^2(1)/1} \sim F(1,1)\)


第八章:点估计(计算大题前奏)

这章不涉及枢轴量,纯计算。

1. 矩估计 (MME)

  • 方法:用样本的一阶矩(均值)等于总体一阶矩(期望)。
  • 公式:令 \(\bar{X} = E(X)\),解出参数 \(\theta\)
    • 如果有两个参数,再加一个方程:\(\frac{1}{n}\sum X_i^2 = E(X^2) = D(X) + [E(X)]^2\)

2. 极大似然估计 (MLE) —— 必考

  • 步骤(死步骤)
    1. 写似然函数\(L(\theta) = \prod_{i=1}^n f(x_i; \theta)\)
    2. 取对数\(\ln L(\theta) = \sum \ln f(x_i; \theta)\)
    3. 求导置0\(\frac{d \ln L}{d \theta} = 0\),解出 \(\hat{\theta}\)
  • 难点:如果是均匀分布 \(U(0, \theta)\),密度函数不是连续可导的。
    • \(L(\theta) = \frac{1}{\theta^n}\),条件是所有 \(x_i \le \theta\)
    • 要使 \(1/\theta^n\) 最大,\(\theta\) 必须尽可能小,但必须大于所有样本。
    • 结果\(\hat{\theta}_{MLE} = \max(X_1, ..., X_n)\)

3. 估计量评价

  • 无偏性:计算 \(E(\hat{\theta})\),看是否等于 \(\theta\)
  • 相合性:当 \(n \to \infty\) 时,\(\hat{\theta}\) 是否依概率收敛于 \(\theta\)(通常看方差是否趋于0)。

第九章:区间估计与假设检验(以枢轴量为纲)

必杀技:记住下面 4个表格中的枢轴量,你就通关了。 逻辑: * 区间估计\(P(-k < \text{枢轴量} < k) = 1-\alpha\),反解出参数范围。 * 假设检验:计算枢轴量的值,看它是否落在拒绝域(尾巴)里。

场景一:单个正态总体 \(N(\mu, \sigma^2)\),测均值 \(\mu\)

条件 枢轴量 (统计量) 【背诵】 95% 置信区间 检验 \(H_0: \mu = \mu_0\)
\(\sigma^2\) 已知 \(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\) \(\bar{X} \pm 1.96\frac{\sigma}{\sqrt{n}}\) $
\(\sigma^2\) 未知 (考得最多) \(T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)\) \(\bar{X} \pm t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}\) $

【真题 9.1】(24-25 春夏, 6)

题目\(n=10, \bar{X}=5, \sum X^2=300\)\(\sigma\) 未知,求 \(\mu\) 的下限。

解法: 1. 算 \(S^2\)\(S^2 = \frac{1}{9}(300 - 10 \times 5^2) = \frac{50}{9}\)。 2. 选枢轴量\(\sigma\) 未知,用 \(T = \frac{\bar{X}-\mu}{S/\sqrt{n}}\)。 3. 求下限\(\mu > \bar{X} - t_\alpha(n-1)\frac{S}{\sqrt{n}}\)

场景二:单个正态总体 \(N(\mu, \sigma^2)\),测方差 \(\sigma^2\)

条件 枢轴量 (统计量) 【背诵】 95% 置信区间 检验 \(H_0: \sigma^2 = \sigma_0^2\)
\(\mu\) 未知 \(\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\) \([\frac{(n-1)S^2}{\chi^2_{0.025}}, \frac{(n-1)S^2}{\chi^2_{0.975}}]\) \(\chi^2\) 太大或太小则拒绝
  • 注意\(\chi^2\) 分布不对称,置信区间不对称。求下限用 \(\chi^2_{1-\alpha}\)(大的分位点),求上限用 \(\chi^2_{\alpha}\)(小的分位点),因为 \(\sigma^2\) 在分母上,翻上来会变号。

【真题 9.4】(22-23 秋冬, 9)

题目\(n=16, S^2=36\)。检验 \(H_0: \sigma^2 = 84\)

解法: 1. 枢轴量\(\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} = \frac{15 \times 36}{84} \approx 6.429\)。 2. 临界值:查 \(\chi^2_{0.025}(15) \approx 27.5, \chi^2_{0.975}(15) \approx 6.26\)。 3. 判断\(6.26 < 6.429 < 27.5\),统计量在中间(接受域),不拒绝

场景三:两个正态总体,比较均值 \(\mu_1 - \mu_2\)

条件 枢轴量 (统计量) 【背诵】
\(\sigma_1^2 = \sigma_2^2\) 但未知 \(T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2)\)
  • 合并方差 \(S_w^2\)\(S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}\) (就是两个样本方差的加权平均)。

【真题 9.6】(24-25 春夏, 12)

题目:两组数据 \(S_1^2, S_2^2\)。先检验方差齐性,再求均值差的区间。

解法: 1. 检验方差:用 \(F\) 检验(见场景四)。 2. 求均值差区间:确认方差相等后,计算 \(S_w\),构造 \(T\) 枢轴量。 区间 \(= (\bar{X}-\bar{Y}) \pm t_{\alpha/2}(df) \cdot S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\)

场景四:两个正态总体,比较方差 \(\sigma_1^2 / \sigma_2^2\)

条件 枢轴量 (统计量) 【背诵】
\(\mu\) 未知 \(F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} \sim F(n_1-1, n_2-1)\)
  • 检验 \(H_0: \sigma_1^2 = \sigma_2^2\)
    • 统计量 \(F = S_1^2 / S_2^2\)
    • 如果 \(F > F_{\alpha/2}\)\(F < F_{1-\alpha/2}\),则拒绝(即两个方差差别太大)。

考试最后提醒

  1. P值怎么算?
    • \(P\_value = P(|T| > |t_{算}|)\)
    • 也就是:在 \(t\) 分布图上,你算出来的统计量外面的**尾巴面积**。单侧检验算一边,双侧检验乘2。
  2. 单侧还是双侧?
    • 题目问“是否相等”、“是否有差异” \(\to\) 双侧 (\(\alpha/2\))。
    • 题目问“是否大于”、“是否优于” \(\to\) 单侧 (\(\alpha\))。
  3. 手算开根号:考试允许带计算器最好,如果不让带,遇到 \(\sqrt{10}\) 这种,保留根号或者近似 \(3.16\) 即可。

把这四个场景的表格记在纸上,考试前看最后一遍,统计推断的大题就是**完形填空**。祝你满分!