概统
这份复习指南是基于你提供的PDF(2020-2025年真题解析)整理的一小时极速通关版。
为了在短时间内掌握,我们将内容重组为三大板块:概率计算(基础拿分)、分布与统计量(核心难点)、统计推断(套路题)。
请拿出纸笔,重点记忆标有 【背诵】 的公式。
第一板块:概率计算(送分题,必须拿满)¶
覆盖题型:题型一、二、三(古典、几何、全概、贝叶斯)
1. 基础公式¶
- 加法公式:\(P(A \cup B) = P(A) + P(B) - P(AB)\)
- 减法公式:\(P(A - B) = P(A) - P(AB)\)
- 条件概率:\(P(B|A) = \frac{P(AB)}{P(A)}\)
- 独立性:若 A, B 独立,则 \(P(AB) = P(A)P(B)\)。
- 考点提醒:\(P(A \cup B) = 1 - P(\bar{A})P(\bar{B})\) (常用于“至少发生一个”)
2. 全概率与贝叶斯(必考大题)¶
- 场景:分阶段发生的事情。第一阶段有多种情况 \(B_1, B_2...\)(完备事件组),第二阶段是事件 A。
- 全概率公式(求结果): $\(P(A) = \sum P(B_i)P(A|B_i)\)$
- 贝叶斯公式(求原因/逆概):已知 A 发生了,求它是 \(B_k\) 导致的概率。 $\(P(B_k|A) = \frac{P(B_k)P(A|B_k)}{\sum P(B_i)P(A|B_i)} = \frac{\text{分枝}}{\text{总和}}\)$
第二板块:随机变量及其分布(核心计算)¶
覆盖题型:题型四至十一(分布、期望、方差、大数定律)
1. 一维分布(离散 vs 连续)¶
- 离散型:画分布律表格,\(\sum p_i = 1\)。
- 连续型:概率密度 \(f(x)\),\(\int_{-\infty}^{+\infty} f(x)dx = 1\)。
- 分布函数:\(F(x) = \int_{-\infty}^{x} f(t)dt\)。\(F'(x) = f(x)\)。
- 期望 \(E(X)\):
- 离散:\(\sum x_i p_i\)
- 连续:\(\int_{-\infty}^{+\infty} x f(x) dx\)
- 方差 \(Var(X)\) 或 \(D(X)\):
- 【背诵】公式:\(Var(X) = E(X^2) - [E(X)]^2\)
- 性质:\(Var(aX+b) = a^2 Var(X)\)
2. 常见分布速查表(【背诵】参数与公式)¶
| 分布 | 记号 | 概率/密度 | \(E(X)\) | \(Var(X)\) |
|---|---|---|---|---|
| 0-1分布 | \(B(1,p)\) | \(p^k(1-p)^{1-k}\) | \(p\) | \(p(1-p)\) |
| 二项分布 | \(B(n,p)\) | \(C_n^k p^k (1-p)^{n-k}\) | \(np\) | \(np(1-p)\) |
| 泊松分布 | \(P(\lambda)\) | \(\frac{\lambda^k}{k!}e^{-\lambda}\) | \(\lambda\) | \(\lambda\) |
| 均匀分布 | \(U(a,b)\) | \(\frac{1}{b-a}\) | \(\frac{a+b}{2}\) | \(\frac{(b-a)^2}{12}\) |
| 指数分布 | \(E(\lambda)\) | \(\lambda e^{-\lambda x} (x>0)\) | \(1/\lambda\) | \(1/\lambda^2\) |
| 正态分布 | \(N(\mu, \sigma^2)\) | \(\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\) | \(\mu\) | \(\sigma^2\) |
- 易错点:指数分布参数 \(\lambda\) 是“率”,期望是倒数。
3. 二维随机变量(联合与边缘)¶
- 独立性判断:若 \(f(x,y) = f_X(x) \cdot f_Y(y)\) 对所有 x,y 成立(且区域是矩形),则独立。
- 协方差:\(Cov(X,Y) = E(XY) - E(X)E(Y)\)。若独立,Cov=0(反之不一定)。
- 相关系数:\(\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}\)。
- 二维正态:\(X,Y\) 独立的充要条件是 \(\rho=0\)(即 \(Cov=0\))。
- 求 \(Z=X+Y\) 的分布(卷积公式): $\(f_Z(z) = \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx\)$
4. 随机变量函数的分布(必考一题)¶
- 公式法(分布函数法):
- 写出 \(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)
- 将 \(g(X) \le y\) 转化为 X 的范围,代入 \(F_X(x)\) 或积分 \(f_X(x)\)。
- 求导 \(f_Y(y) = F_Y'(y)\)。
- 最值分布:
- 最大值 \(Y_{max}\) 分布函数:\([F(x)]^n\)
- 最小值 \(Y_{min}\) 分布函数:\(1 - [1-F(x)]^n\)
5. 大数定律与中心极限定理 (CLT)¶
- 辛钦大数定律:样本均值 \(\bar{X}\) 依概率收敛于总体均值 \(\mu\)。
- CLT(做题用):当 n 很大时,\(\sum X_i\) 或 \(\bar{X}\) 近似服从正态分布。
- \(\sum X_i \sim N(n\mu, n\sigma^2)\)
- \(\bar{X} \sim N(\mu, \sigma^2/n)\)
- 标准化:\(Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)\)
第三板块:统计推断(死记硬背套路)¶
覆盖题型:题型十二至二十(抽样、估计、检验)
1. 统计量与抽样分布¶
- 三大抽样分布:
- \(\chi^2\)分布:\(n\) 个标准正态平方和。\(\sum Z_i^2 \sim \chi^2(n)\)。
- \(t\) 分布:\(\frac{N(0,1)}{\sqrt{\chi^2(n)/n}} \sim t(n)\)。(典型的形式:\(\frac{\bar{X}-\mu}{S/\sqrt{n}}\))
- \(F\) 分布:\(\frac{\chi^2(n_1)/n_1}{\chi^2(n_2)/n_2} \sim F(n_1, n_2)\)。(方差比)
- 正态总体的常用结论(必考填空):
- \(\bar{X} \sim N(\mu, \sigma^2/n)\)
- \(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)
- \(\bar{X}\) 与 \(S^2\) 相互独立。
2. 点估计(必考大题)¶
- 矩估计 (MME):用样本矩等于总体矩。
- 令 \(E(X) = \bar{X}\),解出参数。如果有两个参数,再令 \(E(X^2) = \frac{1}{n}\sum X_i^2\)。
- 极大似然估计 (MLE):
- 写似然函数 \(L(\theta) = \prod_{i=1}^n f(x_i; \theta)\)。
- 取对数 \(\ln L\)。
- 求导令为0:\(\frac{d(\ln L)}{d\theta} = 0\),解出 \(\hat{\theta}\)。
- 估计量的评价:
- 无偏性:验证 \(E(\hat{\theta}) = \theta\)。
- 相合性 (一致性):当 \(n \to \infty\),\(\hat{\theta} \to \theta\)(通常看方差是否趋于0)。
3. 区间估计与假设检验(套公式)¶
记忆口诀:均值用t(方差未知)或Z(方差已知),方差用卡方。
A. 一个正态总体 \(N(\mu, \sigma^2)\)
| 目标 | 条件 | 枢轴量/统计量 (必背) | 置信区间 / 拒绝域 |
|---|---|---|---|
| 均值 \(\mu\) | \(\sigma^2\) 已知 | \(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\) | \(\bar{X} \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\) |
| 均值 \(\mu\) | \(\sigma^2\) 未知 (最常考) | \(T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)\) | \(\bar{X} \pm t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}\) |
| 方差 \(\sigma^2\) | \(\mu\) 未知 | \(\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\) | \(\chi^2 > \chi^2_{\alpha/2}\) 或 \(< \chi^2_{1-\alpha/2}\) |
B. 两个正态总体(比较)
| 目标 | 条件 | 统计量 |
|---|---|---|
| 方差比 \(\sigma_1^2/\sigma_2^2\) | (F检验) | \(F = \frac{S_1^2}{S_2^2} \sim F(n_1-1, n_2-1)\) |
| 均值差 \(\mu_1 - \mu_2\) | \(\sigma_1^2=\sigma_2^2\) 未知 | \(T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w \sqrt{1/n_1+1/n_2}}\) |
- 注:假设检验的拒绝域与置信区间是对偶的。
- 双侧检验(\(\neq\)):看 \(\alpha/2\) 分位点。
- 单侧检验(\(>\) 或 \(<\)):看 \(\alpha\) 分位点。
一小时通关策略¶
- 前20分钟:死磕 MLE(极大似然估计) 和 随机变量函数分布 (\(Y=g(X)\))。这两类大题步骤固定,分值高。
- 中间20分钟:记忆 正态总体抽样分布(均值方差分布、独立性)和 区间估计公式(尤其是 \(t\) 分布测均值,\(\chi^2\) 测方差)。这是填空题和计算题后半部分的重点。
- 后20分钟:浏览 全概率/贝叶斯 和 二维分布边缘/条件密度 的求法。如果时间不够,重点看连续型边缘密度的积分公式。
必杀技: * 遇到 \(\bar{X}\) 和 \(S\) 同时出现,马上想到 \(t\) 分布。 * 遇到 \(n \to \infty\),马上想到大数定律或中心极限定理。 * 极大似然估计忘了怎么求导?如果是单调函数(如均匀分布),直接取边界值(如 \(max(X_i)\))。
祝考试顺利!