跳转至

概统

这份复习指南是基于你提供的PDF(2020-2025年真题解析)整理的一小时极速通关版

为了在短时间内掌握,我们将内容重组为三大板块概率计算(基础拿分)分布与统计量(核心难点)统计推断(套路题)

请拿出纸笔,重点记忆标有 【背诵】 的公式。


第一板块:概率计算(送分题,必须拿满)

覆盖题型:题型一、二、三(古典、几何、全概、贝叶斯)

1. 基础公式

  • 加法公式\(P(A \cup B) = P(A) + P(B) - P(AB)\)
  • 减法公式\(P(A - B) = P(A) - P(AB)\)
  • 条件概率\(P(B|A) = \frac{P(AB)}{P(A)}\)
  • 独立性:若 A, B 独立,则 \(P(AB) = P(A)P(B)\)
    • 考点提醒\(P(A \cup B) = 1 - P(\bar{A})P(\bar{B})\) (常用于“至少发生一个”)

2. 全概率与贝叶斯(必考大题)

  • 场景:分阶段发生的事情。第一阶段有多种情况 \(B_1, B_2...\)(完备事件组),第二阶段是事件 A。
  • 全概率公式(求结果): $\(P(A) = \sum P(B_i)P(A|B_i)\)$
  • 贝叶斯公式(求原因/逆概):已知 A 发生了,求它是 \(B_k\) 导致的概率。 $\(P(B_k|A) = \frac{P(B_k)P(A|B_k)}{\sum P(B_i)P(A|B_i)} = \frac{\text{分枝}}{\text{总和}}\)$

第二板块:随机变量及其分布(核心计算)

覆盖题型:题型四至十一(分布、期望、方差、大数定律)

1. 一维分布(离散 vs 连续)

  • 离散型:画分布律表格,\(\sum p_i = 1\)
  • 连续型:概率密度 \(f(x)\)\(\int_{-\infty}^{+\infty} f(x)dx = 1\)
    • 分布函数\(F(x) = \int_{-\infty}^{x} f(t)dt\)\(F'(x) = f(x)\)
  • 期望 \(E(X)\)
    • 离散:\(\sum x_i p_i\)
    • 连续:\(\int_{-\infty}^{+\infty} x f(x) dx\)
  • 方差 \(Var(X)\)\(D(X)\)
    • 【背诵】公式\(Var(X) = E(X^2) - [E(X)]^2\)
    • 性质\(Var(aX+b) = a^2 Var(X)\)

2. 常见分布速查表(【背诵】参数与公式)

分布 记号 概率/密度 \(E(X)\) \(Var(X)\)
0-1分布 \(B(1,p)\) \(p^k(1-p)^{1-k}\) \(p\) \(p(1-p)\)
二项分布 \(B(n,p)\) \(C_n^k p^k (1-p)^{n-k}\) \(np\) \(np(1-p)\)
泊松分布 \(P(\lambda)\) \(\frac{\lambda^k}{k!}e^{-\lambda}\) \(\lambda\) \(\lambda\)
均匀分布 \(U(a,b)\) \(\frac{1}{b-a}\) \(\frac{a+b}{2}\) \(\frac{(b-a)^2}{12}\)
指数分布 \(E(\lambda)\) \(\lambda e^{-\lambda x} (x>0)\) \(1/\lambda\) \(1/\lambda^2\)
正态分布 \(N(\mu, \sigma^2)\) \(\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\) \(\mu\) \(\sigma^2\)
  • 易错点:指数分布参数 \(\lambda\) 是“率”,期望是倒数。

3. 二维随机变量(联合与边缘)

  • 独立性判断:若 \(f(x,y) = f_X(x) \cdot f_Y(y)\) 对所有 x,y 成立(且区域是矩形),则独立。
  • 协方差\(Cov(X,Y) = E(XY) - E(X)E(Y)\)。若独立,Cov=0(反之不一定)。
  • 相关系数\(\rho_{XY} = \frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}\)
  • 二维正态\(X,Y\) 独立的充要条件是 \(\rho=0\)(即 \(Cov=0\))。
  • \(Z=X+Y\) 的分布(卷积公式): $\(f_Z(z) = \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx\)$

4. 随机变量函数的分布(必考一题)

  • 公式法(分布函数法)
    1. 写出 \(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)
    2. \(g(X) \le y\) 转化为 X 的范围,代入 \(F_X(x)\) 或积分 \(f_X(x)\)
    3. 求导 \(f_Y(y) = F_Y'(y)\)
  • 最值分布
    • 最大值 \(Y_{max}\) 分布函数:\([F(x)]^n\)
    • 最小值 \(Y_{min}\) 分布函数:\(1 - [1-F(x)]^n\)

5. 大数定律与中心极限定理 (CLT)

  • 辛钦大数定律:样本均值 \(\bar{X}\) 依概率收敛于总体均值 \(\mu\)
  • CLT(做题用):当 n 很大时,\(\sum X_i\)\(\bar{X}\) 近似服从正态分布。
    • \(\sum X_i \sim N(n\mu, n\sigma^2)\)
    • \(\bar{X} \sim N(\mu, \sigma^2/n)\)
    • 标准化:\(Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)\)

第三板块:统计推断(死记硬背套路)

覆盖题型:题型十二至二十(抽样、估计、检验)

1. 统计量与抽样分布

  • 三大抽样分布
    1. \(\chi^2\)分布\(n\) 个标准正态平方和。\(\sum Z_i^2 \sim \chi^2(n)\)
    2. \(t\) 分布\(\frac{N(0,1)}{\sqrt{\chi^2(n)/n}} \sim t(n)\)。(典型的形式:\(\frac{\bar{X}-\mu}{S/\sqrt{n}}\)
    3. \(F\) 分布\(\frac{\chi^2(n_1)/n_1}{\chi^2(n_2)/n_2} \sim F(n_1, n_2)\)。(方差比)
  • 正态总体的常用结论(必考填空)
    • \(\bar{X} \sim N(\mu, \sigma^2/n)\)
    • \(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)
    • \(\bar{X}\)\(S^2\) 相互独立

2. 点估计(必考大题)

  • 矩估计 (MME):用样本矩等于总体矩。
    • \(E(X) = \bar{X}\),解出参数。如果有两个参数,再令 \(E(X^2) = \frac{1}{n}\sum X_i^2\)
  • 极大似然估计 (MLE)
    1. 写似然函数 \(L(\theta) = \prod_{i=1}^n f(x_i; \theta)\)
    2. 取对数 \(\ln L\)
    3. 求导令为0:\(\frac{d(\ln L)}{d\theta} = 0\),解出 \(\hat{\theta}\)
  • 估计量的评价
    • 无偏性:验证 \(E(\hat{\theta}) = \theta\)
    • 相合性 (一致性):当 \(n \to \infty\)\(\hat{\theta} \to \theta\)(通常看方差是否趋于0)。

3. 区间估计与假设检验(套公式)

记忆口诀:均值用t(方差未知)或Z(方差已知),方差用卡方。

A. 一个正态总体 \(N(\mu, \sigma^2)\)

目标 条件 枢轴量/统计量 (必背) 置信区间 / 拒绝域
均值 \(\mu\) \(\sigma^2\) 已知 \(Z = \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)\) \(\bar{X} \pm z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\)
均值 \(\mu\) \(\sigma^2\) 未知 (最常考) \(T = \frac{\bar{X}-\mu}{S/\sqrt{n}} \sim t(n-1)\) \(\bar{X} \pm t_{\alpha/2}(n-1)\frac{S}{\sqrt{n}}\)
方差 \(\sigma^2\) \(\mu\) 未知 \(\chi^2 = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\) \(\chi^2 > \chi^2_{\alpha/2}\)\(< \chi^2_{1-\alpha/2}\)

B. 两个正态总体(比较)

目标 条件 统计量
方差比 \(\sigma_1^2/\sigma_2^2\) (F检验) \(F = \frac{S_1^2}{S_2^2} \sim F(n_1-1, n_2-1)\)
均值差 \(\mu_1 - \mu_2\) \(\sigma_1^2=\sigma_2^2\) 未知 \(T = \frac{(\bar{X}-\bar{Y}) - (\mu_1-\mu_2)}{S_w \sqrt{1/n_1+1/n_2}}\)
  • 注:假设检验的拒绝域与置信区间是对偶的。
    • 双侧检验(\(\neq\)):看 \(\alpha/2\) 分位点。
    • 单侧检验(\(>\)\(<\)):看 \(\alpha\) 分位点。

一小时通关策略

  1. 前20分钟:死磕 MLE(极大似然估计)随机变量函数分布 (\(Y=g(X)\))。这两类大题步骤固定,分值高。
  2. 中间20分钟:记忆 正态总体抽样分布(均值方差分布、独立性)和 区间估计公式(尤其是 \(t\) 分布测均值,\(\chi^2\) 测方差)。这是填空题和计算题后半部分的重点。
  3. 后20分钟:浏览 全概率/贝叶斯二维分布边缘/条件密度 的求法。如果时间不够,重点看连续型边缘密度的积分公式。

必杀技: * 遇到 \(\bar{X}\)\(S\) 同时出现,马上想到 \(t\) 分布。 * 遇到 \(n \to \infty\),马上想到大数定律或中心极限定理。 * 极大似然估计忘了怎么求导?如果是单调函数(如均匀分布),直接取边界值(如 \(max(X_i)\))。

祝考试顺利!