📘 MIT 18.650 PSet6 知识总结

主题：假设检验、Student 检验与独立性检验

🧩 一、假设检验（Hypothesis Testing）基础

1️⃣ 基本概念

假设（Hypothesis）：
对总体参数的声明。例如：

$H_0: \lambda = \lambda_0 \quad\text{vs}\quad H_1: \lambda \ne \lambda_0$

其中 (H_0) 是“原假设”，(H_1) 是“备择假设”。
检验统计量（Test Statistic）：
由样本构造的函数，用于度量数据与 (H_0) 的偏离程度。
拒绝域（Critical Region）：
使 (H_0) 被拒绝的统计量取值范围。
显著性水平（Significance level）：
( $\alpha = P(\text{Reject }H_0 | H_0\text{ true})$ )，即第一类错误概率。
p-value（显著性概率）：
在 (H_0) 下观察到当前统计量或更极端值的概率。
若 p-value < α，则拒绝 (H_0)。

🧮 二、指数分布的参数检验（Problem 1）

分布特性：

若 ( $X_i\sim\mathrm{Exp}(\lambda)$ )，则：

$E(X_i)=1/\lambda,\quad \mathrm{Var}(X_i)=1/\lambda^2.$

样本均值：

$\bar X = \frac{1}{n}\sum X_i,\quad E(\bar X)=1/\lambda,\quad \mathrm{Var}(\bar X)=\frac{1}{n\lambda^2}.$

1️⃣ 参数估计

最大似然估计（MLE）：

$\hat\lambda = \frac{1}{\bar X}.$

2️⃣ 渐近分布（Delta 方法）

由中心极限定理：

$\sqrt{n}(\bar X - 1/\lambda)\xrightarrow{d} N\big(0,,1/\lambda^2\big).$

应用 Delta 方法 (g(x)=1/x) 得：

$\sqrt{n}(\hat\lambda - \lambda)\xrightarrow{d} N(0,,\lambda^2).$

3️⃣ 构造检验

两侧检验：

$H_0: \lambda=\lambda_0,\quad H_1: \lambda\ne\lambda_0.$

检验统计量：

$Z = \frac{\sqrt{n}(\hat\lambda-\lambda_0)}{\lambda_0}\sim N(0,1).$

拒绝域：( $|Z|>z_{1-\alpha/2}$ )。
单侧检验：

$H_0: \lambda\le\lambda_0,\quad H_1:\lambda>\lambda_0.$

拒绝域：( $Z>z_{1-\alpha}$ )。

4️⃣ 案例应用：呼叫中心问题

样本均值 ( $\bar X=0.98, n=50$ )。

$\hat\lambda=1/0.98=1.0204,\quad Z=\sqrt{50}(\hat\lambda-1)=0.1443.$

因为 (Z=0.1443<1.645)，p-value ≈ 0.44 → 不拒绝 (H_0)。

🎓 三、Student’s t 检验（Problem 2）

1️⃣ 背景

样本 ( $X_1,\dots,X_n\sim N(\mu,\sigma^2)$ )。

目标：检验

$H_0: \mu>0,\quad H_1: \mu\le0.$

2️⃣ 样本统计量

样本均值：( $\bar X=\frac{1}{n}\sum X_i$ )
样本标准差：
$S^2 = \frac{1}{n-1}\sum (X_i-\bar X)^2$

经典结论：

$\frac{\bar X-\mu}{S/\sqrt{n}} \sim t_{n-1}.$

3️⃣ 检验构造

在边界点 ( $\mu=0$ ) 下，定义统计量：

$T = \frac{\sqrt{n}\bar X}{S}.$

单侧（左尾）检验：

$H_0:\mu>0,\quad H_1:\mu\le0.$

拒绝域：

$T \le t_{n-1,\alpha}.$

该检验是非渐近（精确）水平 α的，因为 (T) 在边界处精确服从 t 分布。

4️⃣ 应用与解释

t 检验是小样本下均值检验的标准方法。
适用于未知方差情形。
若样本量大，可用 (Z)-检验近似。

🧠 四、独立性检验（Problem 3）

1️⃣ 理论背景

若 (X,Y) 为 Bernoulli：

$p=P(X=1),\ q=P(Y=1),\ r=P(X=1,Y=1).$

独立当且仅当 (r=pq)。

2️⃣ 样本估计与渐近正态性

$\hat p=\frac{1}{n}\sum X_i,\quad \hat q=\frac{1}{n}\sum Y_i,\quad \hat r=\frac{1}{n}\sum X_iY_i.$

由 CLT：

$\sqrt{n}\big((\hat p,\hat q,\hat r)-(p,q,r)\big)\xrightarrow{d}N(0,\Sigma),$

(\Sigma) 由单个样本协方差组成。

3️⃣ Delta 方法检验量

定义 (g(p,q,r)=r-pq)，独立时 (g(p,q,r)=0)。
梯度：

$\nabla g=(-q,-p,1).$

渐近方差：

$V = \nabla g^\top \Sigma \nabla g.$

若 (H_0:r=pq)，化简后：

$V=pq(1-p)(1-q).$

一致估计：

$\hat V=\hat p\hat q(1-\hat p)(1-\hat q).$

4️⃣ 检验统计量

$T_n = \frac{\sqrt{n}(\hat r-\hat p\hat q)}{\sqrt{\hat V}}\sim N(0,1)\text{ (under }H_0\text{)}.$

拒绝域（双侧）：
( $|T_n|>z_{1-\alpha/2}$ )。
p 值：
( $p=2(1-\Phi(|T_n|))$ )。

5️⃣ 案例计算（幸福与恋爱）

样本量 (n=1000)：

$\hat p=0.384,\quad \hat q=0.506,\quad \hat r=0.205.$

$\hat r-\hat p\hat q = 0.0107,\quad \hat V = 0.0591.$

$T_n = \frac{\sqrt{1000}\times0.0107}{\sqrt{0.0591}}\approx1.39.$

p-value ≈ 0.164 → 不拒绝独立性。

📊 五、三题的知识结构图（总结）

内容	样本分布	参数	检验目标	检验统计量	分布	是否渐近	拒绝域
Problem 1	指数Exp(λ)	λ	均值差异	( $Z=\frac{\sqrt{n}(\hat\lambda-\lambda_0)}{\lambda_0}$ )	N(0,1)	✅ 渐近		Z	>z₍₁−α/2₎
Problem 2	正态N(μ,σ²)	μ	均值方向	( $T=\frac{\sqrt{n}\bar X}{S}$ )	t₍n−1₎	❌ 精确	T ≤ t₍n−1,α₎
Problem 3	伯努利对 (X,Y)	p,q,r	独立性	( $T=\frac{\sqrt{n}(\hat r-\hat p\hat q)}{\sqrt{\hat V}}$ )	N(0,1)	✅ 渐近		T	>z₍₁−α/2₎

📚 六、拓展知识

似然比检验（Likelihood Ratio Test, LRT）
- 许多检验（包括指数族参数检验）可由 LRT 导出。
- 大样本下 LRT 统计量近似服从 ( $\chi^2_k$ )。
Wald 检验与 Score 检验
- Wald：( $(\hat\theta-\theta_0)/\mathrm{se}(\hat\theta)$ )。
- Score：基于导数信息的检验（信息矩阵）。
渐近 vs 非渐近
- 渐近检验依赖 CLT（大样本正态性）。
- 非渐近检验（如 t 检验）在小样本下精确。
多元 Delta 方法
- 对向量估计函数的近似正态分布提供渐近方差。

🧾 七、结论要点

假设检验的核心是 构造统计量 + 确定分布 + 设定拒绝域。
对指数族参数（如 Exp、Normal）常用 MLE + CLT。
t 检验是唯一保留小样本精确性的常用检验。
独立性检验（Bernoulli）本质是用 CLT + Delta 方法推导相关系数的近似分布。