📘 MIT 18.650 PSet6 知识总结

主题:假设检验、Student 检验与独立性检验


🧩 一、假设检验(Hypothesis Testing)基础

1️⃣ 基本概念

  • 假设(Hypothesis)
    对总体参数的声明。例如:

    H0:λ=λ0vsH1:λλ0H_0: \lambda = \lambda_0 \quad\text{vs}\quad H_1: \lambda \ne \lambda_0

    其中 (H_0) 是“原假设”,(H_1) 是“备择假设”。

  • 检验统计量(Test Statistic)
    由样本构造的函数,用于度量数据与 (H_0) 的偏离程度。

  • 拒绝域(Critical Region)
    使 (H_0) 被拒绝的统计量取值范围。

  • 显著性水平(Significance level)
    (α=P(Reject H0H0 true)\alpha = P(\text{Reject }H_0 | H_0\text{ true})),即第一类错误概率

  • p-value(显著性概率)
    在 (H_0) 下观察到当前统计量或更极端值的概率。
    若 p-value < α,则拒绝 (H_0)。


🧮 二、指数分布的参数检验(Problem 1)

分布特性:

若 (XiExp(λ)X_i\sim\mathrm{Exp}(\lambda)),则:

E(Xi)=1/λ,Var(Xi)=1/λ2.E(X_i)=1/\lambda,\quad \mathrm{Var}(X_i)=1/\lambda^2.

样本均值:

Xˉ=1nXi,E(Xˉ)=1/λ,Var(Xˉ)=1nλ2.\bar X = \frac{1}{n}\sum X_i,\quad E(\bar X)=1/\lambda,\quad \mathrm{Var}(\bar X)=\frac{1}{n\lambda^2}.


1️⃣ 参数估计

最大似然估计(MLE):

λ^=1Xˉ.\hat\lambda = \frac{1}{\bar X}.


2️⃣ 渐近分布(Delta 方法)

由中心极限定理:

n(Xˉ1/λ)dN(0,,1/λ2).\sqrt{n}(\bar X - 1/\lambda)\xrightarrow{d} N\big(0,,1/\lambda^2\big).

应用 Delta 方法 (g(x)=1/x) 得:

n(λ^λ)dN(0,,λ2).\sqrt{n}(\hat\lambda - \lambda)\xrightarrow{d} N(0,,\lambda^2).


3️⃣ 构造检验

  • 两侧检验:

    H0:λ=λ0,H1:λλ0.H_0: \lambda=\lambda_0,\quad H_1: \lambda\ne\lambda_0.

    检验统计量:

    Z=n(λ^λ0)λ0N(0,1).Z = \frac{\sqrt{n}(\hat\lambda-\lambda_0)}{\lambda_0}\sim N(0,1).

    拒绝域:(Z>z1α/2|Z|>z_{1-\alpha/2})。

  • 单侧检验:

    H0:λλ0,H1:λ>λ0.H_0: \lambda\le\lambda_0,\quad H_1:\lambda>\lambda_0.

    拒绝域:(Z>z1αZ>z_{1-\alpha})。


4️⃣ 案例应用:呼叫中心问题

样本均值 (Xˉ=0.98,n=50\bar X=0.98, n=50)。

λ^=1/0.98=1.0204,Z=50(λ^1)=0.1443.\hat\lambda=1/0.98=1.0204,\quad Z=\sqrt{50}(\hat\lambda-1)=0.1443.

因为 (Z=0.1443<1.645),p-value ≈ 0.44 → 不拒绝 (H_0)


🎓 三、Student’s t 检验(Problem 2)

1️⃣ 背景

样本 (X1,,XnN(μ,σ2)X_1,\dots,X_n\sim N(\mu,\sigma^2))。

目标:检验

H0:μ>0,H1:μ0.H_0: \mu>0,\quad H_1: \mu\le0.


2️⃣ 样本统计量

  • 样本均值:(Xˉ=1nXi\bar X=\frac{1}{n}\sum X_i)
  • 样本标准差:

    S2=1n1(XiXˉ)2S^2 = \frac{1}{n-1}\sum (X_i-\bar X)^2

经典结论:

XˉμS/ntn1.\frac{\bar X-\mu}{S/\sqrt{n}} \sim t_{n-1}.


3️⃣ 检验构造

在边界点 (μ=0\mu=0) 下,定义统计量:

T=nXˉS.T = \frac{\sqrt{n}\bar X}{S}.

单侧(左尾)检验:

H0:μ>0,H1:μ0.H_0:\mu>0,\quad H_1:\mu\le0.

拒绝域:

Ttn1,α.T \le t_{n-1,\alpha}.

该检验是非渐近(精确)水平 α的,因为 (T) 在边界处精确服从 t 分布。


4️⃣ 应用与解释

  • t 检验是小样本下均值检验的标准方法
  • 适用于未知方差情形。
  • 若样本量大,可用 (Z)-检验近似。

🧠 四、独立性检验(Problem 3)

1️⃣ 理论背景

若 (X,Y) 为 Bernoulli:

p=P(X=1), q=P(Y=1), r=P(X=1,Y=1).p=P(X=1),\ q=P(Y=1),\ r=P(X=1,Y=1).

独立当且仅当 (r=pq)。


2️⃣ 样本估计与渐近正态性

p^=1nXi,q^=1nYi,r^=1nXiYi.\hat p=\frac{1}{n}\sum X_i,\quad \hat q=\frac{1}{n}\sum Y_i,\quad \hat r=\frac{1}{n}\sum X_iY_i.

由 CLT:

n((p^,q^,r^)(p,q,r))dN(0,Σ),\sqrt{n}\big((\hat p,\hat q,\hat r)-(p,q,r)\big)\xrightarrow{d}N(0,\Sigma),

(\Sigma) 由单个样本协方差组成。


3️⃣ Delta 方法检验量

定义 (g(p,q,r)=r-pq),独立时 (g(p,q,r)=0)。
梯度:

g=(q,p,1).\nabla g=(-q,-p,1).

渐近方差:

V=gΣg.V = \nabla g^\top \Sigma \nabla g.

若 (H_0:r=pq),化简后:

V=pq(1p)(1q).V=pq(1-p)(1-q).

一致估计:

V^=p^q^(1p^)(1q^).\hat V=\hat p\hat q(1-\hat p)(1-\hat q).


4️⃣ 检验统计量

Tn=n(r^p^q^)V^N(0,1) (under H0).T_n = \frac{\sqrt{n}(\hat r-\hat p\hat q)}{\sqrt{\hat V}}\sim N(0,1)\text{ (under }H_0\text{)}.

  • 拒绝域(双侧):
    (Tn>z1α/2|T_n|>z_{1-\alpha/2})。
  • p 值:
    (p=2(1Φ(Tn))p=2(1-\Phi(|T_n|)))。

5️⃣ 案例计算(幸福与恋爱)

样本量 (n=1000):

p^=0.384,q^=0.506,r^=0.205.\hat p=0.384,\quad \hat q=0.506,\quad \hat r=0.205.

r^p^q^=0.0107,V^=0.0591.\hat r-\hat p\hat q = 0.0107,\quad \hat V = 0.0591.

Tn=1000×0.01070.05911.39.T_n = \frac{\sqrt{1000}\times0.0107}{\sqrt{0.0591}}\approx1.39.

p-value ≈ 0.164 → 不拒绝独立性


📊 五、三题的知识结构图(总结)

内容 样本分布 参数 检验目标 检验统计量 分布 是否渐近 拒绝域
Problem 1 指数Exp(λ) λ 均值差异 (Z=n(λ^λ0)λ0Z=\frac{\sqrt{n}(\hat\lambda-\lambda_0)}{\lambda_0}) N(0,1) ✅ 渐近 Z >z₍₁−α/2₎
Problem 2 正态N(μ,σ²) μ 均值方向 (T=nXˉST=\frac{\sqrt{n}\bar X}{S}) t₍n−1₎ ❌ 精确 T ≤ t₍n−1,α₎
Problem 3 伯努利对 (X,Y) p,q,r 独立性 (T=n(r^p^q^)V^T=\frac{\sqrt{n}(\hat r-\hat p\hat q)}{\sqrt{\hat V}}) N(0,1) ✅ 渐近 T >z₍₁−α/2₎

📚 六、拓展知识

  1. 似然比检验(Likelihood Ratio Test, LRT)

    • 许多检验(包括指数族参数检验)可由 LRT 导出。
    • 大样本下 LRT 统计量近似服从 (χk2\chi^2_k)。
  2. Wald 检验与 Score 检验

    • Wald:((θ^θ0)/se(θ^)(\hat\theta-\theta_0)/\mathrm{se}(\hat\theta))。
    • Score:基于导数信息的检验(信息矩阵)。
  3. 渐近 vs 非渐近

    • 渐近检验依赖 CLT(大样本正态性)。
    • 非渐近检验(如 t 检验)在小样本下精确。
  4. 多元 Delta 方法

    • 对向量估计函数的近似正态分布提供渐近方差。

🧾 七、结论要点

  • 假设检验的核心是 构造统计量 + 确定分布 + 设定拒绝域
  • 对指数族参数(如 Exp、Normal)常用 MLE + CLT。
  • t 检验是唯一保留小样本精确性的常用检验。
  • 独立性检验(Bernoulli)本质是用 CLT + Delta 方法推导相关系数的近似分布。