📘 MIT 18.650 PSet6 知识总结
主题:假设检验、Student 检验与独立性检验
🧩 一、假设检验(Hypothesis Testing)基础
1️⃣ 基本概念
-
假设(Hypothesis):
对总体参数的声明。例如:
H0:λ=λ0vsH1:λ=λ0
其中 (H_0) 是“原假设”,(H_1) 是“备择假设”。
-
检验统计量(Test Statistic):
由样本构造的函数,用于度量数据与 (H_0) 的偏离程度。
-
拒绝域(Critical Region):
使 (H_0) 被拒绝的统计量取值范围。
-
显著性水平(Significance level):
(α=P(Reject H0∣H0 true)),即第一类错误概率。
-
p-value(显著性概率):
在 (H_0) 下观察到当前统计量或更极端值的概率。
若 p-value < α,则拒绝 (H_0)。
🧮 二、指数分布的参数检验(Problem 1)
分布特性:
若 (Xi∼Exp(λ)),则:
E(Xi)=1/λ,Var(Xi)=1/λ2.
样本均值:
Xˉ=n1∑Xi,E(Xˉ)=1/λ,Var(Xˉ)=nλ21.
1️⃣ 参数估计
最大似然估计(MLE):
λ^=Xˉ1.
2️⃣ 渐近分布(Delta 方法)
由中心极限定理:
n(Xˉ−1/λ)dN(0,,1/λ2).
应用 Delta 方法 (g(x)=1/x) 得:
n(λ^−λ)dN(0,,λ2).
3️⃣ 构造检验
-
两侧检验:
H0:λ=λ0,H1:λ=λ0.
检验统计量:
Z=λ0n(λ^−λ0)∼N(0,1).
拒绝域:(∣Z∣>z1−α/2)。
-
单侧检验:
H0:λ≤λ0,H1:λ>λ0.
拒绝域:(Z>z1−α)。
4️⃣ 案例应用:呼叫中心问题
样本均值 (Xˉ=0.98,n=50)。
λ^=1/0.98=1.0204,Z=50(λ^−1)=0.1443.
因为 (Z=0.1443<1.645),p-value ≈ 0.44 → 不拒绝 (H_0)。
🎓 三、Student’s t 检验(Problem 2)
1️⃣ 背景
样本 (X1,…,Xn∼N(μ,σ2))。
目标:检验
H0:μ>0,H1:μ≤0.
2️⃣ 样本统计量
经典结论:
S/nXˉ−μ∼tn−1.
3️⃣ 检验构造
在边界点 (μ=0) 下,定义统计量:
T=SnXˉ.
单侧(左尾)检验:
H0:μ>0,H1:μ≤0.
拒绝域:
T≤tn−1,α.
该检验是非渐近(精确)水平 α的,因为 (T) 在边界处精确服从 t 分布。
4️⃣ 应用与解释
- t 检验是小样本下均值检验的标准方法。
- 适用于未知方差情形。
- 若样本量大,可用 (Z)-检验近似。
🧠 四、独立性检验(Problem 3)
1️⃣ 理论背景
若 (X,Y) 为 Bernoulli:
p=P(X=1), q=P(Y=1), r=P(X=1,Y=1).
独立当且仅当 (r=pq)。
2️⃣ 样本估计与渐近正态性
p^=n1∑Xi,q^=n1∑Yi,r^=n1∑XiYi.
由 CLT:
n((p^,q^,r^)−(p,q,r))dN(0,Σ),
(\Sigma) 由单个样本协方差组成。
3️⃣ Delta 方法检验量
定义 (g(p,q,r)=r-pq),独立时 (g(p,q,r)=0)。
梯度:
∇g=(−q,−p,1).
渐近方差:
V=∇g⊤Σ∇g.
若 (H_0:r=pq),化简后:
V=pq(1−p)(1−q).
一致估计:
V^=p^q^(1−p^)(1−q^).
4️⃣ 检验统计量
Tn=V^n(r^−p^q^)∼N(0,1) (under H0).
- 拒绝域(双侧):
(∣Tn∣>z1−α/2)。
- p 值:
(p=2(1−Φ(∣Tn∣)))。
5️⃣ 案例计算(幸福与恋爱)
样本量 (n=1000):
p^=0.384,q^=0.506,r^=0.205.
r^−p^q^=0.0107,V^=0.0591.
Tn=0.05911000×0.0107≈1.39.
p-value ≈ 0.164 → 不拒绝独立性。
📊 五、三题的知识结构图(总结)
| 内容 |
样本分布 |
参数 |
检验目标 |
检验统计量 |
分布 |
是否渐近 |
拒绝域 |
|
|
| Problem 1 |
指数Exp(λ) |
λ |
均值差异 |
(Z=λ0n(λ^−λ0)) |
N(0,1) |
✅ 渐近 |
|
Z |
>z₍₁−α/2₎ |
| Problem 2 |
正态N(μ,σ²) |
μ |
均值方向 |
(T=SnXˉ) |
t₍n−1₎ |
❌ 精确 |
T ≤ t₍n−1,α₎ |
|
|
| Problem 3 |
伯努利对 (X,Y) |
p,q,r |
独立性 |
(T=V^n(r^−p^q^)) |
N(0,1) |
✅ 渐近 |
|
T |
>z₍₁−α/2₎ |
📚 六、拓展知识
-
似然比检验(Likelihood Ratio Test, LRT)
- 许多检验(包括指数族参数检验)可由 LRT 导出。
- 大样本下 LRT 统计量近似服从 (χk2)。
-
Wald 检验与 Score 检验
- Wald:((θ^−θ0)/se(θ^))。
- Score:基于导数信息的检验(信息矩阵)。
-
渐近 vs 非渐近
- 渐近检验依赖 CLT(大样本正态性)。
- 非渐近检验(如 t 检验)在小样本下精确。
-
多元 Delta 方法
🧾 七、结论要点
- 假设检验的核心是 构造统计量 + 确定分布 + 设定拒绝域。
- 对指数族参数(如 Exp、Normal)常用 MLE + CLT。
- t 检验是唯一保留小样本精确性的常用检验。
- 独立性检验(Bernoulli)本质是用 CLT + Delta 方法推导相关系数的近似分布。