本文最后更新于 2022年3月29日 晚上
这篇文章来源于一次作业,本文介绍了多元正态的条件分布,介绍了 Hotelling’s T2 检验与 似然比检验 (Likelihood ratio test) 的 等价性。
多元正态的条件分布
令 X=(X1,X2)′∼N(μ,Σ), 其中
Σ=(Σ11Σ21Σ12Σ22),
且 Σij=Cov(Xi,Xj) for i,j=1,2.
则有
X2∣X1∼N(μ2+Σ21Σ11−1(X1−μ1),Σ22⋅1),
其中 μ1=E(X1) 且 Σ22⋅1=Σ22−Σ21Σ11−1Σ12
证明
下面证明这个结论,证明过程参考了知乎的 回归分析|笔记整理(4)——多元正态分布理论(中). 主要思路是对方差进行变形(对角化)
首先,我们有
Σ=(Σ11Σ21Σ12Σ22)r2−Σ21Σ11−1r1(Σ11OΣ12Σ22−Σ21Σ11−1Σ12)c2−c1Σ11−1Σ12(Σ11OOΣ22⋅1)≡Λ
由于初等行变换相当于左乘一个初等矩阵,初等列变换相当于右乘一个初等矩阵,因此有
Λ=(Σ11OOΣ22⋅1)=(I−Σ21Σ11−1OI)Σ(IO−Σ11−1Σ12I)≡AΣA′
因此, Σ−1=A′Λ−1A.
对于 X 的 pdf, 有
f(X)=(2π)−2n∣Σ∣−21e−21(X−μ)′Σ−1(X−μ),
但是,我们只关心指数部分
===(X−μ)′Σ−1(X−μ)(X1′−μ1′X2′−μ2′)A′Λ−1A(X1−μ1X2−μ2)(X1′−μ1′−(Σ21Σ11−1(X1−μ1)+X2−μ2)′)Λ(X1−μ1−Σ21Σ11−1(X1−μ1)+X2−μ2)(X1−μ1)′Σ11−1(X1−μ1)+(−Σ21Σ11−1(X1−μ1)+X2−μ2)′Σ22⋅1−1(−Σ21Σ11−1(X1−μ1)+X2−μ2)
因此,从方差跟均值可以看出结论了
X2∣X1∼N(μ2+Σ21Σ11−1(X1−μ1),Σ22⋅1)
Hotelling T2
本节参考维基百科 Hotelling’s T-squared distribution, 与 Wishart distribution.
Wishart 分布
首先介绍 Wishart 分布。 Wishart 分布是 χ2 分布在多元正态情况下的推广。其定义为
令 G 为一个 p×n 的矩阵, 其每一列 Gi为来自于多元正态 Np(0,V) 的相互独立的随机向量。则定义
W=GG′=i=1∑nGiGi′∼Wp(V,n)
其中 Wp(V,n) 就是 Wishart 分布,其中 n 叫做自由度,V 是缩放矩阵。当 p=1, V=1 的时候就是一元的 χ2 分布。
Hotelling’s T2
Hotelling’s T2, 顾名思义,就是 t 分布在多元正态情况下的推广。其定义为
若 d∼Np(0,I), M 是一个 p×p 的矩阵,与 d 独立,且 M∼Wp(I,m),则如下的二次型
X=md′M−1d∼T2(p,m)
服从参数为 p 和 m 的 Hotelling T2 分布。
注意到 X=d′(M/m)−1d, 可以看出 Hotelling’s T2 分布是 t 分布 t=Z/(χ2/n)在多元条件下的推广(t2).
t 分布与 F 分布有关系 t2(n)=F(1,n), Hotelling’s T2 也与 F 分布有关系
T2∼T2(p,n−1)=n−pp(n−1)F(p,n−p)
Hotelling’s t2 统计量
令 xi, i=1,2,⋯,n 为独立同分布来自于多元正态 Np(μ,Σ) 的随机向量,样本均值为
xˉ=n1i=1∑nxi
样本方差为:
S=n−11i=1∑n(xi−xˉ)(xi−xˉ)’
则有 xˉ 与 S 独立,且
t2=(xˉ−μ)′S−1(xˉ−μ)∼T2(p,n−1)
Hotelling’s T2 检验与 似然比检验的等价性。
本部分参考 https://www.stat.ncsu.edu/people/bloomfield/courses/st784/twa-05-1.pdf
注意到上述的 t2 统计量可以用于检验总体均值是否为 μ.
假设 xi, i=1,⋯,n 为独立同分布来自于 Np(μ,Σ) 的随机样本,我们要检验
H0:μ=μ0vs.H1:μ=μ0
我们可以使用似然比检验或者 T2 检验,这两者是等价的。
T2 检验
统计量为
t2=(xˉ−μ0)′S−1(xˉ−μ0)∼T2(p,n−1)
似然比检验 (Likelihood ratio test)
似然函数为
L(μ,Σ)=i=1∏nf(xi)=(2π∣Σ∣)−2nexp{−21i=1∑n(xi−μ)′Σ−1(x−μ)}
Λ=maxμ,ΣL(μ,Σ)maxΣL(μ0,Σ)
在 H0 成立的条件下, 对于 L(μ0,Σ), 有
Σ^ω=n1i=1∑n(xi−μ0)(xi−μ0)′
从而 L(μ0,Σ^ω) 的指数部分为(忽略常系数)
D=======i=1∑n(xi−μ0)′Σ^ω−1(xi−μ0)tr(D)tr(i=1∑nΣ^ω−1(xi−μ0)(xi−μ0)′)tr(Σ^ω−1i=1∑n(xi−μ0)(xi−μ0)′)trn[i=1∑n(xi−μ0)(xi−μ0)′]−1[i=1∑n(xi−μ0)(xi−μ0)′]tr(nIp)np
第二个等号是因为注意到 D 是一个数,所以 D=tr(D),第三个等号是因为注意到 tr(AB)=tr(BA), 对于任意的 A,B 矩阵成立(只要可以相乘),再令
A=(xi−μ0)′, B=Σ^ω−1(xi−μ0).
因此
L(μ0,Σ^ω)=(2π∣Σ^ω∣)−2nexp(−2pn)
同理, L(μ,Σ)的参数估计为 μ^=xˉ,
Σ^=n1i=1∑n(xi−xˉ)(xi−xˉ)′
并且
L(xˉ,Σ^)=(2π∣Σ^∣)−2nexp(−2pn)
因而有
Λ=L(xˉ,Σ^)L(μ0,Σ^ω)=∣Σ^∣−2n∣Σ^ω∣−2n=∣Σ^ω∣2n∣Σ^∣2n
从而,有(注意到我们丢掉了系数 n1)
Λn2=∣Σ^ω∣∣Σ^∣=∣∑i=1n(xi−μ0)(xi−μ0)′∣∣∑i=1n(xi−xˉ)(xi−xˉ)′∣
注意到
====i=1∑n(xi−μ0)(xi−μ0)′i=1∑n(xi−xˉ+xˉ−μ0)(xi−xˉ+xˉ−μ0)′i=1∑n(xi−xˉ)(xi−xˉ)′+n(xˉ−μ0)(xˉ−μ0)′(n−1)S+n(xˉ−μ0)(xˉ−μ0)′(n−1)S[Ip+[(n−1)S]−1n(xˉ−μ0)(xˉ−μ0)′]
根据 Weinstein–Aronszajn identity,
det(Im+AB)=det(In+BA)
这个等式的证明过程跟我们证明多元正态的条件分布时候对角化方差的过程基本一致。构造辅助矩阵
M=(ImB−AIn)
然后通过两种方式算 M 的行列式,一种是把 B 所在位置化成0, 另一种是把 A 所在位置化成0。
下面回到我们的证明,令 A=[(n−1)S]−1n(xˉ−μ0), B=(xˉ−μ0)′, 有
∣Ip+[(n−1)S]−1n(xˉ−μ0)(xˉ−μ0)′∣=∣1+(xˉ−μ0)′[(n−1)S]−1n(xˉ−μ0)∣=1+(n−1)T2
我们有
Λn2====∣∑i=1n(xi−μ0)(xi−μ0)′∣∣∑i=1n(xi−xˉ)(xi−xˉ)′∣∣(n−1)S∣∣Ip+[(n−1)S]−1n(xˉ−μ0)(xˉ−μ0)′∣∣(n−1)S∣∣Ip+[(n−1)S]−1n(xˉ−μ0)(xˉ−μ0)′∣11+(n−1)T21
到这里,我们的结论就证明完了,这两种检验确实互相等价。整理一下,有
Λ−n2=1+n−1T2