EM 算法与高斯混合模型 (GMM)
核心思想
EM (Expectation-Maximization) 是一种用于含隐变量的概率模型的参数估计迭代算法。GMM 是 EM 最经典的应用:用多个高斯分布的加权和来建模数据分布。
高斯混合模型
模型定义
:第 个高斯的混合系数, , :多元高斯密度
隐变量
引入隐变量
为什么不能直接 MLE?
对数似然:
对数内有求和,无法分解,直接求导没有闭式解。
EM 算法的理论基础
Jensen 不等式
对于凹函数
构造对数似然的下界 (ELBO),EM 通过交替最大化下界来逼近似然极大值。
ELBO (Evidence Lower Bound)
当
E 步 (Expectation)
计算隐变量的后验概率(责任度):
M 步 (Maximization)
利用
收敛性
每次迭代
代码对应
bash
python -m pipelines.probabilistic.em