LDA 线性判别分析 (Linear Discriminant Analysis)
核心思想
LDA 是一种有监督降维方法。它寻找一个投影方向,使得类间散度最大、类内散度最小,从而在降维的同时最大化类别可分性。
Fisher 判别准则
二分类情形
将数据投影到方向
Fisher 准则最大化类间距离与类内方差之比:
散度矩阵
类内散度矩阵 (Within-Class Scatter):
类间散度矩阵 (Between-Class Scatter):
其中
瑞利商最优化
推导
令
即广义特征值问题。若
二分类闭式解
多分类推广
PCA vs LDA
| 特性 | PCA | LDA |
|---|---|---|
| 监督方式 | 无监督 | 有监督 |
| 优化目标 | 最大投影方差 | 最大类间/类内散度比 |
| 降维上限 | ||
| 适用场景 | 数据压缩、可视化 | 分类预处理 |
代码对应
bash
python -m pipelines.dimensionality.lda