LDA 线性判别分析 (Linear Discriminant Analysis)

核心思想

LDA 是一种有监督降维方法。它寻找一个投影方向，使得类间散度最大、类内散度最小，从而在降维的同时最大化类别可分性。

将数据投影到方向 $w$ 上后，第 $k$ 类的投影均值和投影方差为：

{\tilde{μ}}_{k} = w^{T} μ_{k}, {\tilde{σ}}_{k}^{2} = w^{T} S_{k} w

Fisher 准则最大化类间距离与类内方差之比：

J (w) = \frac{({\tilde{μ}}_{1} - {\tilde{μ}}_{2})^{2}}{{\tilde{σ}}_{1}^{2} + {\tilde{σ}}_{2}^{2}} = \frac{w^{T} S_{B} w}{w^{T} S_{W} w}

类内散度矩阵 (Within-Class Scatter)：

S_{W} = \sum_{k = 1}^{K} \sum_{x_{i} \in C_{k}} (x_{i} - μ_{k}) (x_{i} - μ_{k})^{T}

类间散度矩阵 (Between-Class Scatter)：

S_{B} = \sum_{k = 1}^{K} N_{k} (μ_{k} - μ) (μ_{k} - μ)^{T}

其中 $μ$ 为全局均值， $N_{k}$ 为第 $k$ 类样本数。

$J (w) = \frac{w^{T} S_{B} w}{w^{T} S_{W} w}$ 是广义瑞利商 (Generalized Rayleigh Quotient)。

令 $w^{T} S_{W} w = 1$ （归一化约束），用拉格朗日乘子法：

L = w^{T} S_{B} w - λ (w^{T} S_{W} w - 1)

\frac{\partial L}{\partial w} = 2 S_{B} w - 2 λ S_{W} w = 0

S_{B} w = λ S_{W} w

即广义特征值问题。若 $S_{W}$ 可逆：

S_{W}^{- 1} S_{B} w = λ w

$rank (S_{B}) = 1$ ， $S_{B} w \propto (μ_{1} - μ_{2})$ ，因此：

w^{*} \propto S_{W}^{- 1} (μ_{1} - μ_{2})

$K$ 个类最多可降至 $K - 1$ 维（因为 $rank (S_{B}) \leq K - 1$ ）。选取 $S_{W}^{- 1} S_{B}$ 最大的 $q$ 个特征值对应的特征向量。

bash

python -m pipelines.dimensionality.lda