十九.降维之线性判别分析(LDA)原理和sklearn实现

作者：小丑西瓜9 | 2024-04-23 14:59:59

踩

1.LDA的数学原理

LDA是一种有监督的降维技术，它的每个样本输出都是有类别的。
LDA的思想是投影后类间方差尽可能大，类内方差尽可能小。

(1)类间散度矩阵

类间散度矩阵为：
$\boldsymbol{S}_{b}=\sum_{i=1}^{C}(\mu _{i}-\mu)(\mu _{i}-\mu)^{T}$
其中， $C$ 为类别总数， $\mu$ 为所有样本的均值：
$\mu =\frac{1}{m}\sum_{i=1}^{m}\mathbf{x}^{i}$
$C_{i}|$ 为类别为 $C_{i}$ 的样本数， $\mu _{i}$ 为类别为 $C_{i}$ 的样本均值：
$\mu _{i}=\frac{1}{|C_{i}|}\sum_{i=1}^{|C_{i}|}\mathbf{x}^{i}$

(2)类内散度矩阵

类间散度矩阵为：
$\mathbf{S}_{w}=\sum_{i=1}^{C}\sum_{\mathbf{x}^{i}\in C_{i}}(\mathbf{x}^{i}-\mu _{i})(\mathbf{x}^{i}-\mu _{i})^{T}$

(3)协方差矩阵

投影后的类间协方差矩阵：
$\mathbf{w^{T}S_{b}w}$
投影后的类内协方差矩阵：
$\mathbf{w^{T}S_{w}w}$
类内方差最小，类间方差最大，等价于最大化下式：
$\arg \max_{w}\frac{\mathbf{w^{T}S_{b}w}}{\mathbf{w^{T}S_{w}w}}$
分子和分母都为 $\mathbf{w}$ 的二次项，不失一般性，令 $\mathbf{w^{T}S_{w}w}=1$ ，则上式等价于最小化下式：
$\arg\min_{w}-\mathbf{w^{T}S_{b}w}\\ s.t.\mathbf{w^{T}S_{w}w}=1$
带约束的最优化问题，使用拉格朗日乘子法：
$J(\mathbf{w})=-\mathbf{w^{T}S_{b}w}-\lambda(1-\mathbf{w^{T}S_{w}w})$
此时，求梯度并令梯度为0：
$\frac{\partial J(\mathbf{w})}{\partial \mathbf{w}}=-2\mathbf{S_{b}w}+2\lambda\mathbf{S_{w}w}=0$
最终得：
$\mathbf{S_{w}^{-1}S_{b}w}=\lambda \mathbf{w}$
因此，需要求 $\mathbf{S_{w}^{-1}S_{b}w}$ 的特征值和特征向量。
由于利用了样本的类别得到的投影矩阵，因此降维到的维度 $d$ 最大值为类别数减1。

2.LDA算法流程

输入： $m$ 个 $n$ 维样本，有 $k$ 个类别，需要降到的维度为 $d$ 。
输出：降维后的样本集。
(1)分别求出类间散度矩阵 $\mathbf{S_{b}}$ 和类内散度矩阵 $\mathbf{S_{w}}$ 。
(2)计算出矩阵 $\mathbf{S_{w}^{-1}S_{b}}$ 。
(3)计算出矩阵 $\mathbf{S_{w}^{-1}S_{b}}$ 的最大 $d$ 个特征值和对应的特征向量，组成投影矩阵：
$\mathbf{W}=(\mathbf{w}_{1},\mathbf{w}_{2},...,\mathbf{w}_{d})$
(4)得到新的样本：
$\mathbf{x^{i}_{new}}=\mathbf{W^{T}x^{i}}$

3.LDA与PCA的区别

(1)LDA为有监督降维，PCA为无监督降维。

(2)PCA可以降低到任意维度，LDA只能降维最大至类别数减1。

(3)LDA可以进行分类。

4.sklearn实现LDA

(1)生成数据

import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn.datasets import make_classification
x, y = make_classification(n_samples=1000, n_features=3, n_redundant=0, n_classes=3, n_informative=2,
                           n_clusters_per_class=1,class_sep =0.5, random_state =10)
print(x.shape)
fig = plt.figure()
ax = Axes3D(fig)
ax.scatter(x[:, 0], x[:, 1], x[:, 2],c=y)
1
2
3
4
5
6
7
8
9

输出：
在这里插入图片描述

(2)PCA

from sklearn.decomposition import PCA
model1=PCA(n_components=2)
x1 = model1.fit_transform(x)
print(x1.shape)
plt.scatter(x1[:,0],x1[:,1],c=y)
plt.show()
1
2
3
4
5
6

在这里插入图片描述

(3)LDA

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
model2 = LinearDiscriminantAnalysis(n_components=2)
model2.fit(x,y)
x2=model2.transform(x)
print(x2.shape)
plt.scatter(x2[:,0],x2[:,1],c=y)
plt.show()
1
2
3
4
5
6
7

在这里插入图片描述

声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：【wpsshop博客】

十九.降维之线性判别分析(LDA)原理和sklearn实现

目录

1.LDA的数学原理

(1)类间散度矩阵

(2)类内散度矩阵

(3)协方差矩阵

2.LDA算法流程

3.LDA与PCA的区别

4.sklearn实现LDA

(1)生成数据

(2)PCA

(3)LDA