赞
踩
从书上301~304页的介绍可知,图半监督学习具有两个明显的缺点:
- 处理大规模数据时性能欠佳;
- 难以直接对新样本进行分类。
下面采用sklearn的半监督学习模块来验证上述特性。
选用iris数据集的第1、3项属性开展测试,sklearn 的半监督学习算法是利用标记传播进行学习,具体又分为标记传播(Label Propagating
)和标记扩散(Label Spreading
),两者的差异在官方文档里已经说的很清楚,此处不再详述,此处采用的是标记传播,分别用不同比例的标记和未标记进行标记传播,并与SVM的结果进行对比(标记传播算法不能直接对新样本进行分类,sklearn中的label_propagating
采取的方法是对新样本重新进行一次学习来预测其标记),具体代码如下:
import numpy as np
import matplotlib.pyplot as plt
from<
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。