赞
踩
点击上方蓝色字体“州的先生”选择关注公众号
Python编程应用实战,尽在掌握
这是《Python AI极简入门》第5篇
零、前言
在上一篇,我们介绍了使用sklearn库快速创建一个用于预测房价的机器学习回归模型,并通过平均绝对误差、均方差和R3分数有效地评估了这个预测模型的效果。
在本篇,我们继续介绍借助sklearn库创建用于进行分类预测的机器学习模型。
对分类问题进行预测同样属于监督学习的范畴,通过对已知数据的类别的标记,来实现对未知数据的类别的预测和判定。
常见的应用领域包括:垃圾邮件识别、垃圾短信识别、图像分类识别等等。
常见的应用算法则有:SVM(支持向量机)、K紧邻、朴素贝叶斯、随机森林等等。
下面,我们就通过Digits手写数字集来进行机器学习分类模型的介绍。
一、初探手写数字数据集
本篇选用的手写数字数据集同样来自有sklearn.datasets子模块,其由著名的UCI 机器学习库提供:
该数据集由1797个8x8图像组成。每个图像,都是手写数字。
就像上一篇导入波士顿数据集一样,我们从sklearn模块中进行导入:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。