赞
踩
简介:案例使用数据集iris
Iris鸢尾花数据集是一个经典的数据集,在统计学习和机器学习领域经常被作为示例。鸢尾花数据集简单且具有代表性
from sklearn import datasets
iris = datasets.load_iris()
print(iris.data)
# 输出属性名称
print(iris.feature_names)
# 输出的结果
print(iris.target)
# 结果的含义
print(iris.target_names)
# 确认数据类型是否一致
print(type(iris.data))
print(type(iris.target))
#确认属性数据与结果数据维度是否一致
print(iris.data.shape)
print(iris.target.shape)
分类问题介绍:根据数据集目标的特征或属性,划分到已有的类别中,常用的分类算法:K近邻(KNN)、逻辑回归、决策树、朴素贝叶斯
# 通过sklearn自带数据包加载iris数据
from sklearn import datasets
# 模型调用
from sklearn.neighbors import KNeighborsClassifier
iris = datasets.load_iris()
# 样本数据与结果分别赋值给x、y
x = iris.data
y = iris.target
② 创建实例并训练模型
# 创建实例
knn = KNeighborsClassifier(n_neighbors=1)
# 模型训练
knn.fit(x,y)
③ 预测一个随机模型进行检查
knn.predict([[1,2,3,4]])
结果:
④ 更换k值为5进行训练模型并预测
x_test = [[1,2,3,4],[2,4,1,2]]
knn_5 = KNeighborsClassifier(n_neighbors=5)
knn_5.fit(x,y)
knn_5.predict(x_test)
结果:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。