当前位置:   article > 正文

人工智能入门——机器学习小案例(二)_机器学习实例

机器学习实例

1、机器学习数据预处理

简介:案例使用数据集iris
Iris鸢尾花数据集是一个经典的数据集,在统计学习和机器学习领域经常被作为示例。鸢尾花数据集简单且具有代表性

使用python进行基本的数据操作
  1. iris数据加载
from sklearn import datasets
iris = datasets.load_iris()
print(iris.data)
  • 1
  • 2
  • 3

iris数据加载结果图

  1. 数据展示
# 输出属性名称
print(iris.feature_names)
# 输出的结果
print(iris.target)
# 结果的含义
print(iris.target_names)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

属性名称
结果
结果含义

  1. 确认数据维度与类型
# 确认数据类型是否一致
print(type(iris.data))
print(type(iris.target))
#确认属性数据与结果数据维度是否一致
print(iris.data.shape)
print(iris.target.shape)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

确认数据类型是否一致
确认属性数据与结果数据维度是否一致

  1. 使用scikit-learn进行数据处理的四个关键点
    1、区分开属性数据与结果数据
    2、属性数据与结果数据都是量化的
    3、运算过程中,属性数据与结果数据的类型都是NumPy数组
    4、属性数据与结果数据的维度是对应的

实现模型训练

分类问题介绍:根据数据集目标的特征或属性,划分到已有的类别中,常用的分类算法:K近邻(KNN)、逻辑回归、决策树、朴素贝叶斯

  1. K近邻分类模型(KNN)介绍
    给定一个训练数据集,对新的输入实例,在训练集中找到于该实例最邻近的K个实例(也就是上面所说的K个邻居),这K个实力的多数属于某个类,就把该输入实例分类到这个类中,KNN算法也是最简单的机器学习算法之一
  2. 使用scikit-learn进行模型训练与预测的四步骤
    1、调用需要使用的模型类
    2、模型初始化(船舰一个模型实例)
    3、模型训练
    4、模型预测
  3. 实际操作
    ① 引入数据并进行模型调用
# 通过sklearn自带数据包加载iris数据
from sklearn import datasets
# 模型调用
from sklearn.neighbors import KNeighborsClassifier
iris = datasets.load_iris()
# 样本数据与结果分别赋值给x、y
x = iris.data
y = iris.target
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

② 创建实例并训练模型

# 创建实例
knn = KNeighborsClassifier(n_neighbors=1)
# 模型训练
knn.fit(x,y)
  • 1
  • 2
  • 3
  • 4

③ 预测一个随机模型进行检查

knn.predict([[1,2,3,4]])
  • 1

结果:
预测一个随机模型
④ 更换k值为5进行训练模型并预测

x_test = [[1,2,3,4],[2,4,1,2]]
knn_5 = KNeighborsClassifier(n_neighbors=5)
knn_5.fit(x,y)
knn_5.predict(x_test)
  • 1
  • 2
  • 3
  • 4

结果:
k值为5进行训练模型并预测

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/263409
推荐阅读
相关标签
  

闽ICP备14008679号