当前位置:   article > 正文

(四)人工智能之机器学习

(四)人工智能之机器学习

目录

(一)机器学习基础

1.1、基本概念

(二)机器学习相关理论

2.1、监督学习与无监督学习

2.2、过拟合与欠拟合

2.3、评估指标

(三)经典机器学习算法

3.1、线性回归与逻辑回归

3.2、决策树与随机森林

3.3、支持向量机(SVM)

3.4、K-近邻算法(KNN)

(四)简单线性回归

4.1、导入必要的库

4.2、准备数据

4.3、训练模型

4.4、做出预测

4.5、评估模型

4.6、可视化结果

 (五)总结


引言

在上一章节,介绍了Python的基础知识,帮助你了解了变量、数据类型、函数等。已经初步熟悉编写和运行Python代码的基本技能,本章节介绍机器学习相关知识理论及应用

(一)机器学习基础


机器学习是人工智能的一个分支,旨在让计算机从数据中学习并做出预测或决策。这里将从基础概念入手,结合简单的代码例子,带你一步步学习机器学习。

1.1、基本概念


数据集:训练机器学习模型的数据,通常分为训练集和测试集
特征:用于预测目标值的输入变量
目标值:模型试图预测的输出
模型:从数据中学习到的数学表示,用于做出预测

(二)机器学习相关理论

2.1、监督学习与无监督学习

监督学习
监督学习(Supervised Learning)就像你在学校里上课时,老师教你一项新技能。你有一组数据,这些数据包含输入(特征)和输出(标签)。你的任务是训练一个模型,使它能够根据新的输入数据预测正确的输出。

示例:
假设你想预测一个人的工资,你有一个包含多个人的工作经验和工资的数据集。你可以用这个数据集来训练模型,让模型学会根据工作经验预测工资。

无监督学习
无监督学习(Unsupervised Learning)就像你搬到一个新城市,没有任何信息,你需要自己探索并发现这个城市的规律。在无监督学习中,数据只有输入,没有对应的输出。你的任务是从数据中发现结构或模式。

示例:
假设你有一堆不同类型的水果照片,你想根据照片的特征把这些水果分成不同的类别,但你事先不知道有多少种类。你可以使用聚类算法,比如K-means,来进行分类。

2.2、过拟合与欠拟合

过拟合(Overfitting)就像你在考试时死记硬背了所有练习题,但一旦遇到新题目,就不会做了。模型在训练数据上表现得很好,但在新数据上表现得很差,因为它过于“记住”训练数据的细节,而忽略了数据的普遍规律。

欠拟合
欠拟合(Underfitting)就像你在考试时,连基本的知识点都没掌握,所以考试成绩很差。模型在训练数据和新数据上都表现得不好,因为它没有捕捉到数据的规律。

2.3、评估指标

准确率(Accuracy)
准确率是指正确预测的样本数占总样本数的比例。适用于分类任务。

公式:
准确率=正确预测的样本数/总样本数

示例:
假设你有100个样本,正确预测了90个,那么准确率就是90%

精确率(Precision)

精确率是指正确预测的正样本数占预测为正样本数的比例。适用于不均衡数据集。

公式:
精确率=正确预测的正样本数/预测为正样本数

示例:
假设你预测为正样本的50个中有45个是正确的,那么精确率就是90%。

召回率(Recall)
召回率是指正确预测的正样本数占实际正样本数的比例。适用于需要找到所有正样本的情况。

公式:
召回率=正确预测的正样本数/实际正样本数

示例:
假设实际为正样本的60个中有45个是正确的,那么召回率就是75%。

F1-score:
F1-score是精确率和召回率的调和平均数,用于综合评价模型。

公式:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/神奇cpp/article/detail/986310
推荐阅读
相关标签