赞
踩
目录
引言
在上一章节,介绍了Python的基础知识,帮助你了解了变量、数据类型、函数等。已经初步熟悉编写和运行Python代码的基本技能,本章节介绍机器学习相关知识理论及应用
机器学习是人工智能的一个分支,旨在让计算机从数据中学习并做出预测或决策。这里将从基础概念入手,结合简单的代码例子,带你一步步学习机器学习。
数据集:训练机器学习模型的数据,通常分为训练集和测试集
特征:用于预测目标值的输入变量
目标值:模型试图预测的输出
模型:从数据中学习到的数学表示,用于做出预测
监督学习
监督学习(Supervised Learning)就像你在学校里上课时,老师教你一项新技能。你有一组数据,这些数据包含输入(特征)和输出(标签)。你的任务是训练一个模型,使它能够根据新的输入数据预测正确的输出。
示例:
假设你想预测一个人的工资,你有一个包含多个人的工作经验和工资的数据集。你可以用这个数据集来训练模型,让模型学会根据工作经验预测工资。
无监督学习
无监督学习(Unsupervised Learning)就像你搬到一个新城市,没有任何信息,你需要自己探索并发现这个城市的规律。在无监督学习中,数据只有输入,没有对应的输出。你的任务是从数据中发现结构或模式。
示例:
假设你有一堆不同类型的水果照片,你想根据照片的特征把这些水果分成不同的类别,但你事先不知道有多少种类。你可以使用聚类算法,比如K-means,来进行分类。
过拟合(Overfitting)就像你在考试时死记硬背了所有练习题,但一旦遇到新题目,就不会做了。模型在训练数据上表现得很好,但在新数据上表现得很差,因为它过于“记住”训练数据的细节,而忽略了数据的普遍规律。
欠拟合
欠拟合(Underfitting)就像你在考试时,连基本的知识点都没掌握,所以考试成绩很差。模型在训练数据和新数据上都表现得不好,因为它没有捕捉到数据的规律。
准确率(Accuracy)
准确率是指正确预测的样本数占总样本数的比例。适用于分类任务。
公式:
准确率=正确预测的样本数/总样本数
示例:
假设你有100个样本,正确预测了90个,那么准确率就是90%
精确率(Precision)
精确率是指正确预测的正样本数占预测为正样本数的比例。适用于不均衡数据集。
公式:
精确率=正确预测的正样本数/预测为正样本数
示例:
假设你预测为正样本的50个中有45个是正确的,那么精确率就是90%。
召回率(Recall)
召回率是指正确预测的正样本数占实际正样本数的比例。适用于需要找到所有正样本的情况。
公式:
召回率=正确预测的正样本数/实际正样本数
示例:
假设实际为正样本的60个中有45个是正确的,那么召回率就是75%。
F1-score:
F1-score是精确率和召回率的调和平均数,用于综合评价模型。
公式:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。