当前位置:   article > 正文

机器学习的相关知识的简介_某网站根据一个用户的购物记录和冗长的收藏清单,识别出这其中哪些是该用户真

某网站根据一个用户的购物记录和冗长的收藏清单,识别出这其中哪些是该用户真

机器学习的相关知识与介绍

  • 后面有机器学习生活应用的例子

*阿尔法狗( AlphaGo )是一款围棋人工智能程序,由谷歌( Google) ! : 旗下 De叩Mind 公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰与他们 : 的团队开发,其主要工作原理是“深度学习”。


KNN 最近邻算法

BP 和扎在LP 神经网络算法

MLP (Multi-layer Percep位on )多层神经网络算法也称为 MLP 多层感知器,是一种经典的神经网络算法, MLP 算法已被证明是一种通用的函 数近似方法,可以被用来拟合复杂的函数或解决分类问题。 MLP 在 20 世纪 80年代曾是相当流行的机器学习方法,拥有广泛的应用场景,比如 语音识别、图像识别 、 机器翻译等,但自 20 世纪 90 年代以来, MLP 遇 到来自更为简单的支持向量机的强劲竞争。 但由于深层学习的成功, MLP BP ( Error Back Propagation )算法又被称为误差反向传播算法。 BP i 算法的基本思想是,学习过程由信号的正向传播与误差的反向传播两个 i 过程组成。 由于多层前馈网络的训练经常采用误差反向传播算法,所以 ; 人们也经常将多层前馈网络直接称为 BP 网络。

决策树算法

国际权威的学术组织一一数据挖掘国际会议 ICDM (
the IEEE j Intematior ! 挖掘领域的十大经典算法,C4.5算法排名第一。C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是 ID3 算法。

Boosting 算法

SVM 向量机算法

现今,机器学习已应用于多个领域,远超出大多数人的想象,下面就是假想的一日,其中很多场景都会碰到机器学习:假设你想起今天是某位朋友的生日,打算通过邮局给她邮寄一张生日贺卡。你打开浏览器搜索趣味卡片,搜索引擎显示了10个最相关的链接。你认为第二个链接最符 合你的要求,点击了这个链接,搜索引擎将记录这次点击,并从中学习以优化下次搜索结果。然 后 ,你检査电子邮件系统,此时垃圾邮件过滤器已经在后台自动过滤垃圾广告邮件,并将其放在垃圾箱内。接着你去商店购买这张生日卡片,并给你朋友的孩子挑选了一些尿布。结账时,收银员给了你一张1美元的优惠券,可以用于购买6罐装的啤酒。之所以你会得到这张优惠券,是因为款台收费软件基于以前的统计知识,认为买尿布的人往往也会买啤酒。然后你去邮局邮寄这张贺 卡 ,手写识别软件识别出邮寄地址,并将贺卡发送给正确的邮车。当天你还去了贷款申请机构,查看自己是否能够申请贷款,办事员并不是直接给出结果,而是将你最近的金融活动信息输人计算机,由软件来判定你是否合格。最后,你还去了赌场想找些乐子,当你步人前门时,尾随你进来的一个家伙被突然出现的保安给拦了下来。“对不起,索普先生,我们不得不请您离开赌场。我们不欢迎老千。 ”图1-1集中展示了使用到的机器学习应用。


用于执行分类、回归、聚类和密度估计的机器学习算法

监督学习的用途

  • K-近邻算法
  • 线性回归
  • 朴素贝叶斯算法
  • 局部加权线性回归
  • 支持向量机
  • Ridge回归
  • 决策树
  • Lasso最小回归系数估计

无 监 督 学 习 的 用 途

  • K-均值
  • 最大期望算法
  • DBSCAN

k-近邻算法概述

简单地说,谷近邻算法采用测量不同特征值之间的距离方法进行分类。

  • 优点:精度高、对异常值不敏感、无数据输入假定。
  • 缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。

k-近邻算法的一般流程

(1)收集数据:可以使用任何方法。
(2)准备数据:距离计算所需要的数值,最好是结构化的数据格式。
(3)分析数据:可以使用任何方法。
(4)训练算法:此步驟不适用于1 近邻算法。
(5)测试算法:计算错误率。
(6)使用算法:首先需要输入样本数据和结构化的输出结果,然后运行女-近邻算法判定输 入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理。
如果使用无监督学习算法,由于不存在目标变量值,故而也不需要训练算法

RF 随机森林算法

随机森林算法,英文名称 Random Fore st,简称盯算法,是一种集成 决策树模型,由布雷曼博士在 2001 年提出,它是由一个随机子集的实例组 成,井且每个节点都是从一系列随机子集中选择,且由于这个性质被称为 随机森林(RF)。其算法在理论和经验上证明了该算法对过拟合的抵抗性, 是一种非常稳健的机器学习算法模型。

Deep Leaming 深度学习

2006 年,神经网络专家 Hinton 提出了神经网络 Deep Leaming 深度学 习算法,使神经网络的能力大大提高,向 SVM 支持向量机发出挑战。

当前机器学习领域最热门的两大算法,是 Deep Leaming深度学习算法和SVM向量机算法,它们都是给予统计学的机器学习方法。
深度学习的概念源于神经网络的研究,是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,例如图像、声音和文本。


机器学习的应用:

*·机器人客服:当你拨打移动、银行等公司的服务热线时,大部分都是通过人工智能技术合成的电脑客服在和你沟通,只有遇到电脑客 服无法处理的问题,才会转给人工处理。

*·语音助理:苹果的 Siri 和微软的小娜,就是采用人工智能开发的语 音助手,两者会自动识别你的语音命令。

*·垃圾邮件检测:根据邮箱中的邮件,识别哪些是垃圾邮件,哪些不是。这样的模型可以使用程序帮助归类垃圾邮件和非垃圾邮件。
·信用卡欺诈检测:根据用户的信用卡交易记录,识别哪些交易是该 用户操作的,哪些不是。

*·数字识别:根据信封上手写的邮编,识别出每一个手写字符所代表的数字。这样的模型可以帮助程序阅读和理解手写邮编,并根据地 理位置分类信件。

*·人脸识别:根据相册中的众多数码照片,识别出包含某一个人的照 片,根据人脸管理照片。

*·产品推荐:根据用户的购物记录和冗长的收藏清单,识别出这其中 哪些是该用户真正感兴趣,并且愿意购买的产品 。 京东、掏宝都有 大量这样的案例。 ·医学分析:根据病人的症状和病人资料数据库,预测该病人可能患 了什么病 。

*·股票交易:这个就是目前非常火热的智能投顾技术,根据股票现在 和以往的价格波动,判断这支股票是应该建仓、持仓还是减仓。

*·客户细分:根据用户在产品试用期的行为模式和所有用户过去的行为,识别出哪些用户会转变成该产品的付款用户,哪些不会。

*·形状鉴定:根据用户在触摸屏幕上的手绘和一个己知的形状资料库, 判断用户想描绘的形状。

*·艺术作品鉴别 : 艺术作品的鉴别是极其复杂的,专家通常会判断它 所属的类型、流派、作者和时代。新泽西州罗格斯大学的专家使用 人工智能技术,鉴别画作的流派和作者。

*·婚恋匹配:国内外的婚恋交友网站经常通过性格测试来提取数据, 然后通过人工智能分析,进行婚恋匹配。



其他:

可扩展标记语言

同义词 xml一般指可扩展标记语言

可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。

在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。

它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。是Internet环境中跨平台的、依赖于内容的技术,也是当今处理分布式结构信息的有效工具。早在1998年,W3C就发布了XML1.0规范,使用它来简化Internet的文档信息传输。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/370235
推荐阅读
相关标签
  

闽ICP备14008679号