赞
踩
判断飞蛾是月蛾还是帝蛾,这叫分类,做分类的算法叫分类器
虽然可以用照片声音来训练算法,很多算法会减少复杂性,把数据简化成特征,特征是用来帮助分类的值
对于之前飞蛾的例子,我们用了两个特征:翼展和重量
为了训练分类器做出好的预测,我们需要训练数据
专家可以识别飞蛾,所以专家不止记录特征值,还会把种类也写上
因为只有两个数据
红色标记100个帝蛾,蓝色标记100个月飞蛾,我们可以看到大致分为两组。但中间有部分重叠。
所以机器学习算法登场,找出最佳区分
再加一个条件,重量必须小于0.75,才算帝蛾,这些线叫决策边界
仔细看数据,86只帝蛾在正确的区域,剩下14只在错误的区域。另一方面82只月蛾在正确的区域,18个在错误区域。
这个表记录正确和错误个数,叫混淆矩阵,注意我们没法画出100%正确分类的线。
机器学习的目的是最大化正确分类+最小化错误分类,在中有84%的准确率
用这些决策边界,如果进入森林看到一只不认识的飞蛾,我们可以测量它的特征,并绘制到决策空间上。
决策边界可以猜测飞蛾种类
把决策空间切成几个盒子的简单方法,可以用决策树来表示
生成决策树的机器学习算法
如今有数百种算法,而且新算法不断出现,一些算法那甚至用了多个决策树来预测,计算机科学家叫这个森林,因为有多颗树
不一定是直线
就像之前,机器学习算法负责,找出最好的线,最准决策边界。
之前两个特征人也能做到,如果再加一个特征触角长度,那么2d线段就会变成3d平面。
真正有用的分类器,会有很多飞蛾种类
决策树和向量机这样技术来自统计学。有一大类机器学习爱算法用了统计学,但也有不用统计学的比如人工神经网络。
神经元是细胞
然后出了信号并发出信号,形成巨大互联网络,能处理复杂的信息。
人造神经元很类似
它不用电信号或化学信号,而是吃数字进去,吐数字出来,它们被改成一层层
回到飞蛾例子,看如何用神经网络分类。
我们第一层输入层,提供需要被分类的单个飞蛾数据,同样也再次用重量和翼展,另一边输出层吗,也有两个神经元:
一个是帝蛾一个是月蛾,两个神经元里最兴奋的就是分类结果,中间有个隐藏层,负责吧输入变输出,负责干分类的重活
为了看看如何分类,我们放大隐藏层里神经元,神经元第一件事就是把每个输入乘一个权重,假设2.8第一个输入0.1第二个输入
然后对这个结果,用偏差值处理,意思加减一个固定值,比如-6得到3,74。
做神经网络时,这些偏差和权重一开始会设置成随机值。
然后算法调整这些值,来训练神经网络。
使用标价数据来爱训练和测试,逐渐提高准确性。
最后神经元激活函数,也叫传递函数,会应用于输出,对结果执行最后一次数学修改。
例如把值限制在-1到1之间,或把负数改为0。
我们用线性传递i,不会改变值,所以3.74还是3.74。
数字最高就是结果
有可能有很多层。
只能做特定任务叫弱AI,但这并不意味着它没用,真正通用,像人一样的AI叫强AI
强化学习和人类学习方式很类似
计算机通过反复试错来学习,对于很多狭窄问题,强化学习已经被广泛使用,有趣的是如果这类技术可以广泛的应用·,可以创造出像人类小孩一样学习,但学习速度超快。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。