赞
踩
Photo Optical Character Recognition(照片光学字符识别),注重的问题是如何让计算机读出图片中的文字信息。
1、给定某种图片,它将图像扫描一遍,然后找出照片中的文字信息;
2、重点关注这些文字区域,进行文字分离,并对区域中的文字进行识别;
3、用一个分类器对这些可见字符进行识别。
将像这样的一个系统称为machine learning pipeline(机器学习流水线)。
如果要设计一个机器学习系统,要作出的最重要的决定之一就是要怎样设计这个流水线的各个模块,需要设计整个流水线以及流水线中的每一个模块,这通常会影响到算法最终的表现。
为了建立一个行人检测系统:
1、从数据集中收集一些正样本和负样本;
2、用学习网络或者其他学习算法,向其中输入一个82*36的图块,来对y进行分类;
1、在图片中选取一个矩形块,把这个图块传递给分类器来检测图块中是否有行人;
2、将矩形稍微移动一点,继续传递并且识别;
···
n、直到遍历完图片。
然后使用更大图块,同上。
人工数据合成不适用于所有问题,而且将其运用于特定问题时经常需要思考改进并且深入了解它。但假如使用于你的机器学习问题,有时它能为你的学习算法轻松得到大规模的训练集。
人工数据合成主要有两种形式,第一种实际上是自己创造数据,第二种是我们已经有小的标签训练集,然后以某种方式扩充训练集。
语言识别:
*警告:在引入失真合成数据时,如果你试图自己完成,那么你引入的失真应该具有代表性,这些噪声或者扭曲是有可能出现在测试集中的:
讨论:
假如遇到一个机器学习问题,有两件事情是值得做的,一个是用学习曲线做一个合理检验,看更多的数据是否真的有用,第二个就是假如情况是这样,通常坐下来扪心自问,要多久才能获取到10倍于当前所拥有的数据。
ceiling analysis(上限分析):
进行上限分析的好处是知道,如果对每一个模块进行改善,它们各自的上升空间是多大。
在当你想花精力在模块上,上限分析可以用来确定这样做会不会有效果,整个系统的性能会不会产生明显的提高。
PS.内容为学习吴恩达老师机器学习的笔记【https://study.163.com/course/introduction/1004570029.htm】
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。