赞
踩
科技巨头如Google,微软,亚马逊等都纷纷宣布在AI领域布局,AI的影响随着深度学习的应用日益深入。机器视觉作为一个热门子领域,无论是在传统金融行业还是最新自动驾驶领域都掀起了一股学习应用的浪潮。
这是多么棒的一件事啊!
但是我们应该如何简单的开始研究机器视觉?以下是几个主要的步骤
1.收集大量的数据
2.标注这些数据
3.拿到GPUs-训练ML模型需要强大的计算支撑
4.选择一个算法-训练你的模型-检测结果-教会你的模型它还不知道的东西
重复以上步骤直到你得到的满意的模型准确率
以上5步中的每一步都有他们自己的技术和操作注意事项。在这篇文章中,我们会针对第2条(标注训练数据)来进行简单的讲解
机器视觉得几个广泛应用案例:
自动驾驶车辆(waymo,Tesla,Cruise)-一个自动驾驶的车辆需要识别出它前方的物体(和后方!),是一辆车,路标,行人或者是一只流浪的公鸡。
无人机-亚马逊想要利用无人机来为客户送货,那么无人机需要知道在他们前方的物体以便于他们不会撞上飞行中的鸟或者电线。无人机也被广泛应用于安全安防和军队侦查
地图和卫星(mapbox,Here,Orbital Insight)-卫星拍摄图片的数量呈现出爆发性增长!这些数据可以用来确认台风中是否有幸存者,使地图内容更丰富甚至通过计算沃尔玛停车场的车辆来预测销售情况
机器人--机器视觉用来构建可以识别并且从货架上取下某类商品的机器人手臂或者工业自动化甚至玩网球
OCR/BFSI-对信用卡评级,贷款申请等文档自动转写或者转写其他的手写文档等
医疗行业-在机器视觉协助的手术中,机器手臂需要识别特定的手术工具
智能农业-有一位日本的研究员利用机器视觉帮助他父母的农场给黄瓜分类,他们发现ML在通过黄瓜尺寸,形状,颜色和其他必要参数的分类表现突出
第一步首先是要收集数据,当你开始时,可以尝试一下几个很棒的免费或者付费数据集:
这些数据集对于学习机器视觉的新手而言是一个很好的开始。甚至对于一个不是很重要的项目,这些数据也足够来搭建一个简单的模型,但是对于很多公司型或者大型项目,显然不够
要想提升你们CV模型的准确度,你需要用模型在现实中需要检测的数据类型来训练它。这些数据通常是很细致的,不同于我们通常可以从网上获得数据集
有很多方法可以收集数据,比如你可以从网上爬取数据或者像谷歌那种巨头一样利用用户收集的数据或者从汽车摄像机中收集的数据,你甚至可以向别人购买数据集
一旦你得到了数据,你就需要标注它们,你需要考虑2个问题
如何标注数据?
谁来标注数据
注意:本文中说的数据特指图片数据
选择图像标注工具
网上有很多可以免费试用的数据标注工具,然后选择一个正确的标注工具有时候不是那么简单,下面是几个选择时可以参考的因素:
搭建工具运行需要花费的时间和精力
标注准确度
标注速度
一些流行的图片标注工具(需要MIT许可)
Comma coloring--在Comma 自动驾驶技术环境中帮助训练机器学习,比如提供给你一张车载摄像头的图片并且要求你把图片中的不同区域涂上不同的颜色,比如图片中的哪个区域是天空,哪个区域是道路,识别交通信号灯等等,这个工具是开源的
Annotorious-可以在网页上的图片上标注比如画框并且注释内容。比如在一张图片中把狗框选出来并且注释这是一条狗。需要MIT认证,可以免费用于商业和非商业项目
LabelMe-帮助机器视觉研究建立图片数据库。你可以通过访问标注工具来增添这个数据集的内容
另外几个靠谱的开源标注工具:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。