赞
踩
在当今智能化的时代,人工智能为人们的生活带来了许多的便利,模式识别作为人工智能领域的一门学科,就是一门用算法、用计算机来帮助人们识别各种类别的学科,人们的生产和生活日益依赖模式识别,如最常用的人脸识别、车牌识别等。而肢体识别现在也应用到了人们的日常生活中,肢体识别本质上还是分类任务,该技术有很多应用场景,比如手势识别控制类应用、动作检测类应用、动作评测类应用、以及一些移动设备AR视频合成类应用。
对于纯粹的检测类应用,可以直接对RGB源图像进行分类,当前基于CNN的图像分类技术已经非常成熟和稳定,准确性也完全达到了实用标准。而对于另外涉及到肢体评测、AR合成类的应用,单靠图像分类技术是不够的,需要用到关键点检测技术,它能检测出肢体关键点(比如四肢、面部纹理、手指等),然后基于检测到的关键点做进一步处理。关键点检测的原理其实跟分类技术原理差不多,只是神经网络的输出不太一样。
下面展开来说说图像分类和关键检测这两种技术。
一、图像分类
图像分类是根据图像信息中所反映出来的不同特征,把不同类别的目标区分开的图像处理方法。在大部分深度学习入门教程中,图像分类基本就是hello world级别存在的,最常见的是识别猫或者狗。ImageNet数据集里有常用的1000分类,基本涵盖了大部分常见物体。
图像分类的流程很简单,输入RGB图像,输出各分类的概率值,1000分类任务就输出1000个概率值。图像分类是深度学习技术在CV领域最基础的应用,因为它涵盖了深度学习最重要的环节:特征自动提取。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。