当前位置:   article > 正文

从基础学习深度学习——手写字符识别

手写字符识别

PS:第一次写博客,请见谅。

一、深度学习

深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。 深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。 深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。 (以上均来自百度百科)

二、手写字符识别

手写识别涉及到模式识别,神经元网络以及人工智能的知识,基础是数字图像处理。手写识别(HandWritingRecognition)是指将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。

三、代码调试

  1. 源码下载地址(开源):https://github.com/mivlab/AI_course

  1. 数据集下载地址:https://pan.baidu.com/s/18Fz9Cpj0Lf9BC7As8frZrw 提取码:xhgk

  1. 下载完整压缩包以及数据集

  1. 解压压缩包,打开pycharm,选择打开项目,直接打开解压之后的文件夹,配置相应的环境

  1. 随后打开classify_pytorch中的train_mnist.py,运行该文件正常会出现以下报错:

这是由于未将运行参数配置,我们需要找到工具栏中的运行--编辑配置

找到解压之后数据集所在的路径位置并将其输入在参数一栏,

如:--datapath=D:\BaiduNetdiskDownload\MNIST_Dataset\train_images(如下图所示)

此时注意,因为各人电脑所配置的环境不同,运行代码时可能会出现以下问题,

以上出现的问题是Input type和weight type数据类型不匹配,因为我的电脑环境本身是支持GPU的,报错显示Input type是在GPU训练的,而weight type却是在CPU运行的,数据类型不匹配,因此出现问题,回头检查代码,会发现下图箭头处的False表明了没有使用CUDA 进行训练,这里需要将其更改为True。

此外,还需要将本网络模型放到GPU上训练,将model = Net(10)更改为 model = Net(10).cuda(),这个代码表明的意思就是将模型放到cuda上进行训练。

更改完之后发现代码已经可以正常运行,进行训练了。

  1. 测试结果:

训练完成之后打开同路径下的tes_mnist.py进行结果测试,得出的结果如下图:

题外话:若想知道自己的电脑是否支持GPU训练,可以在将鼠标放置在电脑下方右击点击任务管理器--性能,即可看电脑是否带有GPU

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/515908
推荐阅读
相关标签
  

闽ICP备14008679号