赞
踩
CANN训练营学习小结
参加了很多期的华为的CANN训练营体验管活动了,每次都有新的收获。这次把学习过程中的一些心得记录下来做个小结。
按华为官方的介绍:“CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,对上支持多种AI框架,对下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供高效易用的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务。”
个人理解是对标CUDA的计算架构。都是厂家为了将自己的硬件的能力发挥出来做的专用AI驱动。
华为做为后发者可以看得出在不停的演进,这张图是2020年5月华为星火计划-华为晟腾特训营活动发布的CANN3.0架构图。
这张图可以看到现在发展到CANN6.0了。
性能和3.0比也有了很大的提升。
华为A推理I芯片:Ascend310
学习CANN最有效的方法是参加训练营,同时看文档,做练习。
当然也需要基本的硬件环境:如ECS,买的时候选按需分配,下一步网络也选按流量付费就可以了。
或者用Atlas200DK作为推理运行环境
有了硬件下一步就是安装开发环境,跑demo了。
先要安装开发环境:码云下的samples/tree/master/cplusplus/level3_application/1_cv/detect_and_classify的例子很综合,介绍环境安装部分比较新可以参考一步步按着操作。但是例子是level3级别的,有点难。初学者还是从/samples/tree/master/cplusplus/level1_single_api/7_dvpp/jpegd_sample起步比较合适。
流程图是理解各种应用的关键。
开发工具可以用VSCODE,安装Remote和C++的插件。然后把整个sample拉下来。
这次的作业用到了AclLite框架:AclLite是个基于C++的开发框架,底层还是v1的API,为了方便开发者使用把AI推理应用要用到的图像/视频预处理、模型推理、推理后的再次处理、再次推理和推理后处理做了封装。通过少量的代码修改可以实现大部分图像AI应用场景。
实际测试性能可以达到单310芯片并发22路视频解码,公用yolov3检测模型然后调用color分类模型可以达到50帧/秒,能够满足大多数应用场景。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。