赞
踩
https://www.hiascend.com/zh/developer/activities/details/118b868aa5fe4b759d9e407e914db905
Ascend C暑期优才班获奖规则&笔记提交专用贴_Ascend C_昇腾论坛 (hiascend.com)
香橙派实验手册_Ascend C_昇腾论坛 (hiascend.com)
修改add算子功能为sinh函数功能
参考文档:以太网口远程登录(SSH方式)
root
,密码Mind@123
代码:samples: CANN Samples (gitee.com)
cd ~/samples/operator/AddCustomSample/KernelLaunch/
cp -r AddKernelInvocationNeo/ test
cd test/
bash run.sh -r cpu -v Ascend310P1
# 上述命令中cpu参数指定了执行命令的设备,-v Ascend310P1则是香橙派的npu版本型号
# 在不涉及npu的情况下,版本型号不会对结果造成影响。
/root/samples/operator/AddCustomSample/KernelLaunch/test/scripts/gen_data.py
input_x = np.random.uniform(1,10,[8,2048]).astype(np.float16)
golden = np.sinh(input_x).astype(np.float16)
修改/root/samples/operator/AddCustomSample/KernelLaunch/test/add_custom.cpp
修改其中compute()函数,把“Add(xxxxxxxxxxxxxxxxx)”那一行注释掉,改成sinh的计算逻辑,用xLocal当输入,zLocal当输出
可做优化,最简4条公式即可完成(数学公式优化),如下:
Exp(xLocal, xLocal, TILE_LENGTH);
Reciprocal(zLocal, xLocal, TILE_LENGTH); // 倒数
Sub(zLocal, xLocal, zLocal, TILE_LENGTH);
Muls(zLocal, zLocal, scalar, TILE_LENGTH);
cd /root/samples/operator/AddCustomSample/KernelLaunch/test
bash run.sh -r cpu -v Ascend310P1
[Ascend C算子开发能力认证考试(中级)](https://www.hiascend.com/zh/exams/1697055344003670018?isCertification=false&breadcrumbSecond=Ascend C算子开发能力认证(中级)&source=/edu/certification&sourceDetail=/edu/certification/detail/34bf904cb410497cb9c582be6c047ff7)
参考笔记:https://bbs.huaweicloud.com/blogs/418400
初始化环境:
bash exam_system_init.sh
Ascend C算子开发(进阶)-昇腾社区 (hiascend.com)
往年比赛优秀代码(算子调优):operator_contrib · Ascend/samples - 码云 - 开源中国 (gitee.com)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。