当前位置:   article > 正文

免费GPU线上跑AI项目实践(猫狗识别)_有没有免费模型跑机器学习

有没有免费模型跑机器学习

声明:

本文内容来自于对DataWhale的开源学习项目——免费GPU线上跑AI项目实践的学习,引用了多处DataWhale给出的教程

学习简介:

学习背景:

免费GPU线上跑AI项目实践可以让学习者通过实际操作,深入理解AI的工作原理和实现方式,提升自己的技术水平。同时,由于GPU具有强大的并行计算能力,使得AI模型的训练速度大大提升,这对于学习者来说,也是一个提升技术能力的好机会。通过免费GPU线上跑AI项目实践,学习者可以亲身体验到AI项目的开发流程,了解到理论知识在实践中的应用,从而增强自己的实践意识。

学习教程:

(1)注册趋动云账号,DataWhale的专属链接我不知道能不能放......DataWhale的学习者是可以免费领取168元算力金的

趋动云icon-default.png?t=N7T8https://account.virtaicloud.com/gemini_web/auth/login

 (2)获取官方代码文件(猫狗识别):https://security.feishu.cn/link/safety?target=https%3A%2F%2Fgemvideo.blob.core.chinacloudapi.cn%2Fdocument%2FdogsVsCatsCode.zip&scene=ccm&logParams=%7B%22location%22%3A%22ccm_default%22%7D&lang=zh-CN

(3)创建项目:

  1. 进入趋动云用户工作台,在当前空间处选择注册时系统自动生成的空间(其他空间无免费算力);

  2. 填写项目名称及项目描述;

  3. 添加镜像:选择含 TensorFlow 2.x 框架的官方镜像即可;

  4. 添加绑定数据集:选择公开数据集,DogsVsCats

  5. 其余无需填写,点击右下角 创建 ,系统弹出 上传代码 的提示,单击 暂不上传,项目创建成功。

 

(4)准备代码:

单击上传文件图标将获取的 DogsVsCats.py 文件上传至项目中

(5)初始化开发环境:

  1. 单击右上角的 运行代码,进入 初始化开发环境

  2. 填写开发环境的初始化配置

(6)调试代码:

        1.单击 开发环境实例 页右侧的 JupyterLab 工具

        2.默认进入 /gemini/ 目录下,在右侧目录树中单击 code 文件夹,进入到 /gemini/code/ 目录下

        3.单击顶部 网页终端 按钮,进入终端界面

        4.在网页终端运行如下代码

python  $GEMINI_RUN/DogsVsCats.py --num_epochs 5 --data_dir $GEMINI_DATA_IN1/DogsVsCats/ --train_dir $GEMINI_DATA_OUT

系统返回一系列信息,直到返回 test accuracy 信息,如下所示,表明该模型测试结束,其识别猫狗的能力为 0.500000,即几乎无识别能力。

        5.单击 JupyterLab,切换回 JupyterLab 工具,分析 /gemini/code/ 路径下的模型代码。经排查,发现代码中没有打乱数据集进行训练,导致模型没有训练成功。这是因为模型在一个batch之中,只能看到猫的类别和狗的类别,这样看不到另一个类别的信息,所以没有任何识别能力。

        额外补充:在机器学习中,特别是深度学习中,数据集的随机性是非常重要的。这是因为模型在学习过程中会尝试找到数据中的规律,而如果数据的顺序是固定的,那么模型就无法找到任何有用的规律。因此,我们需要对数据集进行打乱,使得数据的顺序是随机的,这样模型就有更多的机会学习到不同的规律,从而提高模型的识别能力。

        6.修改代码:

  1. 双击 /gemini/code/ 路径下的 DogsVsCats.py ,开始编辑该文件。

  2. 删除该文件中第 44 行的注释符号 #

  3. 按 “Crtl + S” 键,保存该文件。

        7.单击 网页终端 按钮,进入终端界面再次执行上述 4 中的命令进行识别能力的测试。

(7)提交离线训练:

  1. 单击调试页面右上角的 提交训练任务

  2. 在弹框中选择镜像和代码版本。

    1. 选择代码版本:单击 新建代码版本,并在右边框中填写代码版本名。

    2. 选择镜像:选择 直接使用当前工作镜像

  3. 单击 确定,进入 提交任务 页面。参考如下说明配置任务基本信息。

      执行代码中的 DogsVsCats.py 脚本启动训练,训练所需数据为 $GEMINI_DATA_IN1/DogsVsCats 目录下的数据,训练结果保存在 $GEMINI_DATA_OUT 目录下。执行该任务的启动命令如下:

    1. 配置说明,其余保持默认即可。

      1. 任务模型:单机任务;

      2. GPU选择:B1.meduim【需选择1Gpu的配置】

      3. 启动命令

python3 $GEMINI_RUN/DogsVsCats.py --num_epochs 5 --data_dir $GEMINI_DATA_IN1/DogsVsCats --train_dir $GEMINI_DATA_OUT
  1. 配置信息填写完成后,单击 确定

返回 训练任务 页面,在训练任务列表中查看该任务的状态,该任务大约 5 分钟即可训练完成。

  • 任务状态显示为 成功 则表示训练任务成功结束。

  • 任务状态为 失败,可将鼠标悬置于 失败 字样上,查看失败原因。

(8)结果集存储与下载:

  1. 在左侧导航栏中选择 结果,默认进入 任务结果 页面。

  2. 单击右上角的 导出模型 按钮,进入 导出模型 页面。

  3. 单击 创建,生成模型。

生成的模型将保存在平台中,您可将其公开性设置为 公开,并将其分享给其他成员使用或进一步完善模型。

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/275220
推荐阅读
相关标签
  

闽ICP备14008679号