当前位置:   article > 正文

amd显卡5700xt的深度学习环境搭建记录_5700xt 能用amd rocm

5700xt 能用amd rocm

之前的深度学习的初步学习阶段,一直是直接使用和鲸社区的服务器镜像,本地则是cpu版本的tensorflow和pytorch。

现在实际尝试做项目发现本地的cpu版本太慢了,课题组的服务器又没有显卡

于是开始尝试对我个人电脑进行深度学习gpu环境的搭建

我的电脑是amd的gpu,5700xt,19年的老卡,但总比cpu跑的快。

WSL配置

来自官方文档:适用于 TensorFlow 2 的 DirectML 插件 |Microsoft 学习

我用的WIN10专业版,WSL2,分发的Ubuntu-22.04

更换Windows下的完整版显卡驱动

下载官网:

AMD Drivers and Support | AMD

在其中输入自己的显卡型号,找寻对应的WIN10驱动,有鸡血版 Adrenalin Edition和专业版PRO Edition可选

我选择的是专业版

下载后进行驱动的安装,期间会有几次重启和屏幕闪烁,是正常现象。

安装tensorflow2.10.0

来自官方文档:适用于 TensorFlow 2 的 DirectML 插件 |Microsoft 学习

进入wsl,创建一个python3.8的环境并进入:

  1. conda create -n tensorflow python=3.8
  2. conda activate tensorflow

安装相应的包:

  1. pip install tensorflow-cpu==2.10
  2. pip install tensorflow-directml-plugin

完成后输入:

python

进入python的运行环境,输入python代码:

  1. import tensorflow as tf
  2. tf.config.list_physical_devices('GPU')

输出:

[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

配置成功

安装pytorch2.0.0

来自官方文档:在 WSL 2 上使用 DirectML 启用 PyTorch |Microsoft 学习

参考:AMD GPU,PyTorch,Windows和DirectML - 知乎 (zhihu.com)

官方文档声称最多支持PyTorch 1.13,但实测照这些指令下来会自动安装2.0.0,且运行正常。

进入wsl,创建一个python3.8的环境并进入:

  1. conda create -n pytorch python=3.8
  2. conda activate pytorch

安装依赖包:

  1. conda install numpy pandas tensorboard matplotlib tqdm pyyaml -y
  2. conda install pytorch torchvision torchaudio cpuonly -c pytorch
  3. pip install opencv-python
  4. pip install wget
  5. pip install torch-directml

进入python,输入:

  1. import torch
  2. import torch_directml
  3. dml = torch_directml.device()
  4. tensor1 = torch.tensor([1]).to(dml) # Note that dml is a variable, not a string!
  5. tensor2 = torch.tensor([2]).to(dml)
  6. dml_algebra = tensor1 + tensor2
  7. dml_algebra.item()

输出:

3

配置成功

Ubuntu配置

pytorch

参考:

ubuntu22.04安装rocm教程,AMD深度学习,6800xt配置pytorch、CUDA(已更新)本地安装torch_reven#1118的博客-CSDN博客

AMD显卡配置深度学习环境(ROCm-pytorch) - 知乎 (zhihu.com)

本次采用的是双系统的Ubuntu22.04

安装Ubuntu下的驱动,ROCm5.6

输入Linux指令:

  1. sudo apt update && sudo apt upgrade
  2. sudo apt install wget gnupg2
  3. # 22.04安装这个
  4. wget https://repo.radeon.com/amdgpu-install/5.6.1/ubuntu/jammy/amdgpu-install_5.6.50601-1_all.deb
  5. sudo apt install ./amdgpu-install_5.6.50601-1_all.deb
  6. # 然后安装单个用例
  7. sudo amdgpu-install --usecase=rocm,hip,mllib --no-dkms
  8. # 添加用户至render组
  9. sudo usermod -a -G video,render $LOGNAME

然后

重启系统!

输入Linux指令:

  1. # 显示gpu信息
  2. rocm-smi
  3. # 两项都显示gpu信息
  4. /opt/rocm/bin/rocminfo
  5. /opt/rocm/opencl/bin/clinfo

全部正常输出,说明显卡的ROCm驱动安装成功


安装pytorch2.1.0

可根据ROCm版本、python版本不同安装不同的python,链接如下:

download.pytorch.org/whl/torch/

我选择的是:torch-2.1.0+rocm5.6-cp38-cp38-linux_x86_64.whl

创建环境python3.8并进入:

  1. conda create -n pytorch python=3.8
  2. conda activate pytorch

下载对应版本的pytorch并安装:

  1. wget https://download.pytorch.org/whl/rocm5.6/torch-2.1.0%2Brocm5.6-cp38-cp38-linux_x86_64.whl
  2. pip install torch-2.1.0+rocm5.6-cp38-cp38-linux_x86_64.whl

进入python环境,输入代码:

  1. import torch
  2. torch.cuda.is_available()

输出为:

True

配置成功

安装tensorflow(还没尝试)

还没尝试,哪天安装成功了我更一下

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/946313
推荐阅读
相关标签
  

闽ICP备14008679号