赞
踩
之前的深度学习的初步学习阶段,一直是直接使用和鲸社区的服务器镜像,本地则是cpu版本的tensorflow和pytorch。
现在实际尝试做项目发现本地的cpu版本太慢了,课题组的服务器又没有显卡
于是开始尝试对我个人电脑进行深度学习gpu环境的搭建
我的电脑是amd的gpu,5700xt,19年的老卡,但总比cpu跑的快。
来自官方文档:适用于 TensorFlow 2 的 DirectML 插件 |Microsoft 学习
我用的WIN10专业版,WSL2,分发的Ubuntu-22.04
下载官网:
在其中输入自己的显卡型号,找寻对应的WIN10驱动,有鸡血版 Adrenalin Edition和专业版PRO Edition可选
我选择的是专业版
下载后进行驱动的安装,期间会有几次重启和屏幕闪烁,是正常现象。
来自官方文档:适用于 TensorFlow 2 的 DirectML 插件 |Microsoft 学习
进入wsl,创建一个python3.8的环境并进入:
- conda create -n tensorflow python=3.8
- conda activate tensorflow
安装相应的包:
- pip install tensorflow-cpu==2.10
- pip install tensorflow-directml-plugin
完成后输入:
python
进入python的运行环境,输入python代码:
- import tensorflow as tf
- tf.config.list_physical_devices('GPU')
输出:
[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]
配置成功
来自官方文档:在 WSL 2 上使用 DirectML 启用 PyTorch |Microsoft 学习
参考:AMD GPU,PyTorch,Windows和DirectML - 知乎 (zhihu.com)
官方文档声称最多支持PyTorch 1.13,但实测照这些指令下来会自动安装2.0.0,且运行正常。
进入wsl,创建一个python3.8的环境并进入:
- conda create -n pytorch python=3.8
- conda activate pytorch
安装依赖包:
- conda install numpy pandas tensorboard matplotlib tqdm pyyaml -y
- conda install pytorch torchvision torchaudio cpuonly -c pytorch
- pip install opencv-python
- pip install wget
- pip install torch-directml
进入python,输入:
- import torch
- import torch_directml
- dml = torch_directml.device()
- tensor1 = torch.tensor([1]).to(dml) # Note that dml is a variable, not a string!
- tensor2 = torch.tensor([2]).to(dml)
- dml_algebra = tensor1 + tensor2
- dml_algebra.item()
输出:
3
配置成功
pytorch
参考:
ubuntu22.04安装rocm教程,AMD深度学习,6800xt配置pytorch、CUDA(已更新)本地安装torch_reven#1118的博客-CSDN博客
AMD显卡配置深度学习环境(ROCm-pytorch) - 知乎 (zhihu.com)
本次采用的是双系统的Ubuntu22.04
输入Linux指令:
- sudo apt update && sudo apt upgrade
- sudo apt install wget gnupg2
-
- # 22.04安装这个
- wget https://repo.radeon.com/amdgpu-install/5.6.1/ubuntu/jammy/amdgpu-install_5.6.50601-1_all.deb
- sudo apt install ./amdgpu-install_5.6.50601-1_all.deb
-
- # 然后安装单个用例
- sudo amdgpu-install --usecase=rocm,hip,mllib --no-dkms
- # 添加用户至render组
- sudo usermod -a -G video,render $LOGNAME
然后
重启系统!
输入Linux指令:
- # 显示gpu信息
- rocm-smi
-
- # 两项都显示gpu信息
- /opt/rocm/bin/rocminfo
- /opt/rocm/opencl/bin/clinfo
全部正常输出,说明显卡的ROCm驱动安装成功
可根据ROCm版本、python版本不同安装不同的python,链接如下:
download.pytorch.org/whl/torch/
我选择的是:torch-2.1.0+rocm5.6-cp38-cp38-linux_x86_64.whl
创建环境python3.8并进入:
- conda create -n pytorch python=3.8
- conda activate pytorch
下载对应版本的pytorch并安装:
- wget https://download.pytorch.org/whl/rocm5.6/torch-2.1.0%2Brocm5.6-cp38-cp38-linux_x86_64.whl
- pip install torch-2.1.0+rocm5.6-cp38-cp38-linux_x86_64.whl
进入python环境,输入代码:
- import torch
- torch.cuda.is_available()
输出为:
True
配置成功
还没尝试,哪天安装成功了我更一下
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。