当前位置:   article > 正文

【AI服务器搭建】CUDA环境_自己搭建ai服务器

自己搭建ai服务器

基于Ubuntu 18.04系统

一、安装Nvidia驱动

使用显卡的基础,直接使用ubuntu仓库安装

1. 首先查看显卡可用的驱动

ubuntu-drivers devices

2. 安装推荐驱动

sudo apt install nvidia-driver-470-server

3. 查看安装是否成功

nvidia-smi

参考:Ubuntu下安装NVIDIA驱动的三种方法_Willard Leozi的博客-CSDN博客_ubuntunvidia驱动安装官方 GeForce 驱动程序 | NVIDIA

二、 CUDA环境安装

多数AI框架通过cuda api 来使用英伟达显卡进行高性能计算,cuda开发者官网

1. 去 CUDA Toolkit 发布日志查看驱动支持的cuda版本

 2. 去历史发布版本里找到需要的CUDA版本安装

根据官网给出教程完成安装

3. CUDA环境变量配置 

若仅给当前用户配置编辑~/.bashrc 在最后添加

若给所有用户配置:在/etc/profile.d/ 目录下新建cuda11.4_env.sh并添加

  1. export PATH=/usr/local/cuda/bin:$PATH
  2. export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

4. 测试是否安装成功

cuda安装目录下有一些samples程序,可以尝试进行编译和运行。

  1. cd /usr/local/cuda/samples/1_Utilities/deviceQuery
  2. sudo make clean
  3. sudo make -j8
  4. ./deviceQuery

 3. 关于卸载方法

CUDA 安装引导手册里有卸载方式

 三、安装cuDNN

cuDNN是基于GPU加速的AI算子库 。

1. 首先去cuDNN网站注册一个账号,然后去历史发布版里下载对应cuda版本的cuDNN库。

2. 解压下载安装包

得到一个"cuda/" 目录

tar xvf cudnn-11.4-linux-x64-v8.2.4.15.tgz

3. 安装

即把cuda目录下的内容安装到系统的CUDA Toolkit的安装目录中。

  1. # 复制cudnn头文件
  2. sudo cp cuda/include/* /usr/local/cuda-11.4/include/
  3. # 复制cudnn的库
  4. sudo cp cuda/lib64/* /usr/local/cuda-11.4/lib64/
  5. # 给所有用户添加cudnn.h的访问权限
  6. sudo chmod a+r /usr/local/cuda-11.4/include/cudnn.h

4. 查看是否安装成功

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

出现版本定义信息则安装成功。

四、其他

1. 显卡信息

  1. # 查看显卡设备
  2. lspci |grep -i nvidia
  3. # 查看瞎看型号
  4. nvidia-smi
  5. # 查看驱动信息
  6. cat /proc/driver/nvidia/version

2. CUDA信息

  1. # 1.查看cuda版本
  2. nvcc -V
  3. # 2. 查看cuda版本
  4. cat /usr/local/cuda/version.txt

3. cuDNN信息

查看cudnn.h头文件

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/239349
推荐阅读
相关标签
  

闽ICP备14008679号