赞
踩
yum -y install gcc kernel-devel kernel-headers
显卡驱动 https://www.nvidia.cn/Download/index.aspx?lang=cn
chmod u+x NVIDIA-Linux-x86_64-440.82.run
./NVIDIA-Linux-x86_64-440.82.run --add-this-kernel --kernel-source-path=/usr/src/kernels/3.10.0-1127.8.2.el7.x86_64/
会生成 NVIDIA-Linux-x86_64-440.82-custom.run
再运行NVIDIA-Linux-x86_64-440.82-custom.run
运行 nvidia-smi 有正常显示则驱动正常
注:驱动可以安装最新的,但是cuda版本和cudnn要根据要安装的tensorflow-gpu对应的版本来配置,
比如我要用的1.15.2的版本对应的是cuda10.0.0一定不要安装高版本的,当时安装了10.2的版本,gpu也能用,但是有问题,实际上还是在cpu上跑的,切记切记切记不要以为高版本的cuda就是好,一定要多大脚配大多鞋。参考
https://tensorflow.google.cn/install/source
其实是因为CUDA 有两种API,分别是 运行时 API 和 驱动API,即所谓的 Runtime API 与 Driver API。
nvidia-smi 的结果除了有 GPU 驱动版本型号,还有 CUDA Driver API的型号,这里是 11.0。
而nvcc的结果是对应 CUDA Runtime API,这里要求的nvcc -V 必须是cuda10.0.0,nvidia-smi看到的版本更高无所谓。
安装cuda10 https://developer.nvidia.com/cuda-toolkit-archive
chmod u+x cuda_10.0.130_410.48_linux.run
./cuda_10.0.130_410.48_linux.run
会有提示 "Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
不安装,因为我们已经 安了新的440.82的驱动
这之后的要选yes
安装cudnn https://developer.nvidia.com/rdp/cudnn-download
yum install libcudnn7-7.6.5.32-1.cuda10.0.x86_64.rpm
编辑环境变量
vi ~/.bashrc
增加
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:/usr/local/cuda-10.0/extras/CUPTI/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda-10.0
export PATH=$CUDA_HOME/bin:$PATH
保存并退出
运行
source ~/.bashrc
这时可以运行
nvcc -V
会输出如下
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
则表示成功安装
这时也可以运行
cat /usr/local/cuda/version.txt
得到输出
CUDA Version 10.0.130
启动后开放端口 ,
iptables -I INPUT -p TCP --dport 5000 -j ACCEPT
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。