赞
踩
原文链接:https://ghlcode.cn/posts/821935
建议安装server版,通过ssh远程使用
安装NVIDIA显卡驱动、CUDA、cudnn
sudo apt-get install lxd zfsutils-linux bridge-utils
查看可用磁盘和分区
sudo fdisk -l
可以看到这块磁盘一共3.65T,只使用了500G,剩余的空间专门留出来用于LXD容器的。
查看分区
sudo fdisk /dev/sda
按下图操作,将磁盘所剩空间全部作为容器的存储空间。分区为 /dev/sda2
。
lxd init
这里面的配置错了也没关系,还可以使用 sudo lxc profile edit default
再次修改配置
sudo lxc launch ubuntu:20.04 lgh
sudo lxc exec lgh bash
这里进入的是root用户,实际上容器里面还有一个用户名为 ubuntu
的默认用户
passwd root
passwd ubuntu
网上说默认密码和用户名相同,我输入一直双周,因此直接重置了密码
编辑 /etc/ssh/sshd_config
文件,将 PasswordAuthentication
改为yes
sudo nano /etc/ssh/sshd_config
# 重启ssh服务
sudo /etc/init.d/ssh restart
exit
sudo lxc list
sudo lxc config device add lgh proxy0 proxy listen=tcp:{宿主机IP}:6002 connect=tcp:10.228.141.116:22 bind=host
这里将宿主机的6002端口映射到了容器的22端口,ssh连接宿主机的6002端口即可进入容器
ssh ubuntu@{宿主机IP} -p 6002
lxc config device add {容器名} gpu gpu
lxc config device add {容器名} gpu0 gpu id=0
与宿主机的显卡版本必须一致,需要注意的是容器里面安装显卡驱动时需要加上后面的参数,安装时不需要安装到内核
sudo sh ./NVIDIA-Linux-X86_64-[YOURVERSION].run --no-kernel-module
可以将配置好的容器打包成镜像模板,方便后续的容器创建
停止容器
lxc stop {容器名}
打包
sudo lxc publish {容器名} --alias {镜像名} --public
lxc profile device add default data disk source=/data/lxd-data path=/opt/data
宿主机的英伟达驱动重启了后宿主机不使用,容器内是不能用的,解决方法如下
sudo -S /sbin/modprobe nvidia-uvm
D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`
sudo -S mknod -m 666 /dev/nvidia-uvm c $D 0
shenuiuin/LXD_GPU_SERVER: 实验室GPU服务器的LXD虚拟化 (github.com)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。