当前位置:   article > 正文

Kubernetes 集成 Nvidia GPU (详细攻略)_kubernetes gpu

kubernetes gpu

Kubernetes 中已经实验性地支持管理多个节点上的 AMD / NVIDIA GPU (显卡)。 本文重点介绍在k8s集群中,集成Nvidia显卡容器资源调度。

整个实施过程流程总共分为三大步骤:

  • 安装Nvidia驱动和CUDA。
  • 安装nvidia-docker 2, 这个是支持nvidia显卡运行的容器运行时,默认的docker运行时是runc,该模块提供docker使用gpu资源的能力。
  • 安装 k8s-device-plugin, 这个插件用来和k8s集成,该模块提供k8s集群通过kubelet动态调度gpu资源的能力。

全部安装完成后,通过运行一个gpu计算容器来验证安装正确性。下面看详细的安装过程:

一、实施环境

操作系统

Ubuntu-20.04.1

Kubernetes Cluster Version

1.22.15

Docker Version

docker-ce-20.10.21

GPU

tesla-A100

二、安装Nvidia驱动

2.1 官方驱动安装

2.1.1 驱动下载

下载地址  本示例不从官方下载驱动安装,采用更加方便的PPA方式。

2.1.2 安装

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/657773
推荐阅读
相关标签