当前位置:   article > 正文

ESXi 6.7 ubuntu GPU直连踩坑记_driver : open-vm-tools-desktop - distro free

driver : open-vm-tools-desktop - distro free

环境:

      ESXi 7.6 (下载自网络,文件名为:ESXI670_Build13473784 By SPK.iso)
      GeForce GTX 1070
      Ubuntu 18.04.4 
      为什么特意写版本型号呢?实际证明,这个坑是ESXi的BUG,打了补丁后,就没坑了。

步骤:

       其实网络上的步骤没问题,做记录如下:
       1.登录ESXi web管理界面,主机/管理/硬件/PCI设备中,选中显卡,点击“切换直连”,重启服务器;
       2. 进入菜单 虚拟机/虚拟机名/编辑,添加其他设备,选择PCI设备,选中显卡。启动虚拟机。
       3. 软件安装驱动步骤, 然后重启。

  1. # 如果提示找不到命令,请apt-get install ubuntu-drivers-common
  2. root@xinbin:~# ubuntu-drivers devices
  3. == /sys/devices/pci0000:00/0000:00:0f.0 ==
  4. modalias : pci:v000015ADd00000405sv000015ADsd00000405bc03sc00i00
  5. vendor : VMware
  6. model : SVGA II Adapter
  7. manual_install: True
  8. driver : open-vm-tools-desktop - distro free
  9. == /sys/devices/pci0000:00/0000:00:15.0/0000:03:00.0 ==
  10. modalias : pci:v000010DEd00001B81sv00007377sd00000000bc03sc00i00
  11. vendor : NVIDIA Corporation
  12. model : GP104 [GeForce GTX 1070]
  13. driver : nvidia-driver-440 - third-party free recommended
  14. driver : nvidia-driver-390 - distro non-free
  15. driver : nvidia-driver-435 - distro non-free
  16. driver : nvidia-driver-430 - distro non-free
  17. driver : xserver-xorg-video-nouveau - distro free builtin
  18. #根据提示,安装指定驱动,比如我安装的是
  19. apt-get install nvidia-driver-440

        4. 接着坑来了,也是其他网上资料没有提到的。驱动安装完了,先不要急着安装CUDA。先运行以下命令确认驱动是否正常

  1. root@xinbin:~# nvidia-smi
  2. Wed Mar 4 02:39:53 2020
  3. +-----------------------------------------------------------------------------+
  4. | NVIDIA-SMI 440.33.01 Driver Version: 440.33.01 CUDA Version: 10.2 |
  5. |-------------------------------+----------------------+----------------------+
  6. | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
  7. | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
  8. |===============================+======================+======================|
  9. | 0 GeForce GTX 1070 On | 00000000:03:00.0 Off | N/A |
  10. | 47% 37C P8 15W / 160W | 1MiB / 8119MiB | 0% Default |
  11. +-------------------------------+----------------------+----------------------+
  12. +-----------------------------------------------------------------------------+
  13. | Processes: GPU Memory |
  14. | GPU PID Type Process name Usage |
  15. |=============================================================================|
  16. | No running processes found |
  17. +-----------------------------------------------------------------------------+
  18. 以上是正确的提示,如果遇到以下提示,那么恭喜你,进坑了。为了出坑,我用了几乎一天的时间。
  19. root@xinbin:~# nvidia-smi
  20. Unable to determine the device handle for GPU 0000:03:00.0: Unknown Error

    解决这个问题,我尝试过很多方法,其实很简单,也是大多数博客提到的办法:
 

  1. hypervisor.cpuid.v0 = FALSE
  2. # 给虚拟机增加这个配置,不需要手工修改 .vmx 文件。
  3. # 只需要在编辑/虚拟机选项/高级/编辑配置 中,添加这个参数即可。

    如果一切OK,那么本文就没必要存在了。配置修改后,虚拟机无法启动了,提示  pref event create on cpu 0 failed with -2 。看来是上面加的配置出了问题。经过N多尝试,最后在国外网站上得到了提示,给ESXi打补丁。打完补丁后,一切OK,显卡正常工作了。
      以下是补丁方法:
     1. 在 https://my.vmware.com/group/vmware/patch#search 下载补丁,我下载的是update-from-esxi6.7-6.7_update03.zip.zip,这是一个累计更新包;(写完博客后,我把这个文件传到csdn)
      2. 通过文件管理,上传此文件;
      3. 启用ssh, 进入维护模式;
      4. 使用ssh登录ESXi,运行以下命令

  1. esxcli software vib install -d "/vmfs/volumes/datastore1/update-from-esxi6.7-6.7_update03.zip.zip"

      5. 补丁安装完后,重启服务器。
    

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/145985
推荐阅读
相关标签
  

闽ICP备14008679号