当前位置:   article > 正文

Windows11下NVIDA CUDA,cuDNN和TensorRT安装教程 用tensorRT加速yolov5全记录_nvidia cuda11.8 win11

nvidia cuda11.8 win11

笔者是在windows下进行GPU环境的配置,以及Cuda、CuDNN、TensorRT的安装。

一、查看你本机的显卡

首先你要看你的电脑是否有NVIDIA的独立显卡,你可以在设备管理器-显示适配器中查看。

二、CUDA的下载与安装

笔者这里选择的是CUDA11.8。你首先要去CUDA安装官方你所要安装的CUDA Toolkit,比如这样。

我们一般选择local模式,这个包有几个G。使用这个模式就不会因为网络问题而中断安装的过程了。下载好之后双击exe文件,会显示以下窗口,我们默认OK就行。这个路径是会暂时存放安装中的缓存,安装结束后,这一些缓存会自动清除掉,所以不需要管。

点击同意,然后继续下一步

选择自定义安装,选择这几项就差不多了,其他的你用不到,就不用安装了,节省安装的时间。

接下来等待安装结束即可

你可以在cmd中执行nvcc -V或者nvidia-smi,如果不报错,就代表安装成功。

打开查看显卡cuda,最高安装GPU版本

三、CuDNN的下载与安装

 cuDNN安装起来比较简单,就是下载安装包。解压之后放到CUDA下的指定文件夹下即可。你可以通过这里CuDNN下载官网选择你想要的CuDNN版本。我选择的是cudnn-windows-x86_64-8.9.6.50_cuda12-archive。

把下载后的压缩包进行解压,分别将cuda/include、cuda/lib、cuda/bin三个目录中的内容拷贝到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8对应的include、lib、bin目录下就可以了。

四、TensorRT的下载与安装

去这里TensorRT下载官方下载TensorRT-8.6.1.6.Windows10.x86_64.cuda-11.8并解压。

 

与安装CuDNN的步骤类似,只需要将文件放到CUDA下的指定文件夹下即可。

核心重点:

将 TensorRT-8.5.2.2\include中头文件 copy 到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\include
将TensorRT-8.5.2.2\lib 中所有lib文件 copy 到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\lib\x64
将TensorRT-8.5.2.2\lib 中所有dll文件copy 到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\bin

1. Python安装TensorRT库

    点开python

   在目录上打上cmd

查看自己的虚拟环境: conda env list

小编这里用的是yolov5的虚拟环境变量

激活虚拟环境:conda activate yolov5

查看当前目录:dir

小编这里python是3.9的,所以把目录3.9的都下载完

pip install ./tensorrt_dispatch-8.6.1-cp39-none-win_amd64.whl

pip install ./tensorrt_lean-8.6.1-cp39-none-win_amd64.whl

pip install ./tensorrt-8.6.1-cp39-none-win_amd64.whl

 安装完输入:pip list 查看安装包

五、进行测试

建立一个python工程输入代码进行测试

  1. import tensorrt as trt
  2. if __name__ == "__main__":
  3. print(trt.__version__)
  4. print("hello trt!!")

 结果

六、用tensorRT加速yolov5

1.点开yolov5工程里的export.py 

这个部分是模型的转换部分,将模型转换为torchscript、 onnx、coreml等格式,用于后面的应用中,方便将模型加载到各种设备上。

2、导入需要的包和基本配置注释

  1. import argparse # 解析命令行参数模块
  2. import sys # sys系统模块 包含了与Python解释器和它的环境有关的函数
  3. import time # 时间模块 更底层
  4. from pathlib import Path # Path将str转换为Path对象 使字符串路径易于操作的模块
  5. import torch # PyTorch深度学习模块
  6. import torch.nn as nn # 对torch.nn.functional的类的封装 有很多和torch.nn.functional相同的函数
  7. from torch.utils.mobile_optimizer import optimize_for_mobile # 对模型进行移动端优化模块
  8. FILE = Path(__file__).absolute() # FILE = WindowsPath 'F:\yolo_v5\yolov5-U\export.py'
  9. # 将'F:/yolo_v5/yolov5-U'加入系统的环境变量 该脚本结束后失效
  10. sys.path.append(FILE.parents[0].as_posix()) # add yolov5/ to path
  11. from models.common import Conv
  12. from models.yolo import Detect
  13. from models.experimental import attempt_load
  14. from models.activations import Hardswish, SiLU
  15. from utils.general import colorstr, check_img_size, check_requirements, file_size, set_logging
  16. from utils.torch_utils import select_device

3、文件入口

脚本执行入口

  1. if __name__ == "__main__":
  2. opt = parse_opt()
  3. main(opt)

4、parse_opt

设置opt参数。

  1. def parse_opt():
  2. """
  3. weights: 要转换的权重文件pt地址 默认='../weights/best.pt'
  4. img-size: 输入模型的图片size=(height, width) 默认=[640, 640]
  5. batch-size: batch大小 默认=1
  6. device: 模型运行设备 cuda device, i.e. 0 or 0,1,2,3 or cpu 默认=cpu
  7. include: 要将pt文件转为什么格式 可以为单个原始也可以为list 默认=['torchscript', 'onnx', 'coreml']
  8. half: 是否使用半精度FP16export转换 默认=False
  9. inplace: 是否set YOLOv5 Detect() inplace=True 默认=False
  10. train: 是否开启model.train() mode 默认=True coreml转换必须为True
  11. optimize: TorchScript转化参数 是否进行移动端优化 默认=False
  12. dynamic: ONNX转换参数 dynamic_axes ONNX转换是否要进行批处理变量 默认=False
  13. simplify: ONNX转换参数 是否简化onnx模型 默认=False
  14. opset-version: ONNX转换参数 设置版本 默认=10
  15. """
  16. parser = argparse.ArgumentParser()
  17. parser.add_argument('--weights', type=str, default='../weights/best.pt', help='weights path')
  18. parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='image (height, width)')
  19. parser.add_argument('--batch-size', type=int, default=1, help='batch size')
  20. parser.add_argument('--device', default='cpu', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
  21. parser.add_argument('--include', nargs='+', default=['torchscript', 'onnx', 'coreml'], help='include formats')
  22. parser.add_argument('--half', action='store_true', help='FP16 half-precision export')
  23. parser.add_argument('--inplace', action='store_true', help='set YOLOv5 Detect() inplace=True')
  24. parser.add_argument('--train', default="True", action='store_true', help='model.train() mode')
  25. parser.add_argument('--optimize', action='store_true', help='TorchScript: optimize for mobile')
  26. parser.add_argument('--dynamic', action='store_true', help='ONNX: dynamic axes')
  27. parser.add_argument('--simplify', action='store_true', help='ONNX: simplify model')
  28. parser.add_argument('--opset-version', type=int, default=10, help='ONNX: opset version')
  29. opt = parser.parse_args()
  30. return opt

5、main

  1. def main(opt):
  2. # 初始化日志
  3. set_logging()
  4. print(colorstr('export: ') + ', '.join(f'{k}={v}' for k, v in vars(opt).items())) # 彩色打印
  5. # 脚本主体
  6. run(**vars(opt))

4、run

脚本主体,可将pt权重文件转化为[‘torchscript’, ‘onnx’, ‘coreml’]三种格式权重文件。

  1. def run(weights='../weights/yolov5s.pt', img_size=(640, 640), batch_size=1, device='cpu',
  2. include=('torchscript', 'onnx', 'coreml'), half=False, inplace=False, train=False,
  3. optimize=False, dynamic=False, simplify=False, opset_version=12,):
  4. """
  5. weights: 要转换的权重文件pt地址 默认='../weights/best.pt'
  6. img-size: 输入模型的图片size=(height, width) 默认=[640, 640]
  7. batch-size: batch大小 默认=1
  8. device: 模型运行设备 cuda device, i.e. 0 or 0,1,2,3 or cpu 默认=cpu
  9. include: 要将pt文件转为什么格式 可以为单个原始也可以为list 默认=['torchscript', 'onnx', 'coreml']
  10. half: 是否使用半精度FP16export转换 默认=False
  11. inplace: 是否set YOLOv5 Detect() inplace=True 默认=False
  12. train: 是否开启model.train() mode 默认=True coreml转换必须为True
  13. optimize: TorchScript转化参数 是否进行移动端优化 默认=False
  14. dynamic: ONNX转换参数 dynamic_axes ONNX转换是否要进行批处理变量 默认=False
  15. simplify: ONNX转换参数 是否简化onnx模型 默认=False
  16. opset-version: ONNX转换参数 设置版本 默认=10
  17. """
  18. t = time.time() # 获取当前时间
  19. include = [x.lower() for x in include] # pt文件要转化的格式包括哪些
  20. img_size *= 2 if len(img_size) == 1 else 1 # expand
  21. # Load PyTorch model
  22. device = select_device(device) # 选择设备
  23. assert not (device.type == 'cpu' and half), '--half only compatible with GPU export, i.e. use --device 0'
  24. model = attempt_load(weights, map_location=device) # load FP32 model
  25. labels = model.names # 载入数据集name
  26. # Input
  27. gs = int(max(model.stride)) # grid size (max stride)
  28. img_size = [check_img_size(x, gs) for x in img_size] # verify img_size are gs-multiples
  29. img = torch.zeros(batch_size, 3, *img_size).to(device) # 自定义一张图片 输入model
  30. # Update model
  31. # 是否采样半精度FP16训练or推理
  32. if half:
  33. img, model = img.half(), model.half() # to FP16
  34. # 是否开启train模式
  35. model.train() if train else model.eval() # training mode = no Detect() layer grid construction
  36. # 调整模型配置
  37. for k, m in model.named_modules():
  38. # pytorch 1.6.0 compatibility(关于版本兼容的设置) 使模型兼容pytorch 1.6.0
  39. m._non_persistent_buffers_set = set()
  40. # assign export-friendly activations(有些导出的格式是不兼容系统自带的nn.Hardswish、nn.SiLU的)
  41. if isinstance(m, Conv):
  42. if isinstance(m.act, nn.Hardswish):
  43. m.act = Hardswish()
  44. elif isinstance(m.act, nn.SiLU):
  45. m.act = SiLU()
  46. # 模型相关设置: Detect类的inplace参数和onnx_dynamic参数
  47. elif isinstance(m, Detect):
  48. m.inplace = inplace
  49. m.onnx_dynamic = dynamic # 设置Detect的onnx_dynamic参数为dynamic
  50. # m.forward = m.forward_export # assign forward (optional)
  51. for _ in range(2):
  52. y = model(img) # dry runs 前向推理2次
  53. print(f"\n{colorstr('PyTorch:')} starting from {weights} ({file_size(weights):.1f} MB)")
  54. # ================================ 转换模型 ====================================
  55. # TorchScript export -----------------------------------------------------------------------------------------------
  56. if 'torchscript' in include or 'coreml' in include:
  57. prefix = colorstr('TorchScript:')
  58. try:
  59. print(f'\n{prefix} starting export with torch {torch.__version__}...')
  60. f = weights.replace('.pt', '.torchscript.pt') # export torchscript filename
  61. ts = torch.jit.trace(model, img, strict=False) # convert
  62. # optimize_for_mobile: 移动端优化
  63. (optimize_for_mobile(ts) if optimize else ts).save(f) # save
  64. print(f'{prefix} export success, saved as {f} ({file_size(f):.1f} MB)')
  65. except Exception as e:
  66. print(f'{prefix} export failure: {e}')
  67. # ONNX export ------------------------------------------------------------------------------------------------------
  68. if 'onnx' in include:
  69. prefix = colorstr('ONNX:')
  70. try:
  71. import onnx
  72. print(f'{prefix} starting export with onnx {onnx.__version__}...') # 日志
  73. f = weights.replace('.pt', '.onnx') # export filename
  74. # convert
  75. torch.onnx.export(model, img, f, verbose=False, opset_version=opset_version,
  76. training=torch.onnx.TrainingMode.TRAINING if train else torch.onnx.TrainingMode.EVAL,
  77. do_constant_folding=not train, # 是否执行常量折叠优化
  78. input_names=['images'], # 输入名
  79. output_names=['output'], # 输出名
  80. # 批处理变量 若不想支持批处理或固定批处理大小,移除dynamic_axes字段即可
  81. dynamic_axes={'images': {0: 'batch', 2: 'height', 3: 'width'}, # shape(1,3,640,640)
  82. 'output': {0: 'batch', 1: 'anchors'} # shape(1,25200,85)
  83. } if dynamic else None)
  84. # Checks
  85. model_onnx = onnx.load(f) # load onnx model
  86. onnx.checker.check_model(model_onnx) # check onnx model
  87. # print(onnx.helper.printable_graph(model_onnx.graph)) # print
  88. # Simplify
  89. if simplify:
  90. try:
  91. check_requirements(['onnx-simplifier'])
  92. import onnxsim
  93. print(f'{prefix} simplifying with onnx-simplifier {onnxsim.__version__}...')
  94. # simplify 简化
  95. model_onnx, check = onnxsim.simplify(
  96. model_onnx,
  97. dynamic_input_shape=dynamic,
  98. input_shapes={'images': list(img.shape)} if dynamic else None)
  99. assert check, 'assert check failed'
  100. onnx.save(model_onnx, f) # save
  101. except Exception as e:
  102. print(f'{prefix} simplifier failure: {e}')
  103. print(f'{prefix} export success, saved as {f} ({file_size(f):.1f} MB)')
  104. except Exception as e:
  105. print(f'{prefix} export failure: {e}')
  106. # CoreML export ----------------------------------------------------------------------------------------------------
  107. # 注意: 转换CoreML时必须设置model.train 即opt参数train为True
  108. if 'coreml' in include:
  109. prefix = colorstr('CoreML:')
  110. try:
  111. import coremltools as ct
  112. print(f'{prefix} starting export with coremltools {ct.__version__}...')
  113. assert train, 'CoreML exports should be placed in model.train() mode with `python export.py --train`'
  114. model = ct.convert(ts, inputs=[ct.ImageType('image', shape=img.shape, scale=1 / 255.0, bias=[0, 0, 0])]) # convert
  115. f = weights.replace('.pt', '.mlmodel') # export coreml filename
  116. model.save(f) # save
  117. print(f'{prefix} export success, saved as {f} ({file_size(f):.1f} MB)')
  118. except Exception as e:
  119. print(f'{prefix} export failure: {e}')
  120. # Finish
  121. print(f'\nExport complete ({time.time() - t:.2f}s). Visualize with https://github.com/lutzroeder/netron.')

5、使用
三种格式想要用哪种就要下载相应的包:

torchscript 不需要下载对应的包 有Torch就可以
onnx: pip install onnx
coreml: pip install coremltools

 然后想要转换哪张格式在opt参数include参数list中中加入对应名字就可以,如:

转换效果

转换前:

转换后:

 

 发现报错:

需要将Opset参数default设为15:

把onnx成局部变量设置成全局变量

把onnx包给卸载掉,让yolov5从新安装匹配版本onnx

parser.add_argument("--opset", type=int, default=15, help="ONNX: opset version")

执行代码,转换成功:

七、总结

确保正确导出onnx文件需要注意以下几个方面:

1:任何用到shape/size返回值的参数时,例如tensor.view(tensor.size(0), -1)这种操作,避免直接使用tensor.size()的返回值,而是加上int强转,例如tensor.view((tensor.size(0)), -1),断开跟踪。

2:nn.Upsample或者nn.functional.interpolate函数,使用scale_factor指定倍率,而不是用size参数指定。

3:reshape/view操作,batch指定为-1,其它通过计算得到。

4:动态batch指定,torch.onnx.export指定dynamic_axes参数,只指定batch维度动态。

5:opset_version=11或11以上版本。

6:避免使用inplace操作,y[..., 0:2] = y[..., 0:2]*2 - 0.5

7:避免出现5个维度,虽然trt对5维度支持比较好,其它框架不一定支持。

8:当执行完以上操作,依然存在gather/shape/Unsqueeze等奇怪的节点,可以尝试使用onnx-simplifer过一遍模型,简化节点。

博客编写不易,求点赞收藏。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/696811
推荐阅读
相关标签
  

闽ICP备14008679号