当前位置:   article > 正文

TensorRT safety runtime

tensorrt safety

在tensorrt上移植深度学习模型的时候需要在其安全模式下进行移植。有好多坑,这里记录一下tensorrt安全模式下的一些限制。:

  1. TensorRT safety runtime 不支持DLA
  2. safety runtime 不支持implicit batch size。batch size 必须是explicit。创建configurations时必须包含NetworkDefinitionCreationFlag::kEXPLICIT_BATCH .
  3. safety runtime不支持动态尺寸
  4. safety runtime支持float half int8等数据类型作为输入输出。支持所有未弃用的格式(kLINEAR , kCHW2 , kHWC8 , kCHW4 , kCHW16 , and kCHW32)
  5. 在safety runtime时大多数的操作将在FP16 (kHALF)或INT8 (kINT8)精度中执行,并根据需要重新格式化。FP32精度值支持kernel size时1x1,没有padding,stride=1,没有dilation(FP32下不支持空洞卷积),group=1的卷积。
  6. 对于所有的层, b a t c h S i z e ≤ 16 batchSize \leq 16 batchSize16 c h a n n e l s ≤ 4096 channels\leq4096 channels4096 ,并且特殊维度H和W也 ≤ 4096 \leq4096 4096
  7. 包含padding在内,网络中的 t e n s o r ≤ 2 31 − 1 tensor\leq2^{31}-1 tensor2311,请注意,如果通道大小不是矢量大小的精确倍数,则向量化格式具有填充。例如,kCHW32格式如果C=1将占用32倍的空间。
  8. 在TensorRT安全运行时,只支持计算能力7.2的gpu。TensorRT代理运行时支持计算能力7.0(主机GPU)、7.2(目标硬件)和7.5(主机GPU和目标硬件)的GPU。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/神奇cpp/article/detail/999574
推荐阅读
相关标签
  

闽ICP备14008679号