当前位置:   article > 正文

高性价比模型 TSM,用 2D 的成本达到 3D 的效果_tsm模型的具体计算量

tsm模型的具体计算量

出品人:Towhee 技术团队

MIT 和 IBM Watson AI Lab 联合提出一种高效的视频理解模型 TSM(Temporal Shift Module),在保留 2D 效率的同时,通过时间位移模拟 3D 建模提高模型性能。以往的模型理解视频时,需要在传统图片分析的基础上耗费大量算力补充关于时间的信息。TSM 的出现,使得低成本实现高性能视频理解模型成为可能。

TSM:Temporal shifting

2D CNN 和 3D CNN是视频理解中最常用的两个方法:使用 2D CNN 模型运算量少,但会丧失部分时间信息;而使用 3D CNN 虽然效果好,但运算量极大。面对这样的情况,TSM 将时间位移模块嵌入 2D CNN,从而可以在不添加任何额外的计算量和参数的情况下,轻松的达到与 3D CNN 效果相当的视频理解能力。

 

参考资料:

模型用例:action-classification/tsm

论文: TSM: Temporal Shift Module for Efficient Video Understanding

更多资料:

视频分类 | 论文 2019 TSM: Temporal Shift Module for Efficient Video Understanding

TSM:Temporal Shift Module for 视频理解

更多项目更新及详细内容请关注我们的项目,您的关注是我们用爱发电的强大动力,欢迎 star, fork, slack 三连 :)

zilliz用户交流

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/985379
推荐阅读
相关标签
  

闽ICP备14008679号