当前位置:   article > 正文

Temporal Relational Reasoning in Videos_trn模型 动作识别 temporal relational reasoning

trn模型 动作识别 temporal relational reasoning

Temporal Relational Reasoning in Videos

框架

TRN

TRN(Temporal Relation Networks)

公式:
T 2 ( V ) = h ϕ ( ∑ i &lt; j g θ ( f i , f j ) ) T_{2}(V)=h_{\phi}\left(\sum_{i&lt;j} g_{\theta}\left(f_{i}, f_{j}\right)\right) T2(V)=hϕ(i<jgθ(fi,fj))

T 3 ( V ) = h ϕ ′ ( ∑ i &lt; j &lt; k g θ ′ ( f i , f j , f k ) ) T_{3}(V)=h_{\phi}^{\prime}\left(\sum_{i&lt;j&lt;k} g_{\theta}^{\prime}\left(f_{i}, f_{j}, f_{k}\right)\right) T3(V)=hϕi<j<kgθ(fi,fj,fk)

T 4 ( V ) = h ϕ ′ ( ∑ i &lt; j &lt; k &lt; l g θ ′ ( f i , f j , f k , f l ) ) T_{4}(V)=h_{\phi}^{\prime}\left(\sum_{i&lt;j&lt;k&lt;l} g_{\theta}^{\prime}\left(f_{i}, f_{j}, f_{k}, f_{l}\right)\right) T4(V)=hϕi<j<k<lgθ(fi,fj,fk,fl)

Multi-Scale Temporal Relations

M T N ( V ) = T 2 ( V ) + T 3 ( V ) … + T N ( V ) M T_{N}(V)=T_{2}(V)+T_{3}(V) \ldots+T_{N}(V) MTN(V)=T2(V)+T3(V)+TN(V)

优点

文章指出,TRN的强大之处在于能够解释视频常识,这个是优于C3D和I3D(后续会介绍,常用算法)的地方:

  1. 视频中具有代表性的画面有利于TRN识别一个活动;
  2. 对于同一类视频,具有很好的适用性;
  3. 对行为识别来说,TRN的时序性很重要,尤其是单方向的动作;
  4. 能够在动作的早期完成识别。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/985430
推荐阅读
相关标签
  

闽ICP备14008679号