当前位置:   article > 正文

《Swin Transformer Hierarchical Vision Transformer using Shifted Windows》论文超详细解读(翻译+精读)_swin transformer: hierarchical vision transformer

swin transformer: hierarchical vision transformer using shifted windows

前言 

《Swin Transformer Hierarchical Vision Transformer using Shifted Windows》作为2021 ICCV最佳论文,屠榜了各大CV任务,性能优于DeiT、ViT和EfficientNet等主干网络,已经替代经典的CNN架构,成为了计算机视觉领域通用的backbone,是继Vit之后的Transformer在CV领域的巅峰之作。它基于ViT模型的思想,创新性地引入了滑动窗口机制,让模型能够学习到跨窗口的信息,同时通过下采样层,使得模型能够处理超分辨率的图片,节省计算量以及能够关注全局和局部的信息。接下来我们就一起通过论文了解一下吧!

学习资料: 

962f7cb1b48f44e29d9beb1d499d0530.gif​   

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/909630
推荐阅读
相关标签