赞
踩
《Swin Transformer Hierarchical Vision Transformer using Shifted Windows》作为2021 ICCV最佳论文,屠榜了各大CV任务,性能优于DeiT、ViT和EfficientNet等主干网络,已经替代经典的CNN架构,成为了计算机视觉领域通用的backbone,是继Vit之后的Transformer在CV领域的巅峰之作。它基于ViT模型的思想,创新性地引入了滑动窗口机制,让模型能够学习到跨窗口的信息,同时通过下采样层,使得模型能够处理超分辨率的图片,节省计算量以及能够关注全局和局部的信息。接下来我们就一起通过论文了解一下吧!
学习资料:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。