当前位置:   article > 正文

昇思25天学习打卡营第十四天|Vision Transformer图像分类

昇思25天学习打卡营第十四天|Vision Transformer图像分类

       VIT模型是自然语言处理和计算机视觉两个领域的融合结晶,在不依赖卷积操作的情况下,依然可以在图像分类任务上达到很好的效果。

      VIT模型的主体结构是基于Transform模型的Encoder部分(部分结构顺序有调整)。

        环境准备与数据读取,开始实验之前,需要确保本地已经安装了Python环境并安装了MindSpore。请确保你的数据集路径如下结构。

68935e583ac64a9393c0b14b5f6d39a6.png

25286be8446542bea0a7679969f81b44.jpg 

 eb396a9289364c918f02bf7a114350ac.jpg

1c1c826bf0654ba78c4282b3a615f9db.jpg 

25aa7a98b9804248bee6e982440a0b70.jpg 

db8f128b6d244661b4e46a4002b39da6.jpg 

b1a4101ee5d3401aab09ed0e280458a0.jpg 

cc848bcfa68b46d4b4f26de8490d0c15.jpg 

43d8a03c38bb4a07b607c40b66bf05e0.jpg 

9eab7ebd936144478b116ab473f653c1.png 

a992bef86e414605824fc57287aeae67.png 

591a105c62e64c12a290ae94a5295e31.jpg 

77c8c8121ace4dec92cf858ef07b337a.png 

908a020d0c91463a808601bced0c6ebc.png 

2374c6207c9942639f81e55774599efc.jpg 

d2d2d180917e4cc5ba7793dcec2edcea.png 

b892abd28ddd449baa4cb79e47e97244.png 

f6645cc686c54c1cb45303643e467a1c.jpg 

e89e988a89404ea4b541e564f3c745dc.jpg 

5de43e94a07344f4b91810fe4e577671.png 

13db3c33d5e344dd8a2077a198b50d41.png 

8ef0146457c04bfdb0d8e5b4aac6cc64.jpg 

26476a510a644ae580ef16d794d32856.png 

4075cccd26db4698af8806f5057da14e.jpg 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/887068
推荐阅读
相关标签
  

闽ICP备14008679号