当前位置:   article > 正文

Vision Transformer 实现图片分类_vit_base_patch16_224.pth

vit_base_patch16_224.pth

Vision Transformer 实现图片分类

采用vit_base_patch16_224.pth 作为预训练模型进行加载,并冻结其参数,微调全连接最后一层,要不然训练时间太长了

读数据

data_transform = {
   
    # 训练中的数据增强和归一化
    'train': transforms.Compose([
        transforms.Resize(size=(224,224))
  • 1
  • 2
  • 3
  • 4
本文内容由网友自发贡献,转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/287852
推荐阅读
相关标签
  

闽ICP备14008679号