赞
踩
【B站】
报告时间:2020年09月16日(星期三)晚上20:00(北京时间)
主题:源头活水:自监督与无监督学习探讨
主持人:姬艳丽(电子科技大学)
报告题目:Self-supervised Visual Representation Learning from Videos
proxy task
存在问题:
1.训练太弱
2.与下游任务不匹配
解决目的:
学习一个好的表达来predict下一帧
面临挑战:
1.反射光等环境影响
2.摄像者的晃动
3.场景转换
4.多种选择(车子往那儿开)【最终会blur】
**解决方法:**用相同的另一模态特征flow/text/sound
报告题目:变换共变性(Transformation Equvariance)与变换不变性(Transformation Invariance)原理在特征学习的中心作用:一种无监督深度学习的统一视角
希望能够将这种平移不变性推广,得到变换不变性的网络,得到变换共变性。
数学表达
变换不变性是变换共变性的特例
我们关心的是encoder部分,但传统的decoder需要重建图像所以需要和encoder近似的深,这样使得反向传播的梯度需要穿过DE,这使得网络在训练E的时候变的比较困难。
新的思路:不是decoder图像本身,而是decoder变换本身。decoder去decoder 变换,而不是image这种high level的信息,这样就使得decoder可以比较浅(一两层)
HR应该也满足IR的变换共变性
变换共变性:原始图像和变换后的图像在特征空间上有可区分性(平移后的图像 特征图也平移)【比如下游的分割任务,变换共变性很重要】
变换不变性不同的图像区分开来,同一个图像不同变换后的图像能够区分开来。
对比学习等基于变换不变性思想的方法,会将spatial的结构claps,对分类有效,但是对于下游的分割等其他任务,优势就没有那么大了。
能不能将两者有效的结合在一起?变换不变性+变换共变性
Panel嘉宾:
谢伟迪(VGG, University of Oxford)、齐国君(华为美国研究所)、宫辰(南京理工大学)、武智融(微软亚洲研究院)、左旺孟(哈尔滨工业大学)
Panel议题:
特别鸣谢本次Webinar主要组织者:
主办AC:姬艳丽(电子科技大学)
协办AC:左旺孟(哈尔滨工业大学)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。