2021计算机视觉-包揽所有前沿论文源码 -上半年

作者：小丑西瓜9 | 2024-04-04 14:02:37

踩

大家是否遇到过这种情况，就是在工作或者学习的时候，想去找一些方向的网络，但是呢，尴尬的是，老旧的网络里不想要，前沿的网络又不知道有哪些。为了解决大家的这个困扰，本人决定收集2021年上半年大部分前沿的网络相关链接，之后我会( $\color{blue}{文末附带}$ $\color{blue}{公众号 -}$ $\color{blue}{ 海量资源}。$ )：

$\color{red}{每周一更新一次（下面是我多年年收集的链接地址） }$
计算机视觉-包揽所有前沿论文源码

有兴趣的朋友可以加微信：17575010159 相互讨论技术。若是帮助到了你什么，一定要记得点赞！因为这是对我最大的鼓励!

视觉工作项目-为后来的你，提供一份帮助！
$\color{red}{上面这个链接是我所有工作项目的详细解。}$

（09）不经意的“走两步”就能锁定身份信息，这就是步态识别黑科技。
推荐一篇新出的综述，全面介绍了步态识别的发展，包含技术演进、主要数据集、现在技术达到的水平，了解深度学习步态识别的必读论文。
Deep Gait Recognition: A Survey https://arxiv.org/pdf/2102.09546.pdf

（10）#手部跟踪# 人手是极其灵活的，存在各种复杂的自接触和遮挡，给跟踪带来了困难。Facebook现实实验室近日发明了一种极其精确的人手跟踪方法，通过在视觉模型中加入物理特性限制达成。无论是单手还是双手，均可实现高度精确的跟踪。
Constraining Dense Hand Surface Tracking with Elasticity
主页 |https://research.fb.com/publications/constraining-dense-hand-surface-tracking-with-elasticity/

（11）TraDeS ：CVPR 2021多目标跟踪算法，改进了目前联合检测与跟踪的在线方法，使用跟踪线索辅助检测，在多个数据集实现了大幅精度提升，作者来自纽约州立大学。论文尚未公布，代码将开源。
Track to Detect and Segment: An Online Multi-Object Tracker
项目主页：https://jialianwu.com/projects/TraDeS.html

(12)基于尺度不变特征变换的多路监控视频拼接系统
（13）TCSVT2021：一种结合全局和局部细粒度特征的行人再识别方法
（14）基于SIFT尺度不变特征变换的图像拼接算法
（15）最新开源！TransReID：首个基于Transformer的ReID网络，各项任务全面领先！
（16）WACV2021论文解读-Scale Equivariance Improves Siamese Tracking
（17）端到端的多目标跟踪，代码将开源，Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using Spatial and Temporal Transformers
（18）提出 SiamGAT，用于目标跟踪，性能领先许多当前先进跟踪器，达到 SOTA。
（19）TCSVT2021：一种结合全局和局部细粒度特征的行人再识别方法
（20）CVPR 2021 | 首个无需锚框（Anchor-Free）的行人搜索框架（附代码）
（21）基于YOLOV3与DeepSort的行人多目标跟踪
（22）从理论到实战！视频流车辆计数和目标跟踪
（23）TPAMI 2021 ：基于 event stream 的步态识别，准确率高达90%
（24）极市直播回放丨第80期-张新宇：CVPR 2021-Alpha Refine：通过精确的边界框估计提高跟踪性能
（25）目标跟踪入门篇-相关滤波

动作检测与识别

（01）MMAction2: 新一代视频理解工具箱
（02）WACV 2021 论文大盘点-人体动作检测与识别篇
（03）CVPR 2021 | 用于动作识别，即插即用、混合注意力机制的 ACTION 模块
（04）CVPR 2021 | 商汤提出最强时序动作提名修正网络：TCANet
（05）人体动作识别与生成：基于ST-GCN的方法
（06）刷爆HACS挑战赛时序动作检测榜单！TCANet：最强时序动作提名修正网络 CVPR 2021
（07）更快更强！视频理解模型PP-TSM重磅发布：速度比SlowFast快4.5倍
（08）视频异常行为检测算法MPN，在多个数据库上达到SOTA
（09）CVPR2021Oral #人体运动捕捉使用 4 个RGBD摄像头进行人体运动捕捉，在几何重建和纹理生成上效果都更好
（10）CVPR 2021 | 又好又快的视频异常检测，引入元学习的动态原型学习组件

姿态估算

（01）多人姿态识别框架——AlphaPose
（02）GitHub：人体姿态估计最全资料集锦
（03）人体姿态估计 (Human Pose Estimation) 常用方法总结
（04）CVPR2020 | 旷视研究院提出 PVN3D：基于 3D 关键点投票网络的单目 6DoF 位姿估计算法
（05）人体姿态估计、识别与生成最新技术一览
（06）深度学习人体姿态估计：2014-2020全面调研
（07）最新开源：端到端6D物体姿态跟踪，无需标注数据集！
（08）手势识别基础～手势骨架与关键点提取
（09）动物姿态估计！马、老虎、牛、鹿、狗狗的姿态都能搞定！斩获CVPR 2021 Oral
（10）OpenVINO™ 头部姿态评估网络应用演示
（11）CVPR 2021 | 微软提出"解构式关键点回归"，刷新COCO自底向上多人姿态检测记录！

OCR

（01）万字长文 | 图表示学习中的Encoder-Decoder框架
（02）霸榜Github：又一款OCR神器面世！
（03）新视角：用图像分类来建模文字识别也可以SOTA
（05）都2021了，别再堆砌网络了！10万奖金悬赏最强轻量化OCR模型
（06）顶刊TPAMI 2021！PAN++：精确高效的任意形状文本检测与识别
（07）最新！CVPR 2021 OCR领域论文大盘点（22篇）
（08）论文推荐｜【KSII TIIS 2021】DP-LinkNet：一种用于古籍文档图像二值化的卷积网络(有源码)

3D,深度估算,点云,SLAM

（01）CVPR2020 | 3D 目标检测新框架：3DSSD
（02）CenterFusion：融合雷达与摄像头数据的高精度3D目标检测
（03）最佳论文！商汤提出手机端实时单目三维重建系统 | ISMAR 2020

（04）商汤提出手机端实时单目三维重建系统，实现逼真AR效果和交互
（05）基于深度学习的图像匹配技术一览
（06）极市直播｜AAAI’21杰出论文许鸿斌：一个解决三维重建对数据依赖的新框架（已开源）
（07）OpenCV再升级！修改一行代码，将图像匹配效果提升14%！
（08）重磅！谷歌开源TensorFlow 3D场景理解库
（09）极市直播回放丨第76期-许鸿斌：AAAI’21杰出论文，一个解决三维重建对数据依赖的新框架（已开源）
（10）可用于大规模点云表面重建的深度学习算法
（11）可用于大规模点云表面重建的深度学习算法

（12）深度估计是机器人和自动驾驶研究的重要内容，而这往往需要特殊设备，如RGB-D相机或激光雷达，如何使用RGB相机感知深度呢？研究人员曾经做了很多的尝试。该视频是CVPR 2021论文Depth from Camera Motion and Object Detection结果，通过使用“普通手机摄像头运动+目标检测的包围框”数据，设计RNN网络实现了达到最先进精度的目标深度估计。单位 | 密歇根大学，史蒂文森理工学院论文 | https://arxiv.org/abs/2103.01468代码 | https://github.com/griffbr/ODMD
（13）CVPR 2021 | TPCN 点云就是这么美妙
（14）一文了解激光点云的组织形式
（15）基于YOLO的新型RGB-D融合方法对行人进行检测和3D定位
（16）ECCV2020 | 夜间图像的无监督单目深度估计
（17）MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View Stereo
（18）在 KITTI 基准数据集上实现最先进的单目3D目标检测结果，表现与基于单目视频的方法相当。
（19）真正实用的退化模型：ETH开源业内首个广义盲图像超分退化模型，性能效果绝佳
（20）ResNet也能用在3D模型上了！清华计图首创三角网格面片上的卷积神经网络：SubdivNet
（21）开源｜AAAI‘21杰出论文-三维重建新探索：解决数据依赖问题，让自监督信号更可靠！
（22）综述：基于点云的自动驾驶3D目标检测和分类方法
（23）PatchmatchNet：一种高效multi-view stereo框架 (CVPR2021 Oral)
（24）CVPR2021｜神经网络如何进行深度估计？
（25）DXSLAM：一种基于深度特征的鲁棒且高效的视觉SLAM系统
（26）实时高分辨率 RGB-D表面重建（CVPR2021）
（27）Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪
（28）HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法
（29）基于点云的3D障碍物检测
（30）极市直播丨朱思语：基于深度学习的视觉稠密建图和定位
（31）基于3D Surfel图的单目直接法稀疏定位
（32）将合成 3D 场景表示合并到生成模型中，从而实现更可控的图像合成。
（33）传统单图像深度估计往往只能给出低分辨率结果，细节也不够丰富，视觉上总给人模糊不清的感觉，来自SFU和Adobe的研究者通过合并不同分辨率生成高分辨率的深度估计，终于可以还原清晰的细节。
（34）OmniPhotos，目前最快的360°全景VR摄影方法。代码已开源。
（35）作者提出并集成GrooMeD-NMS–一种新颖的分组数学可区分的NMS，用于单眼3D物体检测，
（36）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

GUN（图像生成,超分辨,动作迁移）

（01）CVPR 2020 论文大盘点-图像增强与图像恢复篇
（02）哈工大等提出轻量级盲超分辨模型LESRCNN，代码已开源
（03）最新！图像去噪综合比较研究
（04）无需用户输入，Adobe提出自动高质量图像合成新方法
（05）NVIDIA Research的研究人员提出了一种自适应鉴别器增强机制，该机制可显着稳定有限数据环境中的训练。
（06）照片秒变卡通风！教你用PaddleGAN快速生成你的专属卡通头像
（07）精准生成Fake人脸！Amazon全新GAN模型给你全方位无死角美颜
（08）博士后姐把“二次元老婆生成器”升级了！AniGAN：这一次可以指定画风
（09）训练 GANs 一年我学到的 10 个教训
（10）涵盖 18+ SOTA GAN 实现，这个开源工程 PyTorch 库火了
（11）6ms 的EfficientDeRain：颇具启发的简单高效去雨算法
（12）PULSE:一种基于隐式空间的图像超分辨率算法
（13）解决以往单图像超分辨率算法仅在合成数据上效果好，无法适用于真实场景的问题。无需对特定类型相机图像训练，即可泛化到不同的相机上。Exploiting Raw Images for Real-Scene Super-Resolution单位 | 卡内基梅隆大学，商汤，加州大学论文 | https://arxiv.org/pdf/2102.01579.pdf代码 | https://www.dropbox.com/s/a66iuwoswul65da/RawSR_PAMI20.zip?dl=0主页 | https://sites.google.com/view/xiangyuxu/rawsr_pami
（14）下一代更衣室！国外一位设计师做的虚拟试衣应用。基于OpenPose 进行2D关节点跟踪，使用 Houdini 特效渲染。
来源：https://80.lv/articles/next-gen-dressing-room-with-markerless-tracking-in-houdini/

（15）#GAN #WACV2021
SinGAN-GIF 可以生成任意长宽比的样本，进行超分辨率，改变时帧率，并可用于视频编辑应用。
SinGAN-GIF: Learning a Generative Video Model From a Single GIF
作者 | Rajat Arora, Yong Jae Lee
单位 | 加利福尼亚大学戴维斯分校
论文 |
https://openaccess.thecvf.com/content/WACV2021/papers/Arora_SinGAN-GIF_Learning_a_Generative_Video_Model_From_a_Single_GIF_WACV_2021_paper.pdf
主页 | https://rajat95.github.io/singan-gif/

（16）WACV 2021 论文大盘点-图像质量篇

（17）Morph-UGATIT：一种支持渐进式域迁移的图像翻译方法
（18）近日由加州大学圣迭戈分校、CMU、Facebook 提出的一种极快速的视频插帧方法，比之前最精确的方法快384倍，比之前最快的8倍插值方法快23倍。该视频为使用该方法得到的慢动作影像。代码将开源。
FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation
units | 加利福尼亚大学圣迭戈分校；卡内基梅隆大学；Facebook AI
paper | https://arxiv.org/abs/2012.08512
github | coming
home | https://tarun005.github.io/FLAVR/

（19）浙大等学者发明的Neural Body算法，输入多角度视频可输出3D人体和新角度视图。论文 | https://arxiv.org/pdf/2012.15838.pdf代码 | https://github.com/zju3dv/neuralbody（即将）

（20）CVPR 2021接收论文：AdCo基于对抗的对比学习

（21）第一个同时采用传感器数据和图像进行视频稳定的 DNN 解决方案。Deep Online Fused Video Stabilization单位 | 威斯康星麦迪逊大学，谷歌论文 | https://arxiv.org/abs/2102.01279代码 | 即将主页 | https://zhmeishi.github.io/dvs/

（22）浙大等学者发明的Neural Body算法，输入多角度视频可输出3D人体和新角度视图。论文 | https://arxiv.org/pdf/2012.15838.pdf代码 | https://github.com/zju3dv/neuralbody（即将）

（23）TIP 2021论文：多曝光图像融合及超分辨的联合实现
（24）CVPR 2021 Oral｜只用静态图像，就能实时渲染出丝滑3D效果
（25）智趣丨实时风格迁移，移动端运行，人脸特效又有了新玩法
（26）CVPR 2021 | 港科大：如何利用闪光图像(flash image)来去除反光？
（27）CVPR 2021 | Neighbor2Neighbor：仅需噪声图像即可训练任意降噪网络的方法
（28）多功能的图像超分辨模型：用于盲图像超分辨的非对称卷积神经网络
（29）深度图像修复的一个突破
（30）GANSpace: Discovering Interpretable GAN Controls
（31）TIP2021| 视频超分辨率中的多级特征融合网络
（32）rtFlow: Unbiased Image Style Transfer via Reversible Neural Flows提出 ArtFlow 来防止通用风格迁移过程中的 content leak（内容泄漏）。ArtFlow 由可逆的神经流和无偏的特征迁移模块组成。同时支持前向和后向推理，并采用投影-转移-还原的方案进行操作。ArtFlow 在避免 content leak（内容泄漏）的同时，实现了与最先进的风格迁移方法相当的性能。
（33）极市直播丨邓欣：TIP 2021-多曝光图像融合及超分辨的联合实现方法
（34）Weather GAN：实现晴、阴、雾、雨、雪之间的天气状况自由迁移
（35）CVPR 2021 | 五官画风都能改，用无监督方法控制 GAN (附源码) -周博磊团队
（36）CVPR 2021｜Neighbor2Neighbor：无需干净图像的自监督图像降噪
（37）图像反光能被一键去除了？港科大开源RFC，仅用一个操作，强反光也能完美去除｜CVPR2021
（38）你好，这是微视AI还原的李焕英
（39）有限数据来训练GAN的一种思路
（40）揭秘腾讯微视人脸技术「黑科技」，基于GAN的人脸魔法特效
（41）添加链接描述
（42）CVPR2021｜超分性能不降低，计算量降低50%，董超等人提出加速图像超分的ClassSR
（43）RealSR性能大幅提升！旷视+快手+电子科大联合提出“先发散再收敛”的D2CSR
（44）仅需2张图！AI便可生成完整运动过程
（45）PornHub 用独家数据集！修复了百年前的电影…
（46）新垣结衣夫妇的孩子会长啥样？我用BabyGAN预测试试…
（47）刚刚！AMD发布超分辨率新技术FSR：N卡也能用
（48）Transformer再下一城！ETH提出：视频超分辨率Transformer
（49）蔡徐坤x特xxx梦幻联动！这个神器能让图像实时模仿人的动作
（50）人人皆可二次元！这个GAN网络让小姐姐生成不同风格的动漫形象！肤色、发型皆可变
（51）这款AI神器，让父亲重返18岁！
（52）DSRL：灵活而简单的框架,提高网络精度的且不引入额外的计算量,CVPR2020
（53）实时 4K “image-to-image translation”，港理工&达摩院张磊团队提出拉普拉斯金字塔变换网络
（54）NBNet：抛开复杂的网络结构设计，旷世&快手提出子空间注意力模块用于图像降噪
（55）开源 | 性能炸裂，旷视提出适用于底层问题的Half Instance Normalization
（56）GNN 模型在生物化学和医疗健康中的典型应用
（57）超强面经：文本检测与GAN篇（含答案）
（58）CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性
（59）LeCun点赞！GAN模型130毫秒生成动漫肖像！
（60）Deepfake文字版横空出世：AI高仿你的笔迹只需1个词！
（61）【开源】对基于图像背景的字体生成、人体姿势预测、关键点检测、超分辨率等探讨
（62）https://intel-isl.github.io/PhotorealismEnhancement/
（63）图像填充不怕区域大！MSRA等提出协同调制生成对抗网络
（54）CVPR 2021 Oral | GLEAN: 基于隐式生成库的高倍率图像超分辨率
（55）技压群雄！2021 NTIRE @CVPR 2021的三冠一亚视频超分方案：BasicVSR++