搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
花生_TL007
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
IntelliJ IDEA 4 新特性 之 On-the-Fly Code Analysis(动态代码分析)_on-the-fly code analysis怎么用
2
深度学习系列56:使用whisper进行语音转文字_faster-whisper加速
3
华为桌面云解决方案概述_解决方案概述和数据安全建议
4
cmd命令之Xcopy介绍_复制文件夹里所有文件到另一个文件夹操作方式
5
C++学习笔记——Eigen模块(用于矩阵运算)_c++ eigen
6
基于vue-simple-uploader的文件分片上传_vue-simple-uploader配置categorymap
7
洛谷B2095 白细胞计数
8
2021年中国企业直播行业发展回顾及未来预测分析[图]_直播间前五年收入预测
9
Hive映射Hbase_hive hbase 映射表
10
DOS 字符和符号_dos 通配符
当前位置:
article
> 正文
ICCV2019论文题目中文列表_deep restoration of vintage photographs from scann
作者:花生_TL007 | 2024-02-16 04:53:20
赞
踩
deep restoration of vintage photographs from scanned halftone prints
英文题目
中文题目
FaceForensics++: Learning to Detect Manipulated Facial Images
FaceForensics++:
学习
检测
操纵的
面部图像
DeepVCP: An End-to-End Deep Neural Network for Point Cloud Registration
DeepVCP:用于
点云配准
的
端到端深度神经网络
Shape Reconstruction Using Differentiable Projections and Deep Priors
基于
可微投影
和
深度先验
的
形状重建
Fine-Grained Segmentation Networks: Self-Supervised Segmentation for Improved Long-Term Visual Localization
细粒度分割网络
:基于
自监督分割
的
长期视觉定位
性能提升
SANet: Scene Agnostic Network for Camera Localization
SANet:基于
场景不可知网络
的
摄像机定位
Total Denoising: Unsupervised Learning of 3D Point Cloud Cleaning
全消噪:
三维点云清理
的
无监督学习
Hierarchical Self-Attention Network for Action Localization in Videos
视频动作定位
的
分层自关注网络
Goal-Driven Sequential Data Abstraction
目标驱动
的
顺序数据抽象
Jointly Aligning Millions of Images With Deep Penalised Reconstruction Congealing
基于
深度惩罚重建凝结
的
数百万张图片联合对齐
Drop to Adapt: Learning Discriminative Features for Unsupervised Domain Adaptation
放弃适应:基于
判别特征学习
的
非监督
域适应
NLNL: Negative Learning for Noisy Labels
NLNL:
噪声标签
的
负学习
Adversarial Robustness vs. Model Compression, or Both?
对抗性稳健
Vs.
模型压缩
,或两者兼而有之?
On the Design of Black-Box Adversarial Examples by Leveraging Gradient-Free Optimization and Operator Splitting Method
利用
无梯度优化
和
算子分裂
方法
设计黑盒对抗实例
DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regression Networks
DewarpNet:使用
叠加三维和二维回归网络
的
单图像文档
去弯曲
Learning Robust Facial Landmark Detection via Hierarchical Structured Ensemble
基于
层次结构集成
的
鲁棒
人脸Landmark检测
Remote Heart Rate Measurement From Highly Compressed Facial Videos: An End-to-End Deep Learning Solution With Video Enhancement
从
高度压缩的面部视频
中进行
远程心率测量
:一种具有
视频增强功能
的
端到端深度学习解决方案
Face-to-Parameter Translation for Game Character Auto-Creation
面向
参数转换
的
游戏角色自动生成
Visual Deprojection: Probabilistic Recovery of Collapsed Dimensions
可视化反投影
:
坍塌维度的概率恢复
StructureFlow: Image Inpainting via Structure-Aware Appearance Flow
结构流:通过
结构感知
的
外观流
进行
图像修复
Learning Fixed Points in Generative Adversarial Networks: From Image-to-Image Translation to Disease Detection and Localization
GAN中的不动点学习
:从
图像-图像转换
到
疾病检测与定位
Generative Adversarial Training for Weakly Supervised Cloud Matting
基于
生成性对抗训练
的
弱监督
云Matting(抠图?)
PAMTRI: Pose-Aware Multi-Task Learning for Vehicle Re-Identification Using Highly Randomized Synthetic Data
PAMTRI:
基于高
度随机综合数据
的
姿态感知多任务学习
实现
车辆再识别
Generative Adversarial Networks for Extreme Learned Image Compression
用于
极端学习
图像压缩
的
GAN
Instance-Guided Context Rendering for Cross-Domain Person Re-Identification
基于
实例引导上下文呈现
的
跨域
人再识别
What Else Can Fool Deep Learning? Addressing Color Constancy Errors on Deep Neural Network Performance
还有什么可以愚弄深度学习?
深度神经网络性能
的
色彩恒常性误差
处理
Beyond Cartesian Representations for Local Descriptors
超越笛卡尔表示
的
局部描述符
Distilling Knowledge From a Deep Pose Regressor Network
从
深度姿态回归网络
中
提取知识
Instance-Level Future Motion Estimation in a Single Image Based on Ordinal Regression
基于
序贯回归
的
单帧图像
实例级
未来运动估计
Vision-Infused Deep Audio Inpainting
视觉注入
深度
音频修复
HAWQ: Hessian AWare Quantization of Neural Networks With Mixed-Precision
HAWQ:利用
混合精度
实现
神经网络的
Hessian感知量化
Evaluating Robustness of Deep Image Super-Resolution Against Adversarial Attacks
深度图像
超分辨率
的
抗对抗攻击
鲁棒性评估
Overcoming Catastrophic Forgetting With Unlabeled Data in the Wild
利用
野外无标签数据
克服
灾难性遗忘
Symmetric Cross Entropy for Robust Learning With Noisy Labels
带噪声标签
鲁棒学习
的
对称交叉熵
Few-Shot Learning With Embedded Class Models and Shot-Free Meta Training
基于
嵌入式类模型
和
无镜头元训练
的
少镜头学习
Dual Directed Capsule Network for Very Low Resolution Image Recognition
用于
超低分辨率
图像识别
的
双向胶囊网络
Recognizing Part Attributes With Insufficient Data
利用
不足数据
识别
部分属性
USIP: Unsupervised Stable Interest Point Detection From 3D Point Clouds
USIP:
三维点云
的
无监督
稳定兴趣点
检测
Mixed High-Order Attention Network for Person Re-Identification
混合高阶注意网络
用于
人再识别
Budget-Aware Adapters for Multi-Domain Learning
用于
多域学习
的
预算感知适配器
Compact Trilinear Interaction for Visual Question Answering
视觉问答
的
紧凑三线交互
Towards Latent Attribute Discovery From Triplet Similarities
基于
三元相似性
的
潜在属性发现
GeoStyle: Discovering Fashion Trends and Events
GeoStyle:
发现
时尚趋势
和
事件
Towards Adversarially Robust Object Detection
对抗性鲁棒
目标检测
Automatic and Robust Skull Registration Based on Discrete Uniformization
基于
离散均匀化
的
自动鲁棒
颅骨配准
Few-Shot Image Recognition With Knowledge Transfer
基于
知识迁移
的
少镜头
图像识别
Fine-Grained Action Retrieval Through Multiple Parts-of-Speech Embeddings
基于
多重
部分语音嵌入
的
细粒度
动作检索
Vehicle Re-Identification in Aerial Imagery: Dataset and Approach
航空影像中的
车辆再识别
:
数据集
与
方法
Bridging the Domain Gap for Ground-to-Aerial Image Matching
地-空
图像匹配
中的
域间隙桥接
A Robust Learning Approach to Domain Adaptive Object Detection
一种
鲁棒学习
的
域自适应
目标检测
方法
Graph-Based Object Classification for Neuromorphic Vision Sensing
基于
图
的
对象分类
实现
神经形态
视觉感知
Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autonomous Driving
高斯YOLOv3:
自主驾驶
中一种基于
定位不确定性
的
快速精确
目标检测
方法
Sharpen Focus: Learning With Attention Separability and Consistency
集中注意力:学习中
注意力
的
可分离性
和
一致性
Learning Semantic-Specific Graph Representation for Multi-Label Image Recognition
多标签
图像识别
中的
特定语义
图表示学习
DeceptionNet: Network-Driven Domain Randomization
DeceptionNet:
网络驱动
的
域随机化
Pose-Guided Feature Alignment for Occluded Person Re-Identification
基于
姿态引导
的
特征对齐
实现
遮挡
人再识别
Robust Person Re-Identification by Modelling Feature Uncertainty
基于
特征不确定性建模
的
鲁棒
人再识别
Co-Segmentation Inspired Attention Networks for Video-Based Person Re-Identification
基于
共分割启发
的
注意网络
用于
基于视频的
人再识别
A Delay Metric for Video Object Detection: What Average Precision Fails to Tell
视频目标检测
的
一种
延迟度量
:平均精度不能判断什么
IL2M: Class Incremental Learning With Dual Memory
IL2M:
双记忆
课堂增量学习
Asymmetric Non-Local Neural Networks for Semantic Segmentation
非对称非局部神经网络
用于
语义分割
语义分割网中嵌入NonLocal-Block,并将其改进为非对称NonLocal-Block,并进一步添加金字塔池化和多级融合技术(见框图)
CCNet: Criss-Cross Attention for Semantic Segmentation
CCNet:基于
交叉注意
的
语义分割
利用十字(criss-cross)方式,高效地获取全局上下文信息
Convex Shape Prior for Multi-Object Segmentation Using a Single Level Set Function
基于
单水平集函数
的
凸形状先验
多目标分割
Feature Weighting and Boosting for Few-Shot Segmentation
基于
特征加权
和
boosting
的
少镜头分割
Surface Networks via General Covers
通过
一般覆盖
的
地面网络
SSAP: Single-Shot Instance Segmentation With Affinity Pyramid
SSAP:基于
相似金字塔
的
单镜头
实例分割
先进行(多尺度)语义分割(S),同时获得(多尺度)像素对关系(A),最后将不同尺度的A和S利用图割的方式,融合在一起,得到实例分割
Learning Propagation for Arbitrarily-Structured Data
面向
任意结构数据
的
学习传播
MultiSeg: Semantically Meaningful, Scale-Diverse Segmentations From Minimal User Input
MultiSeg:从
最小的用户输入
实现
语义上有意义,尺度分散的
分割
Robust Motion Segmentation From Pairwise Matches
基于
成对匹配
的
鲁棒
运动分割
InstaBoost: Boosting Instance Segmentation via Probability Map Guided Copy-Pasting
InstaBoost:通过
概率地图引导
的
复制粘贴
实现
增强
实例分割
利用Copy-Paste的方法,实现训练样本集的增强
Racial Faces in the Wild: Reducing Racial Bias by Information Maximization Adaptation Network
荒野中的种族面孔:
信息最大化
自适应网络
减少种族偏移
Uncertainty Modeling of Contextual-Connections Between Tracklets for Unconstrained Video-Based Face Recognition
Tracklet间
上下文关系
的
不确定性建模
实现
无约束
视频人脸识别
Spatio-Temporal Fusion Based Convolutional Sequence Learning for Lip Reading
基于
时空融合
的
卷积序列学习
实现
唇读
Occlusion-Aware Networks for 3D Human Pose Estimation in Video
视频中
三维人体姿态估计
的
遮挡感知网络
Context-Aware Feature and Label Fusion for Facial Action Unit Intensity Estimation With Partially Labeled Data
利用
部分标记数据
实现基于
上下文感知
特征
与
标签融合
的
人脸动作单元强度估计
Distill Knowledge From NRSfM for Weakly Supervised 3D Pose Learning
基于
NRSfM
的
知识蒸馏
实现
弱监督
三维姿态学习
MONET: Multiview Semi-Supervised Keypoint Detection via Epipolar Divergence
基于
极线散度
的
多视图半监督
关键点检测
Talking With Hands 16.2M: A Large-Scale Dataset of Synchronized Body-Finger Motion and Audio for Conversational Motion Analysis and Synthesis
手语16.2m:用于
会话运动
分析和合成
的
大规模
体-指同步运动和音频
数据集
Occlusion Robust Face Recognition Based on Mask Learning With Pairwise Differential Siamese Network
基于
成对差分孪生网络
的
模板学习
实现
遮挡
鲁棒
人脸识别
Teacher Supervises Students How to Learn From Partially Labeled Images for Facial Landmark Detection
教师指导学生
如何
从部分标记的图像
中
学习
面部Landmark检测
A2J: Anchor-to-Joint Regression Network for 3D Articulated Pose Estimation From a Single Depth Image
A2J:
锚定联合
回归网络
用于
单深度图像
三维关节姿态估计
TexturePose: Supervising Human Mesh Estimation With Texture Consistency
基于
纹理一致性
的
人体网格估计
监控
FreiHAND: A Dataset for Markerless Capture of Hand Pose and Shape From Single RGB Images
FreiHAND:
一个从单个RGB图像
中
无标记捕捉
手部姿势
和
形状
的
数据集
Markerless Outdoor Human Motion Capture Using Multiple Autonomous Micro Aerial Vehicles
多自主微型飞行器
无标记室外
人体运动捕捉
Toyota Smarthome: Real-World Activities of Daily Living
丰田
智能家居
:现实生活中的
日常生活活动
Relation Parsing Neural Network for Human-Object Interaction Detection
关系解析神经网络
在
人机交互检测
中的应用
DistInit: Learning Video Representations Without a Single Labeled Video
DistInit:
学习
没有单个标记视频
的
视频表示
Zero-Shot Anticipation for Instructional Activities
教学活动的
零镜头预期
Making the Invisible Visible: Action Recognition Through Walls and Occlusions
使隐形可见:
通过墙和遮挡
的
动作识别
Recursive Visual Sound Separation Using Minus-Plus Net
用
Minus-Plus Net
进行
递归可视
声音分离
Unsupervised Video Interpolation Using Cycle Consistency
基于
循环一致性
的
无监督
视频插值
Deformable Surface Tracking by Graph Matching
基于
图匹配
的
变形曲面跟踪
Deep Meta Learning for Real-Time Target-Aware Visual Tracking
基于
深度元学习
的
实时目标感知
视觉跟踪
Looking to Relations for Future Trajectory Forecast
展望
未来
轨迹预测
的
关系
Anchor Diffusion for Unsupervised Video Object Segmentation
无监督
视频对象分割
的
锚扩散算法
Tracking Without Bells and Whistles
无铃无哨的
追踪
Perspective-Guided Convolution Networks for Crowd Counting
面向
人群计数
的
透视导引
卷积网络
End-to-End Wireframe Parsing
端到端
线框分析
Incremental Class Discovery for Semantic Segmentation With RGBD Sensing
基于
RGBD感知
的
增量类发现
实现
语义分割
SSF-DAN: Separated Semantic Feature Based Domain Adaptation Network for Semantic Segmentation
SSF-DAN:
基于
分离语义特征
的
域自适应
实现
语义分割
(待标签的)训练样本与真实域无标签训练样本在不同域,因此采用域自适应的方法,来实现弱监督的语义分割。本文采用GAN的方法,如图2
SpaceNet MVOI: A Multi-View Overhead Imagery Dataset
SpaceNet-MVOI:一个
多视图俯视
图像数据集
Multi-Level Bottom-Top and Top-Bottom Feature Fusion for Crowd Counting
用于
人群计数
的
多层次
自下而上和自上而下
特征融合
Learning Lightweight Lane Detection CNNs by Self Attention Distillation
自关注蒸馏学习
轻量级
CNNs
用于
车道检测
SplitNet: Sim2Sim and Task2Task Transfer for Embodied Visual Navigation
SplitNet:
Sim2Sim
和
Task2Task传输
以实现
可视化导航
Cascaded Parallel Filtering for Memory-Efficient Image-Based Localization
基于
级联并行滤波
的
记忆高效
图像定位
Pixel2Mesh++: Multi-View 3D Mesh Generation via Deformation
Pixel2Mesh++:通过
变形
生成
多视图
三维网格
A Differential Volumetric Approach to Multi-View Photometric Stereo
基于
差分体积法
的
多视光度
立体成像
Revisiting Radial Distortion Absolute Pose
重新审视
径向畸变
绝对姿态
Estimating the Fundamental Matrix Without Point Correspondences With Application to Transmission Imaging
无点对应的
基本矩阵估计
及其在
透射成像
中的应用
QUARCH: A New Quasi-Affine Reconstruction Stratum From Vague Relative Camera Orientation Knowledge
QUARCH:一种基于
模糊相对摄像机方位知识
的
准仿射重建层
Homography From Two Orientation- and Scale-Covariant Features
基于
两个方向
和
尺度协方差
特征
的
单应性
Hiding Video in Audio via Reversible Generative Models
基于
可逆生成模型
的
隐藏视频到音频
GSLAM: A General SLAM Framework and Benchmark
GSLAM:一个通用的
SLAM框架
和
基准
Elaborate Monocular Point and Line SLAM With Robust Initialization
具有
鲁棒初始化
的
精细
单目点-线SLAM
Adaptive Density Map Generation for Crowd Counting
用于
人群计数
的
自适应
密度图
生成
Attention-Aware Polarity Sensitive Embedding for Affective Image Retrieval
注意力感知
极性敏感嵌入
在
情感图像检索
中的应用
Zero-Shot Emotion Recognition via Affective Structural Embedding
基于
情感结构嵌入
的
零镜头
情感识别
FW-GAN: Flow-Navigated Warping GAN for Video Virtual Try-On
FW-GAN:用于
视频虚拟试穿
的
流导航翘曲GAN
Interactive Sketch & Fill: Multiclass Sketch-to-Image Translation
交互式草图与填充
:
多类别
草图-图像转换
Attention-Based Autism Spectrum Disorder Screening With Privileged Modality
基于
注意力
的
自闭症谱系障碍筛查
Image Aesthetic Assessment Based on Pairwise Comparison A Unified Approach to Score Regression, Binary Classification, and Personalization
基于成对比较的
图像美学评价
评分回归
、
二元分类
和
个性化
的
统一方法
Delving Into Robust Object Detection From Unmanned Aerial Vehicles: A Deep Nuisance Disentanglement Approach
无人机
鲁棒目标检测
的深入研究
Bit-Flip Attack: Crushing Neural Network With Progressive Bit Search
比特翻转攻击:基于
渐进式比特搜索
的
粉碎神经网络
Pushing the Frontiers of Unconstrained Crowd Counting: New Dataset and Benchmark Method
推动
无约束
人群计数
的前沿:
新数据集
和
基准方法
Employing Deep Part-Object Relationships for Salient Object Detection
利用
深度局部-目标关系
进行
显著目标检测
Self-Supervised Deep Depth Denoising
自监督深度
深度信息去噪
Cost-Aware Fine-Grained Recognition for IoTs Based on Sequential Fixations
成本感知细粒度识别
实现
顺序固定的IoT(物联网?)
Layout-Induced Video Representation for Recognizing Agent-in-Place Actions
基于
布局诱导的视频表示方法
识别Agent原地动作
Anomaly Detection in Video Sequence With Appearance-Motion Correspondence
基于
外观运动对应
的
视频序列
异常检测
Exploring Randomly Wired Neural Networks for Image Recognition
随机有线神经网络
在
图像识别
中的应用
Progressive Differentiable Architecture Search: Bridging the Depth Gap Between Search and Evaluation
渐进可微
架构搜索
:
缩小
搜索
和
评估
之间的深度差距
Multinomial Distribution Learning for Effective Neural Architecture Search
基于
多项式分布学习
的有效的
神经结构搜索
Searching for MobileNetV3
正在
搜索
MobileNetV3
Data-Free Quantization Through Weight Equalization and Bias Correction
通过
权值均衡
和
偏差校正
实现
无数据量化
A Camera That CNNs: Towards Embedded Neural Networks on Pixel Processor Arrays
CNNs摄像机:面向
像素处理器阵列
上的
嵌入式神经网络
Knowledge Distillation via Route Constrained Optimization
基于
路径约束优化
的
知识蒸馏
Distillation-Based Training for Multi-Exit Architectures
基于
蒸馏
的
训练
实现
多出口结构
Similarity-Preserving Knowledge Distillation
相似性保持
的
知识蒸馏
Many Task Learning With Task Routing
基于
任务路由
的
多任务学习
Stochastic Filter Groups for Multi-Task CNNs: Learning Specialist and Generalist Convolution Kernels
基于
随机滤波器组
的
多任务CNN
:
学习
专家
和
广义卷积核
Transferability and Hardness of Supervised Classification Tasks
监督
分类任务
的
可转移性
与
难易性
Moment Matching for Multi-Source Domain Adaptation
基于
矩匹配
的
多源
域自适应
Unsupervised Domain Adaptation via Regularized Conditional Alignment
基于
正则条件对齐
的
无监督
域自适应
Larger Norm More Transferable: An Adaptive Feature Norm Approach for Unsupervised Domain Adaptation
更大范数更多可转移:一种
无监督
域自适应
的
自适应特征范数方法
UM-Adapt: Unsupervised Multi-Task Adaptation Using Adversarial Cross-Task Distillation
UM-Adapt:使用
对抗性跨任务蒸馏
的
无监督
多任务自适应
Episodic Training for Domain Generalization
基于
幕式训练
的
域泛化
Domain Adaptation for Structured Output via Discriminative Patch Representations
基于
判别区分块表示
的
结构化输出
域自适应
Semi-Supervised Learning by Augmented Distribution Alignment
基于
增广分布对齐
的
半监督学习
S4L: Self-Supervised Semi-Supervised Learning
S4L:
自监督半监督学习
Privacy Preserving Image Queries for Camera Localization
隐私保护
图像查询
实现
摄像机定位
Calibration Wizard: A Guidance System for Camera Calibration Based on Modelling Geometric and Corner Uncertainty
标定向导:一种基于
几何
和
角
不确定性建模
的
摄像机标定
制导系统
Gated2Depth: Real-Time Dense Lidar From Gated Images
Gated2Depth:来自
门控图像
的
实时密集激光雷达
X-Section: Cross-Section Prediction for Enhanced RGB-D Fusion
x截面:
增强RGBD融合
的
截面预测
Learning an Event Sequence Embedding for Dense Event-Based Deep Stereo
事件序列
嵌入学习
实现
基于稠密事件的
深度立体图
Point-Based Multi-View Stereo Network
基于
点
的
多视图
立体网络
Discrete Laplace Operator Estimation for Dynamic 3D Reconstruction
动态三维重建
的
离散Laplace算子估计
Deep Non-Rigid Structure From Motion
深度
非刚性
Structure From Motion
Equivariant Multi-View Networks
等变多视网络
Interpolated Convolutional Networks for 3D Point Cloud Understanding
插值卷积网络
在
三维点云理解
中的应用
Revisiting Point Cloud Classification: A New Benchmark Dataset and Classification Model on Real-World Data
重新审视
点云分类
:一种
基于真实数据
的新的
基准数据集
和
分类模型
PointCloud Saliency Maps
点云
显著图
ShellNet: Efficient Point Cloud Convolutional Neural Networks Using Concentric Shells Statistics
基于
同心壳统计
的高效
点云
卷积神经网络
Unsupervised Deep Learning for Structured Shape Matching
基于
无监督深度学习
的
结构形状匹配
Linearly Converging Quasi Branch and Bound Algorithms for Global Rigid Registration
基于
线性收敛准分枝
和
定界
算法的
全局刚性配准
Consensus Maximization Tree Search Revisited
协商一致最大化
树搜索
Quasi-Globally Optimal and Efficient Vanishing Point Estimation in Manhattan World
曼哈顿世界的
准全局最优高效
消失点估计
An Efficient Solution to the Homography-Based Relative Pose Problem With a Common Reference Direction
具有
共同参考方向
的
单应相对位姿问题
的
有效解
A Quaternion-Based Certifiably Optimal Solution to the Wahba Problem With Outliers
基于
四元数
的
孤立点Wahba问题
的
可证明最优解
PLMP - Point-Line Minimal Problems in Complete Multi-View Visibility
完全多视图可见性
中的
点-线最小问题
Variational Few-Shot Learning
变分
少镜头学习
Generative Adversarial Minority Oversampling
生成性对抗
少数
过采样
Memorizing Normality to Detect Anomaly: Memory-Augmented Deep Autoencoder for Unsupervised Anomaly Detection
记忆正态性
异常检测
:用于
无监督
异常检测
的
记忆增强深度自动编码器
Topological Map Extraction From Overhead Images
从头顶图像
中
提取拓扑图
Exploiting Temporal Consistency for Real-Time Video Depth Estimation
利用
时间一致性
进行
实时
视频深度估计
The Sound of Motions
运动的声音
SC-FEGAN: Face Editing Generative Adversarial Network With User's Sketch and Color
SC-FEGAN:
基于
用户素描
和
色彩
的
人脸编辑
生成对抗网络
Exploring Overall Contextual Information for Image Captioning in Human-Like Cognitive Style
探索
类人认知方式
中
图像字幕
的
整体语境信息
Order-Aware Generative Modeling Using the 3D-Craft Dataset
基于
三维工艺数据集
的
次序感知
生成建模
Crowd Counting With Deep Structured Scale Integration Network
基于
深度结构规模集成网络
的
人群计数
Bidirectional One-Shot Unsupervised Domain Mapping
双向
单镜头无监督
域映射
Evolving Space-Time Neural Architectures for Videos
进化的
视频
时空神经结构
Universally Slimmable Networks and Improved Training Techniques
通用
可瘦身网络
和
改进的训练技术
AutoDispNet: Improving Disparity Estimation With AutoML
AutoDispNet:用A
utoML
改进
视差估计
网络结构搜索和最优超参数搜索的方法
Deep Meta Functionals for Shape Representation
基于
深度元函数
的
形状表示
Differentiable Kernel Evolution
可微的
核演化
Batch Weight for Domain Adaptation With Mass Shift
利用
质量漂移
实现
域自适应
的
批处权重
SRM: A Style-Based Recalibration Module for Convolutional Neural Networks
SRM:
卷积神经网络
中一种
基于样式
的
再校准模块
Switchable Whitening for Deep Representation Learning
基于
可切换白化
的
深度
表示学习
Adaptative Inference Cost With Convolutional Neural Mixture Models
基于
卷积神经混合模型
的
自适应推理代价
On Network Design Spaces for Visual Recognition
基于
网络设计空间
的
视觉识别
Improved Techniques for Training Adaptive Deep Networks
自适应深度网络
训练
的
改进技术
Resource Constrained Neural Network Architecture Search: Will a Submodularity Assumption Help?
资源受限的
神经
网络架构
搜索
:
子模块假设
有帮助吗?
ACNet: Strengthening the Kernel Skeletons for Powerful CNN via Asymmetric Convolution Blocks
ACNet:通过
非对称卷积块
增强
CNN的核骨架
A Comprehensive Overhaul of Feature Distillation
特征蒸馏
的
全面检修
Transferable Semi-Supervised 3D Object Detection From RGB-D Data
RGBD数据
的
可转移半监督
三维目标检测
DPOD: 6D Pose Object Detector and Refiner
DPOD:
6D位姿
目标
检测器
和
细化器
STD: Sparse-to-Dense 3D Object Detector for Point Cloud
STD:
点云
的
稀疏-稠密
三维目标检测器
DUP-Net: Denoiser and Upsampler Network for 3D Adversarial Point Clouds Defense
DUP-Net:用于
3D对抗点云防御
的
去噪和上采样网络
Learning Rich Features at High-Speed for Single-Shot Object Detection
高速学习
丰富特征
实现
单镜头
目标检测
Detecting Unseen Visual Relations Using Analogies
用
类比法
检测
看不见的
视觉关系
Disentangling Monocular 3D Object Detection
分离式单目
三维
目标检测
STM: SpatioTemporal and Motion Encoding for Action Recognition
STM:用于
动作识别
的
时空和运动编码
Dynamic Context Correspondence Network for Semantic Alignment
语义对齐
的
动态上下文对应网络
Fooling Network Interpretation in Image Classification
图像分类
中的
愚弄网络解释
Unconstrained Foreground Object Search
无约束
前景对象搜索
Embodied Amodal Recognition: Learning to Move to Perceive Objects
体现性
情感识别
:
学习
移动感知物体
SpatialSense: An Adversarially Crowdsourced Benchmark for Spatial Relation Recognition
空间感知:一种用于
空间关系识别
的
逆向众包基准
TensorMask: A Foundation for Dense Object Segmentation
TensorMask:
密集目标分割
的
基础
Integral Object Mining via Online Attention Accumulation
基于
在线注意力积累
的
整体对象挖掘
Accelerated Gravitational Point Set Alignment With Altered Physical Laws
用
改变的物理定律
加速引力点集对准
Domain Adaptation for Semantic Segmentation With Maximum Squares Loss
基于
最大平方损失
的
域自适应
实现
语义分割
基于域自适应的语义分割,提出两点改进:1. 提出新的损失函数;2. 提出类别重加权,以解决类别不平衡的问题
Domain Randomization and Pyramid Consistency: Simulation-to-Real Generalization Without Accessing Target Domain Data
域随机化
与
金字塔一致性
:
不访问目标域数据
的
真实综合仿真
Semi-Supervised Skin Detection by Network With Mutual Guidance
基于
互导网络
的
半监督
皮肤检测
ACE: Adapting to Changing Environments for Semantic Segmentation
ACE:
适应不断变化的环境
实现
语义分割
基于域自适应的语义分割
Efficient Segmentation: Learning Downsampling Near Semantic Boundaries
有效分割:在
语义边界附近
学习下采样
Recurrent U-Net for Resource-Constrained Segmentation
基于
递归U-Net
的
资源受限分割
Detecting the Unexpected via Image Resynthesis
通过
图像再合成
检测意外
Self-Supervised Monocular Depth Hints
自监督单目
深度提示
3D Scene Reconstruction With Multi-Layer Depth and Epipolar Transformers
基于
多层深度
和
极线变换
的
三维场景重建
How Do Neural Networks See Depth in Single Images?
神经网络
如何在
单个图像
中
看到深度
?
On Boosting Single-Frame 3D Human Pose Estimation via Monocular Videos
单目视频
增强单帧
三维人体姿态估计
Canonical Surface Mapping via Geometric Cycle Consistency
基于
几何循环一致性
的
正则曲面映射
3D-RelNet: Joint Object and Relational Network for 3D Prediction
3d RelNet:
三维预测
的
联合对象和关系网络
GP2C: Geometric Projection Parameter Consensus for Joint 3D Pose and Focal Length Estimation in the Wild
GP2C:基于
几何投影参数一致性
的野外
联合三维
姿态
和
焦距估计
Moulding Humans: Non-Parametric 3D Human Shape Estimation From Single Images
塑造人:基于
单个图像
的
非参数三维
人体形状估计
3DPeople: Modeling the Geometry of Dressed Humans
3DPeople:为
穿着衣服的
人的
几何体建模
Learning to Reconstruct 3D Human Pose and Shape via Model-Fitting in the Loop
基于
模型拟合
的
三维
人体姿态
和
形状重建
Optimizing Network Structure for 3D Human Pose Estimation
三维
人体姿态估计
的
网络结构优化
Exploiting Spatial-Temporal Relationships for 3D Pose Estimation via Graph Convolutional Networks
基于
时-空关系
的
图形卷积网络
实现
三维姿态估计
Resolving 3D Human Pose Ambiguities With 3D Scene Constraints
利用
三维场景约束
解决三维
人体姿态模糊
问题
Tex2Shape: Detailed Full Human Body Geometry From a Single Image
Tex2Shape:
从一幅图像
中
获得详细的
全身几何图形
PIFu: Pixel-Aligned Implicit Function for High-Resolution Clothed Human Digitization
PIFu:基于
像素对齐隐函数
的
高分辨率
服装数字化
DF2Net: A Dense-Fine-Finer Network for Detailed 3D Face Reconstruction
DF2Net:一种
密集-精细-更精细网络
实现
详细
三维人脸重建
Monocular 3D Human Pose Estimation by Generation and Ordinal Ranking
基于
生成
和
序数排序
的
单目三维
人体姿态估计
Aligning Latent Spaces for 3D Hand Pose Estimation
基于
潜在空间对齐
的
三维
手部姿态估计
HEMlets Pose: Learning Part-Centric Heatmap Triplets for Accurate 3D Human Pose Estimation
HEMLets Pose:学习以
局部为中心的热图三元组
以
精确
估计三维人体姿势
End-to-End Hand Mesh Recovery From a Monocular RGB Image
单目RGB图像
的
端到端
手部网格恢复
Robust Multi-Modality Multi-Object Tracking
鲁棒
多模态
多目标跟踪
The Trajectron: Probabilistic Multi-Agent Trajectory Modeling With Dynamic Spatiotemporal Graphs
基于
动态时空图
的
概率多智能体
轨迹建模
'Skimming-Perusal' Tracking: A Framework for Real-Time and Robust Long-Term Tracking
“略读”跟踪:一个
实时
和
健壮
的
长期跟踪框架
TASED-Net: Temporally-Aggregating Spatial Encoder-Decoder Network for Video Saliency Detection
用于
视频显著性检测
的
时间聚集
空间编解码网络
Attacking Optical Flow
攻击光流
Pro-Cam SSfM: Projector-Camera System for Structure and Spectral Reflectance From Motion
Pro-Cam SSfm:用于
运动中
结构
和
光谱反射
的
投影-摄像系统
Mop Moire Patterns Using MopNet
基于
MopNet
的
Mop Moire图案
Kernel Modeling Super-Resolution on Real Low-Resolution Images
真实低分辨率图像
的
核模型
超分辨率
Learning to Jointly Generate and Separate Reflections
学会
共同
产生
和
分离反射
Deep Multi-Model Fusion for Single-Image Dehazing
基于
深度多模型融合
的
单图像去雾
Deep Learning for Seeing Through Window With Raindrops
透过雨滴看窗外
的
深度学习
Mask-ShadowGAN: Learning to Remove Shadows From Unpaired Data
Mask-ShadowGAN
:
学习
从未配对数据
中
移除阴影
Spatio-Temporal Filter Adaptive Network for Video Deblurring
用于
视频去模糊
的
时空滤波自适应网络
Learning Deep Priors for Image Dehazing
图像去模糊
的
深度先验学习
JPEG Artifacts Reduction via Deep Convolutional Sparse Coding
基于
深度卷积稀疏编码
的
jpeg伪影抑制
Self-Guided Network for Fast Image Denoising
用于
快速图像去噪
的
自引导网络
Non-Local Intrinsic Decomposition With Near-Infrared Priors
基于
近红外先验
的
非局部本征分解
VideoMem: Constructing, Analyzing, Predicting Short-Term and Long-Term Video Memorability
VideoMem:
构建
、
分析
、
预测
短期和长期
视频记忆
Rescan: Inductive Instance Segmentation for Indoor RGBD Scans
Rescan:基于
归纳实例分割
的
室内RGBD扫描
End-to-End CAD Model Retrieval and 9DoF Alignment in 3D Scans
三维扫描
中的
端到端
CAD模型检索
与
9自由度对准
Making History Matter: History-Advantage Sequence Training for Visual Dialog
创造历史:基于
历史优势序列训练
的
可视化对话
Stochastic Attraction-Repulsion Embedding for Large Scale Image Localization
随机吸引-排斥嵌入
在
大规模
图像定位
中的应用
Scene Graph Prediction With Limited Labels
基于
有限标签
的
场景图预测
Taking a HINT: Leveraging Explanations to Make Vision and Language Models More Grounded
提示:利用
解释
使
视觉和语言模型
更加扎根
Align2Ground: Weakly Supervised Phrase Grounding Guided by Image-Caption Alignment
Align2Ground:
图片-标注对齐引导
的
弱监督phase grounding
phrase grounding:给出一张图片和一个自然语言描述的问题,在图片中定位问题中所提到的物体。是很多问题的
Adaptive Reconstruction Network for Weakly Supervised Referring Expression Grounding
基于
自适应重构网络
的
弱监督
指代表达
Hierarchy Parsing for Image Captioning
基于
层次分析
的
图像标注
HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips
HowTo100M:通过观看
一亿个叙述视频片段
实现
文本-视频嵌入学习
Controllable Video Captioning With POS Sequence Guidance Based on Gated Fusion Network
基于
门控融合网络
的
POS序列引导
实现
可控
视频标注
Multi-View Stereo by Temporal Nonparametric Fusion
基于
时间非参数融合
的
多视点
立体视觉
Floor-SP: Inverse CAD for Floorplans by Sequential Room-Wise Shortest Path
Floor-SP:按
顺序房间最短路径
进行
楼层平面逆向CAD
Polarimetric Relative Pose Estimation
极化
相对位姿估计
Closed-Form Optimal Two-View Triangulation Based on Angular Errors
基于
角度误差
的
闭式最优二视图
三角剖分
Pix2Vox: Context-Aware 3D Reconstruction From Single and Multi-View Images
Pix2Vox:基于
单视图
和
多视图图像
的
上下文感知
三维重建
Unsupervised Robust Disentangling of Latent Characteristics for Image Synthesis
潜在特征
的无监督鲁棒
分离
实现
图像合成
SROBB: Targeted Perceptual Loss for Single Image Super-Resolution
SROBB:
单图像超分辨率
的
目标感知损失
An Internal Learning Approach to Video Inpainting
视频修复
的
内部学习方法
Deep CG2Real: Synthetic-to-Real Translation via Image Disentanglement
深层CG2Real:通过
图像解纠缠
实现
从合成到真实的翻译
Adversarial Defense via Learning to Generate Diverse Attacks
通过学习
产生多种攻击
实现
对抗性防御
Image Generation From Small Datasets via Batch Statistics Adaptation
批统计自适应
实现
从小数据集
生成图像
Lifelong GAN: Continual Learning for Conditional Image Generation
终身
GAN
:
条件
图像生成
的
持续学习
Bayesian Relational Memory for Semantic Visual Navigation
面向
语义
视觉导航
的
贝叶斯关系记忆
Mono-SF: Multi-View Geometry Meets Single-View Depth for Monocular Scene Flow Estimation of Dynamic Traffic Scenes
Mono-SF:
多视点几何
满足
单视点深度
的
单目动态
交通场景流量估计
Prior Guided Dropout for Robust Visual Localization in Dynamic Environments
基于
先验引导Dropout
的
动态环境
下
鲁棒
视觉定位
Drive&Act: A Multi-Modal Dataset for Fine-Grained Driver Behavior Recognition in Autonomous Vehicles
Drive&Act:一个用于
自主车辆
细粒度
驾驶员行为识别
的
多模态数据集
Depth Completion From Sparse LiDAR Data With Depth-Normal Constraints
基于
深度法向约束
的
稀疏激光雷达数据
深度补全
PRECOG: PREdiction Conditioned on Goals in Visual Multi-Agent Settings
PRECOG:
视觉多Agent设置
中
基于目标的
预测
LPD-Net: 3D Point Cloud Learning for Large-Scale Place Recognition and Environment Analysis
LPD-Net:用于
大规模
地点识别
和
环境分析
的
三维点云学习
Local Supports Global: Deep Camera Relocalization With Sequence Enhancement
局部支持全局:基于
序列增强
的
深度
相机重定位
Sequential Adversarial Learning for Self-Supervised Deep Visual Odometry
基于
序贯对抗学习
的
自监督深度
视觉里程计
TextPlace: Visual Place Recognition and Topological Localization Through Reading Scene Texts
文本位置:通过
阅读场景文本
进行
视觉位置识别
和
拓扑定位
CamNet: Coarse-to-Fine Retrieval for Camera Re-Localization
CamNet:从
粗到细的检索
实现
相机重定位
Situational Fusion of Visual Representation for Visual Navigation
视觉表示
的
情景融合
实现
视觉导航
Learning Aberrance Repressed Correlation Filters for Real-Time UAV Tracking
学习
畸变抑制
相关滤波器
在
无人机实时跟踪
中的应用
6-DOF GraspNet: Variational Grasp Generation for Object Manipulation
六自由度GraspNet:基于
变分抓取生成
的
对象操作
DAGMapper: Learning to Map by Discovering Lane Topology
DAGMapper:通过
发现车道拓扑
学习地图
3D-LaneNet: End-to-End 3D Multiple Lane Detection
3D-LaneNet:
端到端
三维多车道检测
Sampling-Free Epistemic Uncertainty Estimation Using Approximated Variance Propagation
基于
近似方差传播
的
无抽样
认知不确定性估计
Universal Adversarial Perturbation via Prior Driven Uncertainty Approximation
基于
先验驱动不确定近似
的
普遍反对称扰动
Understanding Deep Networks via Extremal Perturbations and Smooth Masks
利用
极值扰动
和
光滑掩模
理解深度网络
Unsupervised Pre-Training of Image Features on Non-Curated Data
非精确数据
上
图像特征
的
无监督预训练
Learning Local Descriptors With a CDF-Based Dynamic Soft Margin
基于
CDF
的
动态软边值
实现
局部描述子学习
Bayes-Factor-VAE: Hierarchical Bayesian Deep Auto-Encoder Models for Factor Disentanglement
Bayes-Factor-VAE:用于
因子分离
的
分层Bayesian深度
自编码模型
Linearized Multi-Sampling for Differentiable Image Transformation
基于
线性化多重采样
的
可微图像变换
AdaTransform: Adaptive Data Transformation
AdaTransform:
自适应
数据转换
CARAFE: Content-Aware ReAssembly of FEatures
CARAFE:
内容感知
的
特征重组
用于上采样的一种改进算法(如图2):分两步,首先训练出一个用于不同位置点乘的核(不同于双线性,不同位置的处理方式依赖于这个核);然后利用这个核来进行局部邻域的加权均值,从而实现不同位置,不同处理方式的上采样
AFD-Net: Aggregated Feature Difference Learning for Cross-Spectral Image Patch Matching
AFD-Net:用于
跨光谱图像
块匹配
的
聚合特征
差分学习
Deep Joint-Semantics Reconstructing Hashing for Large-Scale Unsupervised Cross-Modal Retrieval
面向
大规模无监督
跨模态检索
的
深度联合
语义重构
哈希算法
Unsupervised Neural Quantization for Compressed-Domain Similarity Search
基于
无监督
神经量化
的
压缩域
相似性搜索
Siamese Networks: The Tale of Two Manifolds
孪生网络
:
两个流形
的故事
Learning Combinatorial Embedding Networks for Deep Graph Matching
用于
深度图匹配
的
组合嵌入网络学习
Fashion Retrieval via Graph Reasoning Networks on a Similarity Pyramid
基于
相似金字塔
的
图推理网络
实现
服装检索
Wavelet Domain Style Transfer for an Effective Perception-Distortion Tradeoff in Single Image Super-Resolution
单图像
超分辨率
中
基于
小波域风格变换
的
感知失真折衷
Toward Real-World Single Image Super-Resolution: A New Benchmark and a New Model
走向现实世界的
单图像
超分辨率
:一种新的
基准
和
模型
RankSRGAN: Generative Adversarial Networks With Ranker for Image Super-Resolution
RankSRGAN:
基于
Ranker
的
GAN
实现
图像
超分辨率
Progressive Fusion Video Super-Resolution Network via Exploiting Non-Local Spatio-Temporal Correlations
利用
非局部时空相关性
的
渐进式融合
实现
视频
超分辨率
网络
Deep SR-ITM: Joint Learning of Super-Resolution and Inverse Tone-Mapping for 4K UHD HDR Applications
深度SR-ITM:
4K超高清应用
中
超分辨率
和
逆色调映射
的
联合学习
Dynamic PET Image Reconstruction Using Nonnegative Matrix Factorization Incorporated With Deep Image Prior
非负矩阵分解
结合
深度图像先验
的
动态PET图像重建
DSIC: Deep Stereo Image Compression
深度
立体图像压缩
Variable Rate Deep Image Compression With a Conditional Autoencoder
基于
条件自动编码器
的
变速率深度
图像压缩
Real Image Denoising With Feature Attention
基于
特征注意
的
真实图像去噪
Noise Flow: Noise Modeling With Conditional Normalizing Flows
噪声流:使用
条件规范化流
的
噪声建模
Bottleneck Potentials in Markov Random Fields
马尔可夫随机场
的
瓶颈势
Seeing Motion in the Dark
在黑暗中
看运动
SENSE: A Shared Encoder Network for Scene-Flow Estimation
SENSE:用于
场景流估计
的
共享编码器网络
Adversarial Feedback Loop
对抗性
反馈回路
Dynamic-Net: Tuning the Objective Without Re-Training for Synthesis Tasks
动态网
:
无需重新训练即可调整目标
实现
综合任务
AutoGAN: Neural Architecture Search for Generative Adversarial Networks
AutoGAN:
生成性对抗网络
的
神经结构搜索
Co-Evolutionary Compression for Unpaired Image Translation
基于
协同进化压缩
的
非成对
图像翻译
Self-Supervised Representation Learning From Multi-Domain Data
多域数据的
自监督
表示学习
Controlling Neural Networks via Energy Dissipation
基于
能量耗散
的
神经网络控制
Indices Matter: Learning to Index for Deep Image Matting
索引的重要性:
学习索引
进行
深度
图像抠图
LAP-Net: Level-Aware Progressive Network for Image Dehazing
LAP-Net:基于
层级感知递进网络
的
图像去雾
Attention Augmented Convolutional Networks
注意力增强
卷积网络
MetaPruning: Meta Learning for Automatic Neural Network Channel Pruning
元剪枝:
神经网络通道
自动剪枝
的
元学习
Accelerate CNN via Recursive Bayesian Pruning
通过
递归贝叶斯剪枝
实现
加速CNN
HBONet: Harmonious Bottleneck on Two Orthogonal Dimensions
HBONet:
两个正交维度上的
和谐瓶颈
O2U-Net: A Simple Noisy Label Detection Approach for Deep Neural Networks
O2U-Net:一种简单的
深度神经网络中
噪声标签检测方法
Continual Learning by Asymmetric Loss Approximation With Single-Side Overestimation
基于
单侧高估
的
非对称损失逼近
实现
连续学习
Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation
Label-PEnet:基于
序列标签传播
与
增强网络
的
弱监督
实例分割
LIP: Local Importance-Based Pooling
LIP:
局部
基于
重要性
的
池化
Global Feature Guided Local Pooling
全局功能引导
的
局部池化
Conditional Coupled Generative Adversarial Networks for Zero-Shot Domain Adaptation
基于
条件耦合GAN
的
零镜头
域自适应
Adversarial Defense by Restricting the Hidden Space of Deep Neural Networks
通过
限制
深层神经网络
隐藏空间
实现
对抗防御
Hyperpixel Flow: Semantic Correspondence With Multi-Layer Neural Features
超像素流:基于
多层神经特征
的
语义对应
Information Entropy Based Feature Pooling for Convolutional Neural Networks
基于
信息熵
的
卷积神经网络
特征池
Patchwork: A Patch-Wise Attention Network for Efficient Object Detection and Segmentation in Video Streams
PatchWork:一种用于
视频流
中有效
目标检测
和
分割
的
补丁式注意力网络
AttentionRNN: A Structured Spatial Attention Mechanism
AttentionRNN:一种
结构化
的
空间注意机制
像RNN一样的Attention,即在估计Attention Mask时,每个点都依赖于前面已估计出的点(传统的方式是,每个点独立估计)
Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks With Octave Convolution
降八度:用
八度卷积
减少
卷积神经网络的
空间冗余
Domain Intersection and Domain Difference
域交
与
域差
Learned Video Compression
学习
视频压缩
Local Relation Networks for Image Recognition
基于
局部关系网络
的
图像识别
DiscoNet: Shapes Learning on Disconnected Manifolds for 3D Editing
DiscoNect:
断开流形上的
形状学习
实现
三维编辑
Deep Residual Learning in the JPEG Transform Domain
JPEG变换域
的
深度残差学习
Approximated Bilinear Modules for Temporal Modeling
基于
近似双线性模型
的
时域建模
Customizing Student Networks From Heterogeneous Teachers via Adaptive Knowledge Amalgamation
自适应知识融合
实现
从
异构教师网络
定制
学生网络
Data-Free Learning of Student Networks
学生网络
的
无数据学习
Deep Closest Point: Learning Representations for Point Cloud Registration
深度最近点:基于
表示学习
的
点云配准
Orientation-Aware Semantic Segmentation on Icosahedron Spheres
二十面体球面上
的
方向感知
语义分割
全方向(omnidirectional)图像的语义分割
Differentiable Learning-to-Group Channels via Groupable Convolutional Neural Networks
基于
可分组卷积神经网络
的
信道群可微学习
HarDNet: A Low Memory Traffic Network
HarDNet:一个
低内存交通网络
Dynamic Multi-Scale Filters for Semantic Segmentation
用于
语义分割
的
动态多尺度滤波器
如图2,网络中添加多个个基于自适应池化学习出来的滤波器
Online Model Distillation for Efficient Video Inference
基于
在线模型蒸馏
的
有效视频推理
Rethinking Zero-Shot Learning: A Conditional Visual Classification Perspective
从
条件视觉分类
的角度
反思
零镜头学习
Task-Driven Modular Networks for Zero-Shot Compositional Learning
基于
任务驱动模块化网络
的
零镜头组合学习
Transductive Episodic-Wise Adaptive Metric for Few-Shot Learning
基于
转导不定自适应度量
的
少数镜头学习
Deep Multiple-Attribute-Perceived Network for Real-World Texture Recognition
用于
真实纹理识别
的
深度多属性感知网络
RGB-Infrared Cross-Modality Person Re-Identification via Joint Pixel and Feature Alignment
基于
联合
像素
和
特征
对齐
的
RGB-红外
交叉模态
人再识别
EvalNorm: Estimating Batch Normalization Statistics for Evaluation
EvalNorm:
估计
用于评估的
批处理规范化(BN)
统计信息
Beyond Human Parts: Dual Part-Aligned Representations for Person Re-Identification
超越人的部分:基于
双部分对齐
表示的
人再识别
Person Search by Text Attribute Query As Zero-Shot Learning
基于
作为
零镜头学习
的
文本属性查询
的
人搜索算法
Semantic-Aware Knowledge Preservation for Zero-Shot Sketch-Based Image Retrieval
语义感知知识保存
实现
零镜头
基于草图的图像检索
Active Learning for Deep Detection Neural Networks
主动学习
实现
深度检测
神经网络
One-Shot Neural Architecture Search via Self-Evaluated Template Network
基于
自评估模板网络
的
一次性
神经网络结构搜索
Batch DropBlock Network for Person Re-Identification and Beyond
用于
人再识别
及其他的
批处理DropBlock网络
Omni-Scale Feature Learning for Person Re-Identification
全尺度特征学习
用于
人再识别
Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self Distillation
做自己的老师:通过
自蒸馏
提高卷积神经网络的性能
Diversity With Cooperation: Ensemble Methods for Few-Shot Classification
合作分集
:用于
少镜头
分类
的集成
方法
Enhancing 2D Representation via Adjacent Views for 3D Shape Retrieval
基于
邻接视图
的
二维图形增强
实现
三维形状检索
Adversarial Fine-Grained Composition Learning for Unseen Attribute-Object Recognition
对抗性细粒度
合成学习
在
不可见属性-对象识别
中的应用
Auto-ReID: Searching for a Part-Aware ConvNet for Person Re-Identification
Auto-ReID:
搜索局部感知ConvNet
实现
人重识别
Second-Order Non-Local Attention Networks for Person Re-Identification
二阶非局部注意网络
用于
人再识别
Fast Computation of Content-Sensitive Superpixels and Supervoxels Using Q-Distances
用
Q-距离
快速计算内容敏感
超像素
和
超体素
Progressive-X: Efficient, Anytime, Multi-Model Fitting Algorithm
Progressive-X:
高效、随时、多模型
拟合算法
Structured Modeling of Joint Deep Feature and Prediction Refinement for Salient Object Detection
联合
深度特征
和
预测细化
的
结构化建模
实现
显著目标检测
Selectivity or Invariance: Boundary-Aware Salient Object Detection
选择性或不变性:
边界感知
显著目标检测
Online Unsupervised Learning of the 3D Kinematic Structure of Arbitrary Rigid Bodies
任意
刚体
三维
运动结构
的
在线无监督学习
Few-Shot Generalization for Single-Image 3D Reconstruction via Priors
利用
少镜头泛化
实现
基于先验的
单幅图像
三维重建
Digging Into Self-Supervised Monocular Depth Estimation
自监督
单目深度估计
方法的研究
Learning Object-Specific Distance From a Monocular Image
从单目图像
中
学习
特定对象
的
距离
Unsupervised 3D Reconstruction Networks
无监督
三维重建
网络
3D Point Cloud Generative Adversarial Network Based on Tree Structured Graph Convolutions
基于
树结构图卷积
的
三维点云GAN
Visualization of Convolutional Neural Networks for Monocular Depth Estimation
卷积神经网络可视化
在
单目
深度估计
中的应用
Co-Separating Sounds of Visual Objects
视觉对象的
共分离声音
BMN: Boundary-Matching Network for Temporal Action Proposal Generation
BMN:基于
边界匹配网络
的
时间行为建议生成
Weakly Supervised Temporal Action Localization Through Contrast Based Evaluation Networks
基于
对比度评价网络
的
弱监督
时间行为定位
Progressive Sparse Local Attention for Video Object Detection
基于
渐进稀疏局部注意
的
视频目标检测
Reasoning About Human-Object Interactions Through Dual Attention Networks
基于
双注意网络
的
人机交互推理
DMM-Net: Differentiable Mask-Matching Network for Video Object Segmentation
DMM-Net:用于
视频对象分割
的
可微掩模匹配网络
Asymmetric Cross-Guided Attention Network for Actor and Action Video Segmentation From Natural Language Query
非对称交叉引导注意网络
实现
自然语言查询中
角色
和
动作视频分割
AGSS-VOS: Attention Guided Single-Shot Video Object Segmentation
AGSS-VOS:
注意力引导
的
单镜头
视频对象分割
Global-Local Temporal Representations for Video Person Re-Identification
基于
全局-局部时间表示
的
视频
人再识别
AdvIT: Adversarial Frames Identifier Based on Temporal Consistency in Videos
ADvIT:基于
时间一致性
的
视频
对抗帧标识符
RANet: Ranking Attention Network for Fast Video Object Segmentation
RANet:用于
视频对象快速分割
的
排序注意网络
Spatial-Temporal Relation Networks for Multi-Object Tracking
用于
多目标跟踪
的
时空关系网络
Bridging the Gap Between Detection and Tracking: A Unified Approach
缩小
检测
和
跟踪
之间的
差距
:一种
统一的方法
Learning the Model Update for Siamese Trackers
学习
孪生跟踪器
的
模型更新
Fast-deepKCF Without Boundary Effect
无边界效应的
快速深度KCF
Program-Guided Image Manipulators
程序引导
图像操纵器
Calibration of Axial Fisheye Cameras Through Generic Virtual Central Models
通用
虚拟中心模型
对
鱼眼相机的
标定
Micro-Baseline Structured Light
微基线
结构光
l-Net: Reconstruct Hyperspectral Images From a Snapshot Measurement
l-Net:从
快照测量
重建高光谱图像
Deep Depth From Aberration Map
像差图
深度
A Dataset of Multi-Illumination Images in the Wild
野外
多光照图像
数据集
Monocular Neural Image Based Rendering With Continuous View Control
利用
连续视图控制
实现
基于
单目神经图像
的
展示
Multi-View Image Fusion
多视点
图像融合
Enhancing Low Light Videos by Exploring High Sensitivity Camera Noise
利用
高灵敏度相机噪声
实现
微光视频
增强
Deep Restoration of Vintage Photographs From Scanned Halftone Prints
从
扫描的半色调照片
中
深度复原
复古照片
Context-Aware Image Matting for Simultaneous Foreground and Alpha Estimation
上下文感知
图像抠图
实现
同时
进行
前景和α估计
CFSNet: Toward a Controllable Feature Space for Image Restoration
CFSNet:基于
可控特征空间
的
图像复原
Deep Blind Hyperspectral Image Fusion
深度
盲高光谱
图像融合
Fully Convolutional Pixel Adaptive Image Denoiser
全卷积
像素自适应
图像去噪
Coherent Semantic Attention for Image Inpainting
基于
连贯语义注意
的
图像修补
Embedded Block Residual Network: A Recursive Restoration Model for Single-Image Super-Resolution
嵌入块残差网络
:一种
单图像
超分辨率
的
递归恢复模型
Fast Image Restoration With Multi-Bin Trainable Linear Units
基于
Multi-Bin可训练线性单元
的
快速
图像复原
Counting With Focus for Free
免费
焦点计数
SynDeMo: Synergistic Deep Feature Alignment for Joint Learning of Depth and Ego-Motion
SynDeMo:基于
协同深度特征对齐
的
深度
和
自我运动
联合学习
Diverse Image Synthesis From Semantic Layouts via Conditional IMLE
基于
条件IMLE的
语义布局
多样性图像合成
Towards Bridging Semantic Gap to Improve Semantic Segmentation
通过
桥接语义鸿沟
实现
语义分割
改进
文章关注不同尺度特征的融合问题,在图6的网络结构中,使用了图4的三个模块,主要从多尺度融合和边缘感知两个方向,提升语义分割的效果
Generating Diverse and Descriptive Image Captions Using Visual Paraphrases
使用
视觉释义
生成
多样的描述性
图片标注
Learning to Collocate Neural Modules for Image Captioning
基于
神经模块配置学习
的
图像标注
Sequential Latent Spaces for Modeling the Intention During Diverse Image Captioning
序列潜空间
在
多样图像标注
中的
意图建模
Why Does a Visual Question Have Different Answers?
为什么
视觉问题
有
不同的答案
?
G3raphGround: Graph-Based Language Grounding
G3raphGround:基于
图形
的
语言Grounding
Scene Text Visual Question Answering
场景文本
可视化问答
Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry Towards Monocular Deep SLAM
关键帧检测
与
视觉里程测量
的
无监督协同学习
实现
单目深度SLAM
MVSCRF: Learning Multi-View Stereo With Conditional Random Fields
MVSCRF:基于
条件随机场
的
多视图
立体学习
Neural-Guided RANSAC: Learning Where to Sample Model Hypotheses
神经引导的
RANSAC
:
模型假设
采样位置
学习
Efficient Learning on Point Clouds With Basis Point Sets
基于
基础点集
的
点云高效学习
Cross View Fusion for 3D Human Pose Estimation
基于
交叉视图融合
的
三维
人体姿态估计
Shape-Aware Human Pose and Shape Reconstruction Using Multi-View Images
基于
多视点图像
的
形状感知
人体姿态
与
形状
重建
Monocular Piecewise Depth Estimation in Dynamic Scenes by Exploiting Superpixel Relations
基于
超像素关系
的
动态场景
单目分段深度估计
Is This the Right Place? Geometric-Semantic Pose Verification for Indoor Visual Localization
这是对的地方吗?基于
几何-语义
位姿验证
的
室内
视觉定位
DeepPruner: Learning Efficient Stereo Matching via Differentiable PatchMatch
DeepPruner:通过
可微Patch匹配
实现有效的
立体匹配
学习
1. 利用RNN的结构,描述PatchMatch
2. 利用可微的PatchMatch,缩小每个像素视差的搜索范围(传统的方法是所有视差可能性,而文中每个像素考虑的是部分视差,即Confidence Range,大约是全部视差范围的1/10)
Convolutional Sequence Generation for Skeleton-Based Action Synthesis
利用
卷积序列生成
实现
基于骨架的
动作合成
Onion-Peel Networks for Deep Video Completion
Onion-Peel网络
用于
深度视频补全
Copy-and-Paste Networks for Deep Video Inpainting
基于
复制-粘贴网络
的
深度
视频修补
Content and Style Disentanglement for Artistic Style Transfer
基于
内容与风格解构
的
艺术风格转换
Image2StyleGAN: How to Embed Images Into the StyleGAN Latent Space?
Image2StyleGAN:如何
将
图像嵌入
StyleGAN潜在空间
?
Controllable Artistic Text Style Transfer via Shape-Matching GAN
基于
形状-匹配GAN
的
可控艺术文本
风格转换
Understanding Generalized Whitening and Coloring Transform for Universal Style Transfer
广义白化
与
着色变换
在
通用风格转换
中的应用
Learning Implicit Generative Models by Matching Perceptual Features
基于
感知特征匹配
的
隐生成模型
学习
Free-Form Image Inpainting With Gated Convolution
基于
门控卷积
的
自由形式
图像补全
FiNet: Compatible and Diverse Fashion Image Inpainting
FiNet:
兼容
的和
多样
的
时尚形象修复
InGAN: Capturing and Retargeting the "DNA" of a Natural Image
InGAN:
捕捉
并
重新定位
自然图像的“DNA”
Seeing What a GAN Cannot Generate
看一个
GAN
不能产生什么
COCO-GAN: Generation by Parts via Conditional Coordinating
COCO-GAN:基于
条件配位
的
分块生成
Neural Turtle Graphics for Modeling City Road Layouts
基于
神经海龟图形建模
的
城市道路规划
Texture Fields: Learning Texture Representations in Function Space
纹理场:在
函数空间
中
学习纹理表示
PointFlow: 3D Point Cloud Generation With Continuous Normalizing Flows
PointFlow:基于
连续规格化流
的
三维点云生成
Meta-Sim: Learning to Generate Synthetic Datasets
Meta-Sim:
学习
生成合成数据集
Specifying Object Attributes and Relations in Interactive Scene Generation
在
交互式场景生成
中
指定
对象属性
和
关系
SinGAN: Learning a Generative Model From a Single Natural Image
SinGAN:
从单一自然图像
学习生成模型
VaTeX: A Large-Scale, High-Quality Multilingual Dataset for Video-and-Language Research
VaTex:一个用于
视频和语言研究
的
大规模、高质量的多语言
数据集
A Graph-Based Framework to Bridge Movies and Synopses
一种基于
图
的框架
实现
电影与剧情的桥接
From Strings to Things: Knowledge-Enabled VQA Model That Can Read and Reason
从字符串到事物:
可以读取和推理
的
支持知识的
VQA模型
Counterfactual Critic Multi-Agent Training for Scene Graph Generation
用于
场景图生成
的
反事实批评家
多智能体训练
Robust Change Captioning
强大的
更改字幕
Attention on Attention for Image Captioning
Dynamic Graph Attention for Referring Expression Comprehension
动态图形注意力
在
指称表达理解
中的应用
Visual Semantic Reasoning for Image-Text Matching
基于
视觉语义推理
的
图-文匹配
Phrase Localization Without Paired Training Examples
无配对训练实例
的
短语定位
Learning to Assemble Neural Module Tree Networks for Visual Grounding
基于
神经模块树网络学习
的
视觉Grounding
A Fast and Accurate One-Stage Approach to Visual Grounding
一种快速准确的
视觉Grounding
方法
Zero-Shot Grounding of Objects From Natural Language Queries
基于
自然语言查询
的
对象的
零镜头Grounding
Towards Unconstrained End-to-End Text Spotting
朝向
无约束
的
端到端
文本定位
What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis
场景文本识别
模型比较
有什么问题?
数据集
与
模型分析
Sparse and Imperceivable Adversarial Attacks
稀疏
而难以想象的
对抗性攻击
Enhancing Adversarial Example Transferability With an Intermediate Level Attack
使用
中级攻击
增强
对手示例
的
可转移性
Implicit Surface Representations As Layers in Neural Networks
神经网络层中
的
隐式曲面表示
A Tour of Convolutional Networks Guided by Linear Interpreters
线性解释引导
的
卷积网络
之旅
Small Steps and Giant Leaps: Minimal Newton Solvers for Deep Learning
小步
和
大步
:
深度学习
的
最小牛顿解
Semantic Adversarial Attacks: Parametric Transformations That Fool Deep Classifiers
语义对抗攻击
:通过
参数转换
愚弄深度分类器
Hilbert-Based Generative Defense for Adversarial Examples
基于
希尔伯特
的
生成性防御
实现
对抗例子
On the Efficacy of Knowledge Distillation
论
知识蒸馏
的
功效
Sym-Parameterized Dynamic Inference for Mixed-Domain Image Translation
混合域
图像翻译
的
Sym参数化动态推理
Better and Faster: Exponential Loss for Image Patch Matching
更快更好:
图像块匹配
的
指数损失
Physical Adversarial Textures That Fool Visual Object Tracking
物理对抗纹理
欺骗
视觉对象跟踪
Wasserstein GAN With Quadratic Transport Cost
基于
二次传输代价
的
Wasserstein GAN
Scalable Verified Training for Provably Robust Image Classification
基于
可扩展验证训练
的
可证明鲁棒
图像分类
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks
可微软量化
:
全精度
与
低比特神经网络
的
桥接
The LogBarrier Adversarial Attack: Making Effective Use of Decision Boundary Information
LogBarrier对抗攻击
:
决策边界信息
的有效利用
Proximal Mean-Field for Neural Network Quantization
基于
近场平均场
的
神经网络量化
Improving Adversarial Robustness via Guided Complement Entropy
利用
引导互补熵
提高
对抗稳健性
A Geometry-Inspired Decision-Based Attack
基于
几何启发
的
决策攻击
Universal Perturbation Attack Against Image Retrieval
图像检索
中的
普遍扰动攻击
Bayesian Optimized 1-Bit CNNs
贝叶斯
优化的1-BitCNNs
Rethinking ImageNet Pre-Training
对
ImageNet预训练
的
再思考
Defending Against Universal Perturbations With Shared Adversarial Training
基于
共同对抗性训练
的
普遍干扰防御
Adaptive Activation Thresholding: Dynamic Routing Type Behavior for Interpretability in Convolutional Neural Networks
自适应激活阈值:基于
动态路由类型行为
的
卷积神经网络
可解释性
XRAI: Better Attributions Through Regions
XRAI:通过
区域
获得
更好的属性
Guessing Smart: Biased Sampling for Efficient Black-Box Adversarial Attacks
猜测智能:基于
有偏抽样
的
高效
黑盒对抗攻击
Mask-Guided Attention Network for Occluded Pedestrian Detection
基于
面罩引导注意网络
的
遮挡行人检测
Spectral Feature Transformation for Person Re-Identification
基于
谱特征变换
的
人再识别
Permutation-Invariant Feature Restructuring for Correlation-Aware Image Set-Based Recognition
置换不变特征重构
实现
基于相关感知图像集的
图像识别
Improving Pedestrian Attribute Recognition With Weakly-Supervised Multi-Scale Attribute-Specific Localization
基于
弱监督多尺度
属性特定定位
的
行人属性识别
Correlation Congruence for Knowledge Distillation
基于
相关同余
的
知识蒸馏
Dynamic Curriculum Learning for Imbalanced Data Classification
基于
动态课程学习
的
不平衡数据分类
Video Face Clustering With Unknown Number of Clusters
未知簇数的
视频
人脸聚类
Targeted Mismatch Adversarial Attack: Query With a Flower to Retrieve the Tower
目标不匹配
对抗攻击
:
用
花
查询以检索
塔
Fashion++: Minimal Edits for Outfit Improvement
Fashion++:以
最小编辑
实现
服装改进
Semi-Supervised Pedestrian Instance Synthesis and Detection With Mutual Reinforcement
基于
互增强
的
半监督
行人实例综合
与
检测
SILCO: Show a Few Images, Localize the Common Object
SILCO:
显示一些
图像
,
定位公共
对象
A Deep Step Pattern Representation for Multimodal Retinal Image Registration
多模
视网膜图像配准
的
深度阶跃模式表示
Deep Graphical Feature Learning for the Feature Matching Problem
深度图形
特征学习
解决
特征匹配
问题
Minimum Delay Object Detection From Video
视频的
最小延迟
目标检测
Learning With Average Precision: Training Image Retrieval With a Listwise Loss
平均精度学习:基于
列表损失
的
图像检索
训练
Learning to Find Common Objects Across Few Image Collections
学习在
少数图像集合
中
查找公共对象
Weakly Aligned Cross-Modal Learning for Multispectral Pedestrian Detection
基于
弱对齐交叉模式学习
的
多光谱
行人检测
Deep Self-Learning From Noisy Labels
从
嘈杂的标签中
深度
自我学习
DSConv: Efficient Convolution Operator
DSConv:
高效
卷积算子
Once a MAN: Towards Multi-Target Attack via Learning Multi-Target Adversarial Network Once
一人一次:通过
一次学习多目标对抗网络
实现
多目标攻击
Explicit Shape Encoding for Real-Time Instance Segmentation
基于
显式形状编码
的
实时
实例分割
IMP: Instance Mask Projection for High Accuracy Semantic Segmentation of Things
IMP:用于
高精度
语义分割
的
实例掩码投影
Video Instance Segmentation
视频
实例分割
Attention Bridging Network for Knowledge Transfer
基于
注意力桥接网络
的
知识转移
Self-Supervised Difference Detection for Weakly-Supervised Semantic Segmentation
基于
自监督差分检测
的
弱监督
语义分割
SPGNet: Semantic Prediction Guidance for Scene Parsing
SPGNet:基于
语义预测指导
的
场景分析
Gated-SCNN: Gated Shape CNNs for Semantic Segmentation
门控SCNN:用于
语义分割
的
门控形状CNN
DensePoint: Learning Densely Contextual Representation for Efficient Point Cloud Processing
DensePoint:基于
密集上下文
表示学习
的高效
点云处理
AMP: Adaptive Masked Proxies for Few-Shot Segmentation
AMP:基于
自适应掩蔽代理
的
少镜头
分割
Universal Semi-Supervised Semantic Segmentation
通用
半监督
语义分割
Accelerate Learning of Deep Hashing With Gradient Attention
利用
梯度注意力
加速深度
散列学习
SVD: A Large-Scale Short Video Dataset for Near-Duplicate Video Retrieval
SVD:一种用于
近重复
视频检索
的
大规模
短视频数据集
Block Annotation: Better Image Annotation With Sub-Image Decomposition
块注释:使用
子图像分解
更好的
图像注释
Probabilistic Deep Ordinal Regression Based on Gaussian Processes
基于
高斯过程
的
概率深度
序数回归
Balanced Datasets Are Not Enough: Estimating and Mitigating Gender Bias in Deep Image Representations
平衡的数据集是不够的:
估计
和
减轻
深度图像表现中的
性别偏见
Teacher Guided Architecture Search
教师指导
的
架构搜索
FACSIMILE: Fast and Accurate Scans From an Image in Less Than a Second
FACSIMILE:在
不到一秒钟的时间内
快速准确地
扫描图像
Delving Deep Into Hybrid Annotations for 3D Human Recovery in the Wild
深入研究
混合标注
在
野外
三维人体复原
中的应用
Human Mesh Recovery From Monocular Images via a Skeleton-Disentangled Representation
基于
骨架分离表示
的
单目图像
人体网格恢复
Three-D Safari: Learning to Estimate Zebra Pose, Shape, and Texture From Images "In the Wild"
三维漫游:学习
从“野外”图像
中
估计
斑马
的
姿势
、
形状
和
纹理
Object-Driven Multi-Layer Scene Decomposition From a Single Image
基于
单个图像的
对象驱动
多层
场景分解
Occupancy Flow: 4D Reconstruction by Learning Particle Dynamics
占用流:基于
粒子动力学
的
4d重建
Joint Monocular 3D Vehicle Detection and Tracking
单目
三维车辆
联合
检测
与
跟踪
Fingerspelling Recognition in the Wild With Iterative Visual Attention
基于
迭代视觉注意力
的
野外
手指拼写
识别
PointAE: Point Auto-Encoder for 3D Statistical Shape and Texture Modelling
PointAE:用于
三维统计
形状
和
纹理建模
的
点自动编码器
Multi-Garment Net: Learning to Dress 3D People From Images
多服装网:
从图像中
学习三维
人体着装
Skeleton-Aware 3D Human Shape Reconstruction From Point Clouds
基于
点云
的
骨骼感知
三维人体形状重建
AMASS: Archive of Motion Capture As Surface Shapes
AMASS:
作为表面形状
的
运动捕捉存档
Person-in-WiFi: Fine-Grained Person Perception Using WiFi
WIFI中的人:
使用WIFI
的
细粒度的
人感知
FAB: A Robust Facial Landmark Detection Framework for Motion-Blurred Videos
FAB:一种鲁棒的
运动模糊视频
人脸地标检测
框架
Attentional Feature-Pair Relation Networks for Accurate Face Recognition
基于
注意力特征对关系网络
的
精确
人脸识别
Action Recognition With Spatial-Temporal Discriminative Filter Banks
基于
时空判别滤波器组
的
动作识别
EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition
EPIC融合:用于
自我中心
行为识别
的
视听时间绑定
Weakly-Supervised Action Localization With Background Modeling
基于
背景建模
的
弱监督
动作定位
Grouped Spatial-Temporal Aggregation for Efficient Action Recognition
基于
分组时空聚合
的
动作识别
Temporal Structure Mining for Weakly Supervised Action Detection
弱监督
动作检测
的
时间结构挖掘
Temporal Recurrent Networks for Online Action Detection
用于
在线动作检测
的
时间递归网络
StartNet: Online Detection of Action Start in Untrimmed Videos
StartNet:
未剪辑视频
中
动作开始
的在线检测
Video Classification With Channel-Separated Convolutional Networks
基于
通道分离
卷积网络
的
视频分类
Predicting the Future: A Jointly Learnt Model for Action Anticipation
预测未来:一个基于
共同学习
的
行动预测
模型
Human-Aware Motion Deblurring
人体感知
运动去模糊
Fast Video Object Segmentation via Dynamic Targeting Network
基于
动态目标网络
的
视频对象
快速
分割
Solving Vision Problems via Filtering
通过
滤波
解决
视觉问题
GAN-Based Projector for Faster Recovery With Convergence Guarantees in Linear Inverse Problems
线性反问题
中
基于
GAN
的
投影
实现
具有收敛保证的
更快恢复
Scoot: A Perceptual Metric for Facial Sketches
Scoot:基于
感知测度
的
面部草图
Learning Filter Basis for Convolutional Neural Network Compression
基于
滤波基学习
的
卷积神经网络
压缩
End-to-End Learning of Representations for Asynchronous Event-Based Data
端到端表示学习
实现
异步
基于事件的数据
ERL-Net: Entangled Representation Learning for Single Image De-Raining
ERL网:基于
纠缠表示学习
的
单图像去雨
Perceptual Deep Depth Super-Resolution
感知深度
超分辨率
3D Scene Graph: A Structure for Unified Semantics, 3D Space, and Camera
三维场景图:用于
统一
语义
、
三维空间
和
相机
的
结构
Floorplan-Jigsaw: Jointly Estimating Scene Layout and Aligning Partial Scans
平面拼图:
联合
估计场景布局
和
对齐部分扫描
Enforcing Geometric Constraints of Virtual Normal for Depth Prediction
基于
虚拟法向
几何约束
的
深度预测
Deep Contextual Attention for Human-Object Interaction Detection
基于
深度上下文注意
的
人-对象交互检测
Learning Compositional Neural Information Fusion for Human Parsing
用于
人类分析
的
合成神经信息
融合
学习
Attentional Neural Fields for Crowd Counting
人群计数
的
注意神经场
Understanding Human Gaze Communication by Spatio-Temporal Graph Reasoning
用
时空图推理
理解
人的凝视交流
Controllable Attention for Structured Layered Video Decomposition
基于
可控注意
的
结构化分层
视频分解
GANalyze: Toward Visual Definitions of Cognitive Image Properties
认知图像属性
的
视觉定义
Saliency-Guided Attention Network for Image-Sentence Matching
显著性引导注意力网络
在
图像-句子匹配
中的应用
CAMP: Cross-Modal Adaptive Message Passing for Text-Image Retrieval
CAMP:用于
文本-图像检索
的
跨模式自适应消息传递
ACMM: Aligned Cross-Modal Memory for Few-Shot Image and Sentence Matching
ACMM:用于
少镜头
图像
和
句子匹配
的
对齐跨模态存储器
Creativity Inspired Zero-Shot Learning
创意激发
零镜头学习
Generating Easy-to-Understand Referring Expressions for Target Identifications
为
目标识别
生成易于理解的指代表达
Language-Agnostic Visual-Semantic Embeddings
语言不可知
的
视觉语义嵌入
Adversarial Representation Learning for Text-to-Image Matching
文本-图像匹配
中的
对抗表示学习
Multi-Modality Latent Interaction Network for Visual Question Answering
视觉问答
的
多模态潜在交互网络
Key.Net: Keypoint Detection by Handcrafted and Learned CNN Filters
Key.Net:基于
手工特征
和
CNN过滤器学习
的
关键点检测
Learning Two-View Correspondences and Geometry Using Order-Aware Network
基于
顺序感知网络
的
两视图
对应
与
几何
学习
Learning Meshes for Dense Visual SLAM
稠密视觉SLAM
的
学习网格
EM-Fusion: Dynamic Object-Level SLAM With Probabilistic Data Association
EM融合:基于
概率数据关联
的
动态对象级SLAM
ClusterSLAM: A SLAM Backend for Simultaneous Rigid Body Clustering and Motion Estimation
ClusterSLAM
:
同时进行
刚体聚类
和
运动估计
的
SLAM后端
Efficient and Robust Registration on the 3D Special Euclidean Group
三维特殊欧氏群
的
高效鲁棒配准
Algebraic Characterization of Essential Matrices and Their Averaging in Multiview Settings
多视图环境
下
本质矩阵
的
代数特征
及
其平均
Liquid Warping GAN: A Unified Framework for Human Motion Imitation, Appearance Transfer and Novel View Synthesis
液体翘曲GAN
:一个
统一的
人体运动模拟
、
外观传递
和
新视角合成
框架
RelGAN: Multi-Domain Image-to-Image Translation via Relative Attributes
RelGAN:基于
相对属性
的
多域
图像-图像转换
Attribute-Driven Spontaneous Motion in Unpaired Image Translation
非成对
图像翻译
中的
属性驱动
自发运动
Everybody Dance Now
现在
大家都跳舞
Multimodal Style Transfer via Graph Cuts
基于
图割
的
多模态转移
A Closed-Form Solution to Universal Style Transfer
通用
样式转换
的一种
闭式解法
Progressive Reconstruction of Visual Structure for Image Inpainting
图像修补
中
视觉结构
的
渐进重建
Variational Adversarial Active Learning
变分对抗性
主动学习
主动学习:让学习算法主动地提出要对哪些数据进行标注
Confidence Regularized Self-Training
基于
自信心正则化
的
自训练
Anchor Loss: Modulating Loss Scale Based on Prediction Difficulty
锚损失:基于
预测难度
的
调整损失尺度
Local Aggregation for Unsupervised Learning of Visual Embeddings
基于
局部聚集
的
无监督
视觉嵌入
学习
PR Product: A Substitute for Inner Product in Neural Networks
PR乘积
:
神经网络内积
的
一种代用品
CutMix: Regularization Strategy to Train Strong Classifiers With Localizable Features
CutMix:
训练具有局部特征的
强分类器
的
正则化策略
Towards Interpretable Object Detection by Unfolding Latent Structures
基于
潜在结构展开
的
可解释
目标检测
Scaling Object Detection by Transferring Classification Weights
基于
分类权重转移
的
分级
目标检测
Scale-Aware Trident Networks for Object Detection
基于尺度感知的
Trident网络
实现
目标检测
Object-Aware Instance Labeling for Weakly Supervised Object Detection
基于
目标感知
实例标记
的
弱监督
目标检测
Generative Modeling for Small-Data Object Detection
小数据
目标检测
的
生成模型
Transductive Learning for Zero-Shot Object Detection
基于
导纳学习
的
零镜头
目标检测
Self-Training and Adversarial Background Regularization for Unsupervised Domain Adaptive One-Stage Object Detection
基于
自训练
与
对抗背景正则化
的
无监督
域自适应
单阶段
目标检测
Memory-Based Neighbourhood Embedding for Visual Recognition
基于记忆的
邻域嵌入
实现
视觉识别
Self-Similarity Grouping: A Simple Unsupervised Cross Domain Adaptation Approach for Person Re-Identification
自相似分组
:一种简单的
无监督
跨域自适应
方法
Deep Reinforcement Active Learning for Human-in-the-Loop Person Re-Identification
基于
深度强化
主动学习
的
回路中人的
人再识别
A Dual-Path Model With Adaptive Attention for Vehicle Re-Identification
一种具有
自适应注意的
双路径模型
实现
车辆重识别
Bayesian Loss for Crowd Count Estimation With Point Supervision
贝叶斯损失
用于
基于点监督的
人群计数
Learning Spatial Awareness to Improve Crowd Counting
空间感知学习
提高
人群计数
GradNet: Gradient-Guided Network for Visual Object Tracking
GradNet:基于
梯度引导网络
的
视觉目标跟踪
FAMNet: Joint Learning of Feature, Affinity and Multi-Dimensional Assignment for Online Multiple Object Tracking
FAMNet:基于
特征
、
亲和力
和
多维分配
联合学习
的
在线
多目标跟踪
Learning Discriminative Model Prediction for Tracking
基于
判别模型预测学习
的
跟踪
DynamoNet: Dynamic Action and Motion Network
动态
动作
与
运动
网络
SlowFast Networks for Video Recognition
用于
视频识别
的
SlowFast网络
Generative Multi-View Human Action Recognition
生成性多视角
人类行为识别
Multi-Agent Reinforcement Learning Based Frame Sampling for Effective Untrimmed Video Recognition
基于
多智能体增强学习
的
帧采样
实现
有效的未经修剪
视频识别
SCSampler: Sampling Salient Clips From Video for Efficient Action Recognition
SCSampler:
从视频中
抽取显著片段
以实现
高效的
动作识别
Weakly Supervised Energy-Based Learning for Action Segmentation
弱监督
基于能量的学习
实现
动作分割
What Would You Expect? Anticipating Egocentric Actions With Rolling-Unrolling LSTMs and Modality Attention
你期望什么?以
滚动-展开的
LSTMs
和
情态注意
预测
自我中心
行为
PIE: A Large-Scale Dataset and Models for Pedestrian Intention Estimation and Trajectory Prediction
PIE:用于
行人
意图估计
和
轨迹预测
的
大规模数据集和模型
STGAT: Modeling Spatial-Temporal Interactions for Human Trajectory Prediction
STGAT:用于
人类轨迹预测
的
时-空交互建模
Learning Motion in Feature Space: Locally-Consistent Deformable Convolution Networks for Fine-Grained Action Detection
特征空间中的运动学习:基于
局部一致可变形卷积网络
的
细粒度
动作检测
Dual Attention Matching for Audio-Visual Event Localization
基于
双注意匹配
的
视-听
事件定位
Uncertainty-Aware Audiovisual Activity Recognition Using Deep Bayesian Variational Inference
基于
深度贝叶斯变分推理
的
不确定性感知的
视-听活动识别
Non-Local Recurrent Neural Memory for Supervised Sequence Modeling
基于
非局部递归神经记忆
的
监督
序列建模
Temporal Attentive Alignment for Large-Scale Video Domain Adaptation
基于
时间注意力对齐
的
大规模视频
域自适应
Action Assessment by Joint Relation Graphs
基于
联合关系图
的
行动评估
Unsupervised Procedure Learning via Joint Dynamic Summarization
基于
联合动态摘要
的
无监督
过程学习
ViSiL: Fine-Grained Spatio-Temporal Video Similarity Learning
ViSiL:
细粒度时-空视频
相似度学习
Unsupervised Learning of Landmarks by Descriptor Vector Exchange
基于
描述向量交换
的
无监督地标学习
Learning Compositional Representations for Few-Shot Recognition
基于
合成表示学习
的
少镜头识别
Spectral Regularization for Combating Mode Collapse in GANs
基于
谱正则化
的
GANs
抗模式崩溃
Scaling and Benchmarking Self-Supervised Visual Representation Learning
自监督
视觉表示学习
的
标度
与
标杆
Learning an Effective Equivariant 3D Descriptor Without Supervision
无监督学习
一种有效的
等变三维描述子
KPConv: Flexible and Deformable Convolution for Point Clouds
KPConv:用于
点云
的
柔性可变形
卷积
Neural Inter-Frame Compression for Video Coding
基于
神经帧间压缩
的
视频编码
Task2Vec: Task Embedding for Meta-Learning
Task2Vec:基于
任务嵌入
的
元学习
Deep Clustering by Gaussian Mixture Variational Autoencoders With Graph Embedding
图嵌入
实现
基于
高斯混合变分自编码
的
深度聚类
SoftTriple Loss: Deep Metric Learning Without Triplet Sampling
软三元损失
:
无三元抽样的
深度度量学习
A Weakly Supervised Fine Label Classifier Enhanced by Coarse Supervision
一种基于
粗监督
的
弱监督精细
标记分类器
Gaussian Affinity for Max-Margin Class Imbalanced Learning
基于
高斯亲合性
的
最大边缘
类非平衡学习
AttPool: Towards Hierarchical Feature Representation in Graph Convolutional Networks via Attention Mechanism
AttPool:基于
注意力机制
的
图形卷积网络
层次特征表示
Deep Metric Learning With Tuplet Margin Loss
具有
三元边缘损失
的
深度
度量学习
Normalized Wasserstein for Mixture Distributions With Applications in Adversarial Learning and Domain Adaptation
基于标准化Wasserstei
n的
混合分布
在
对抗学习
和
域自适应
中的应用
Fast and Practical Neural Architecture Search
快速实用的
神经网络架构搜索
Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learning
基于
对称图卷积自动编码器
的
无监督
图表示学习
Deep Elastic Networks With Model Selection for Multi-Task Learning
基于模型选择的
深度弹性网络
实现
多任务学习
Metric Learning With HORDE: High-Order Regularizer for Deep Embeddings
基于
HORDE
的
度量学习
:
深度嵌入
的
高阶正则化
Adversarial Learning With Margin-Based Triplet Embedding Regularization
基于边缘的
三元嵌入正则化
实现
对抗学习
Simultaneous Multi-View Instance Detection With Learned Geometric Soft-Constraints
基于
学习几何软约束
的
多视图同时
实例检测
CenterNet: Keypoint Triplets for Object Detection
CenterNet:基于
关键点三元组
的
对象检测
Online Hyper-Parameter Learning for Auto-Augmentation Strategy
基于
在线超参数学习
的
自增强策略
DANet: Divergent Activation for Weakly Supervised Object Localization
DANet:基于
发散激活
的
弱监督
目标定位
Selective Sparse Sampling for Fine-Grained Image Recognition
基于
选择性稀疏采样
的
细粒度
图像识别
Dynamic Anchor Feature Selection for Single-Shot Object Detection
基于
动态锚特征选择
的
单镜头
目标检测
Incremental Learning Using Conditional Adversarial Networks
基于
条件对抗网络
的
增量学习
Bilateral Adversarial Training: Towards Fast Training of More Robust Models Against Adversarial Attacks
双边对抗性训练
:快速训练更强大的
抗对抗性攻击
模型
View Confusion Feature Learning for Person Re-Identification
基于
视图混淆特征学习
的
人再识别
Auto-FPN: Automatic Network Architecture Adaptation for Object Detection Beyond Classification
Auto-FPN:
自动网络体系结构自适应
实现
超越分类的
目标检测
PARN: Position-Aware Relation Networks for Few-Shot Learning
PARN:基于
位置感知关系网络
的
少镜头学习
Multi-Adversarial Faster-RCNN for Unrestricted Object Detection
基于
多对抗Faster-RCNN
的
无限制
目标检测
Object Guided External Memory Network for Video Object Detection
基于
目标引导外存网络
的
视频目标检测
An Empirical Study of Spatial Attention Mechanisms in Deep Networks
深度网络中
空间注意机制
的
实证研究
Attribute Attention for Semantic Disambiguation in Zero-Shot Learning
零镜头学习
中基于
属性注意
的
语义消歧
CIIDefence: Defeating Adversarial Attacks by Fusing Class-Specific Image Inpainting and Image Denoising
CIIDefence:通过
融合
特定类别的
图像修复
和
图像去噪
来
战胜对抗性攻击
ThunderNet: Towards Real-Time Generic Object Detection on Mobile Devices
ThunderNet:面向移动设备的
实时通用
目标检测
Dual Student: Breaking the Limits of the Teacher in Semi-Supervised Learning
双重学生
:
打破
教师
在
半监督学习
中的
局限
MVP Matching: A Maximum-Value Perfect Matching for Mining Hard Samples, With Application to Person Re-Identification
MVP匹配:挖
掘难样本
的
极大值完全匹配
方法及其在
人再识别
中的应用
Adaptive Context Network for Scene Parsing
用于
场景分析
的
自适应上下文网络
Constructing Self-Motivated Pyramid Curriculums for Cross-Domain Semantic Segmentation: A Non-Adversarial Approach
基于
自我激励金字塔课程
的
跨域
语义分割
:一种非对抗性方法
课程学习:基于局部分布
自我激励:基于潜变量
本文将两种方式结合起来,并结合金字塔技术,实现
域自适应的语义分割
SparseMask: Differentiable Connectivity Learning for Dense Image Prediction
SparseMask:用于
稠密图像预测
的
可微连通学习
Significance-Aware Information Bottleneck for Domain Adaptive Semantic Segmentation
基于
重要性感知信息Bottleneck
的
域自适应
语义分割
基于GAN的
域自适应语义分割
的改进,对潜变量进行重要性感知的限制(如图2,3)
Relational Attention Network for Crowd Counting
基于
关系注意力网络
的
人群计数
ACFNet: Attentional Class Feature Network for Semantic Segmentation
ACFNet:基于
注意力类特征网络
的
语义分割
一种利用
类别特征
进行语义分割
refine
的方法,如图2,3。
在粗粒度的语义分割基础上,提取不同类别的特征,进一步由不同类别的特征,对骨干网提出的特征进行Attention,并在此基础上refine
Frame-to-Frame Aggregation of Active Regions in Web Videos for Weakly Supervised Semantic Segmentation
基于
web视频活动区域
帧间聚合
的
弱监督
语义分割
Boundary-Aware Feature Propagation for Scene Segmentation
基于
边界感知特征传播
的
场景分割
Self-Ensembling With GAN-Based Data Augmentation for Domain Adaptation in Semantic Segmentation
基于
GAN的数据增强
的
自组织
在
域自适应
语义分割
中的应用
Explaining the Ambiguity of Object Detection and 6D Pose From Visual Data
从
视觉数据
解释
目标检测
和
6d姿态
的模糊性
Accurate Monocular 3D Object Detection via Color-Embedded 3D Reconstruction for Autonomous Driving
基于
彩色嵌入三维重建
的
单目
三维物体精确检测
在
自动驾驶
的应用
MonoLoco: Monocular 3D Pedestrian Localization and Uncertainty Estimation
单目
三维
行人定位
及
不确定性估计
Unsupervised High-Resolution Depth Learning From Videos With Dual Networks
基于
双网络
的
视频
无监督高分辨率
深度学习
Bayesian Graph Convolution LSTM for Skeleton Based Action Recognition
贝叶斯图卷积LSTM
实现
基于骨架的
动作识别
DeCaFA: Deep Convolutional Cascade for Face Alignment in the Wild
DeCaFa:基于
深度卷积级联
的
野外
人脸定位
Probabilistic Face Embeddings
概率
人脸嵌入
Gaze360: Physically Unconstrained Gaze Estimation in the Wild
Gaze360:野外自然
无约束
凝视估计
Unsupervised Person Re-Identification by Camera-Aware Similarity Consistency Learning
基于
摄像机感知
相似一致性学习
的
无监督
人再识别
Photo-Realistic Monocular Gaze Redirection Using Generative Adversarial Networks
基于
GAN
的
单目
注视重定向
Dynamic Kernel Distillation for Efficient Pose Estimation in Videos
动态核蒸馏
在
视频
位姿估计
中的应用
Single-Stage Multi-Person Pose Machines
单级多人
位姿机
SO-HandNet: Self-Organizing Network for 3D Hand Pose Estimation With Semi-Supervised Learning
So-HandNet:基于
自组织网络
的
半监督
三维手姿态估计
Adaptive Wing Loss for Robust Face Alignment via Heatmap Regression
利用
热图回归
实现基于
Wing损失
的
鲁棒
人脸对齐
Single-Network Whole-Body Pose Estimation
单网络
全身姿态估计
Face Alignment With Kernel Density Deep Neural Network
基于
核密度
深度神经网络
的
人脸对齐
Spatiotemporal Feature Residual Propagation for Action Prediction
基于
时空特征
残差传播
的
动作预测
Identity From Here, Pose From There: Self-Supervised Disentanglement and Generation of Objects Using Unlabeled Videos
从这里来的身份,从那里来的姿势:使用
无标签视频
的
自监督
分离
和
对象生成
Relation Distillation Networks for Video Object Detection
基于
关系蒸馏网络
的
视频对象检测
Video Compression With Rate-Distortion Autoencoders
基于
率失真自编码器
的
视频压缩
Non-Local ConvLSTM for Video Compression Artifact Reduction
基于
非局部ConvLSTM
的
视频压缩
伪影减少
Self-Supervised Moving Vehicle Tracking With Stereo Sound
基于
立体声
的
自监督
运动车辆跟踪
Self-Supervised Learning With Geometric Constraints in Monocular Video: Connecting Flow, Depth, and Camera
单目视频中
带几何约束的
自监督学习
:
连接流、深度和摄像机
Learning Temporal Action Proposals With Fewer Labels
用
较少的标签
学习
时域行动建议
TSM: Temporal Shift Module for Efficient Video Understanding
TSM:基于
时域转换模块
的
高效
视频理解
Graph Convolutional Networks for Temporal Action Localization
基于
图卷积网络
的
时域
动作定位
Fast Object Detection in Compressed Video
压缩视频中
的
快速
目标检测
Predicting 3D Human Dynamics From Video
视频的
三维
人体动力学
预测
Imitation Learning for Human Pose Prediction
基于
模拟学习
的
人体姿态预测
Human Motion Prediction via Spatio-Temporal Inpainting
基于
时空修复
的
人体运动预测
Structured Prediction Helps 3D Human Motion Modelling
结构化预测
有助于
三维
人体运动建模
Learning Shape Templates With Structured Implicit Functions
基于
结构化隐函数
的
形状模板学习
CompenNet++: End-to-End Full Projector Compensation
CompenNet++:
端到端的
完整
投影仪补偿
Deep Parametric Indoor Lighting Estimation
深度参数化
室内照明估算
FSGAN: Subject Agnostic Face Swapping and Reenactment
FSGAN:
主体不可知的
人脸交换
和
重生成
Deep Single-Image Portrait Relighting
深度
单像
人像Relighting
PU-GAN: A Point Cloud Upsampling Adversarial Network
PU-GAN:一种
点云上采样
对抗网络
Neural 3D Morphable Models: Spiral Convolutional Networks for 3D Shape Representation Learning and Generation
神经三维变形模型:
螺旋卷积网络
在
三维形状表示
学习与生成
中的应用
Joint Learning of Saliency Detection and Weakly Supervised Semantic Segmentation
显著性检测
与
弱监督
语义分割
的
联合学习
弱监督语义分割:输入两类训练集(像素级显著性训练集和类别级分类训练集),训练后的像素级语义分割
Towards High-Resolution Salient Object Detection
高分辨率
显著目标检测
Event-Based Motion Segmentation by Motion Compensation
利用
运动补偿
实现
基于事件的
运动分割
Depth-Induced Multi-Scale Recurrent Attention Network for Saliency Detection
基于
深度诱导
多尺度
递归注意力网络
的
显著性检测
Stacked Cross Refinement Network for Edge-Aware Salient Object Detection
基于
叠层交叉
求精网络
的
边缘感知
显著目标检测
Motion Guided Attention for Video Salient Object Detection
基于
运动引导注意力
的
视频
显著目标检测
Semi-Supervised Video Salient Object Detection Using Pseudo-Labels
基于
伪标签
的
半监督视频
显著目标检测
Joint Learning of Semantic Alignment and Object Landmark Detection
语义对齐
与
目标标志检测
的
联合学习
RainFlow: Optical Flow Under Rain Streaks and Rain Veiling Effect
雨流:
雨带
和
雨幕效应
下的
光流
GridDehazeNet: Attention-Based Multi-Scale Network for Image Dehazing
GridDehazeNet:基于
注意力
的
多尺度
图像去雾
网络
Learning to See Moving Objects in the Dark
学会
在黑暗中
看到移动的物体
SegSort: Segmentation by Discriminative Sorting of Segments
SegSort:通过
判别性
分段排序
来
分割
What Synthesis Is Missing: Depth Adaptation Integrated With Weak Supervision for Indoor Scene Parsing
合成缺少什么:
深度自适应
与
弱监督
相结合
的
室内场景分析
AdaptIS: Adaptive Instance Selection Network
AdaptIS:
自适应
实例选择
网络
DADA: Depth-Aware Domain Adaptation in Semantic Segmentation
DADA:基于
深度感知
域自适应
的
语义分割
Guided Curriculum Model Adaptation and Uncertainty-Aware Evaluation for Semantic Nighttime Image Segmentation
基于
引导课程模型自适应
和
不确定性感知评价
的
夜间图像
语义分割
课程学习、自适应、夜间图像的语义分割
SceneGraphNet: Neural Message Passing for 3D Indoor Scene Augmentation
SceneGraphNet:基于
神经信息传递
的
三维室内
场景增强
SkyScapes Fine-Grained Semantic Understanding of Aerial Scenes
空中场景的
精细
语义理解
Transferable Representation Learning in Vision-and-Language Navigation
基于
可迁移表示学习
的
视觉与语言导航
Towards Unsupervised Image Captioning With Shared Multimodal Embeddings
基于
共享多模式嵌入
的
无监督
图像标注
ViCo: Word Embeddings From Visual Co-Occurrences
由
视觉共现
实现
词嵌入
Seq-SG2SL: Inferring Semantic Layout From Scene Graph Through Sequence to Sequence Learning
Seq-SG2SL:通过
序列到序列学习
从场景图
推断语义布局
U-CAM: Visual Explanation Using Uncertainty Based Class Activation Maps
U-CAM:
基于不确定性的
类激活图
实现
可视化解释
See-Through-Text Grouping for Referring Image Segmentation
基于
透明文本分组
的
参考图像分割
VideoBERT: A Joint Model for Video and Language Representation Learning
VideoBERT:一种
视频和语言
表示学习
的
联合模型
Language Features Matter: Effective Language Representations for Vision-Language Tasks
语言特征的重要性:
视觉-语言任务
的
有效语言表示
Semantic Stereo Matching With Pyramid Cost Volumes
基于
金字塔CostVolume
的
语义
立体匹配
1. 采用语义分割提升立体匹配
2. 采用不同尺度的CostVolume
Spatial Correspondence With Generative Adversarial Network: Learning Depth From Monocular Videos
基于GAN的
空间对应
:
单目视频的
学习深度
Learning Relationships for Multi-View 3D Object Recognition
基于
关系学习
的
多视图
三维目标识别
View N-Gram Network for 3D Object Retrieval
基于
视图N-Gram网络
的
三维
对象检索
Expert Sample Consensus Applied to Camera Re-Localization
专家样本
一致性
在
相机再定位
中的应用
Semantic Part Detection via Matching: Learning to Generalize to Novel Viewpoints From Limited Training Data
基于
匹配
的
语义部分检测
:
学习从
有限的训练数据
推广到
新的视点
Dynamic Points Agglomeration for Hierarchical Point Sets Learning
基于
动态点聚集
的
层次
点集学习
Attributing Fake Images to GANs: Learning and Analyzing GAN Fingerprints
将假图像归因于GANs:
GAN指纹
的
学习
与
分析
Dual Adversarial Inference for Text-to-Image Synthesis
基于
双对抗推理
的
文本到图像合成
View-LSTM: Novel-View Video Synthesis Through View Decomposition
视图LSTM:一种新的基于
视图分解
的
新视图
视频合成
方法
HoloGAN: Unsupervised Learning of 3D Representations From Natural Images
HoloGAN:
自然图像
三维表示
的
无监督学习
Unpaired Image-to-Speech Synthesis With Multimodal Information Bottleneck
基于
多模态信息Bottleneck
的
非配对
图像-语音合成
Improved Conditional VRNNs for Video Prediction
基于
条件VRNNs
的
视频预测
改进
Visualizing the Invisible: Occluded Vehicle Segmentation and Recovery
可视化看不见:
遮挡车辆
分割与恢复
Learning Single Camera Depth Estimation Using Dual-Pixels
利用
双像素
学习单摄像机
深度估计
Domain-Adaptive Single-View 3D Reconstruction
域自适应单视图
三维重建
Transformable Bottleneck Networks
可转换
Bottleneck网络
RIO: 3D Object Instance Re-Localization in Changing Indoor Environments
RIO:
在变化的室内环境中
3D对象实例的
重新定位
Pix2Pose: Pixel-Wise Coordinate Regression of Objects for 6D Pose Estimation
Pix2Pose:基于
逐像素坐标回归
的
6D姿态估计
CDPN: Coordinates-Based Disentangled Pose Network for Real-Time RGB-Based 6-DoF Object Pose Estimation
CDPN:
基于坐标的
解纠缠位姿网络
实现
实时基于RGB的六自由度
目标位姿估计
C3DPO: Canonical 3D Pose Networks for Non-Rigid Structure From Motion
C3DPO:基于
标准三维位姿网络
的
非刚性Structure From Motion
Learning to Reconstruct 3D Manhattan Wireframes From a Single Image
学习
从单个图像
重建
曼哈顿三维线框
Soft Rasterizer: A Differentiable Renderer for Image-Based 3D Reasoning
软光栅化器:一种
可微渲染器
实现
基于图像的
三维推理
Learnable Triangulation of Human Pose
人体姿势
三角剖分学习
xR-EgoPose: Egocentric 3D Human Pose From an HMD Camera
xR-EgoPose:
HMD相机
的
以自我为中心的
3D人体姿势
DeepHuman: 3D Human Reconstruction From a Single Image
DeepHuman:
从单个图像
重建
三维人体
A Neural Network for Detailed Human Depth Estimation From a Single Image
单幅图像的
人体深度精细估计
神经网络
DenseRaC: Joint 3D Pose and Shape Estimation by Dense Render-and-Compare
DenseRaC:基于
稠密渲染和比较
的
联合
三维姿态
和
形状估计
Not All Parts Are Created Equal: 3D Pose Estimation by Modeling Bi-Directional Dependencies of Body Parts
并非所有的部分都是平等地创建:通过
建立
身体部分
的
双向依赖关系
来
估计
三维姿势
Extreme View Synthesis
极限
视图合成
View Independent Generative Adversarial Network for Novel View Synthesis
视图无关GAN
在
新视图合成
中的应用
Cascaded Context Pyramid for Full-Resolution 3D Semantic Scene Completion
基于
级联上下文金字塔
的
全分辨率
三维语义场景补全
View-Consistent 4D Light Field Superpixel Segmentation
视图一致的
4D光场
超像素分割
GLoSH: Global-Local Spherical Harmonics for Intrinsic Image Decomposition
GLoSH:用于
内在
图像分解
的
全局-局部球谐函数
Surface Normals and Shape From Water
水面
法向量
和
形状
Restoration of Non-Rigidly Distorted Underwater Images Using a Combination of Compressive Sensing and Local Polynomial Image Representations
基于
压缩传感
和
局部多项式图像表示
组合
的
非刚性畸变
水下图像复原
Learning Perspective Undistortion of Portraits
学习
肖像画
去失真
视角
Towards Photorealistic Reconstruction of Highly Multiplexed Lensless Images
高复用无透镜图像
的
真实感重建
Unconstrained Motion Deblurring for Dual-Lens Cameras
双镜头相机的
无约束
运动去模糊
Stochastic Exposure Coding for Handling Multi-ToF-Camera Interference
处理多TOF相机干扰
的
随机曝光编码
Convolutional Approximations to the General Non-Line-of-Sight Imaging Operator
一般
非视线成像算子
的
卷积逼近
Agile Depth Sensing Using Triangulation Light Curtains
基于
三角光幕
的
快速
深度传感
Asynchronous Single-Photon 3D Imaging
异步单光子
三维成像
Cross-Dataset Person Re-Identification via Unsupervised Pose Disentanglement and Adaptation
基于
无监督
姿势分离
和
自适应
的
跨数据集
人再识别
A Learned Representation for Scalable Vector Graphics
基于
表示学习
的
可伸缩
矢量图形
ELF: Embedded Localisation of Features in Pre-Trained CNN
ELF:在
预先训练的CNN
中
嵌入特征定位
Joint Group Feature Selection and Discriminative Filter Learning for Robust Visual Object Tracking
基于
联合
组特征选择
和
判别滤波器
学习
的
鲁棒
视觉目标跟踪
Sampling Wisely: Deep Image Embedding by Top-K Precision Optimization
明智采样:基于
Top-K精度优化
的
深度
图像嵌入
On the Global Optima of Kernelized Adversarial Representation Learning
核化
对抗表征学习
的
全局优化
Addressing Model Vulnerability to Distributional Shifts Over Image Transformation Sets
解决
图像转换集上
分布移位的
模型脆弱性
Attract or Distract: Exploit the Margin of Open Set
吸引或分散注意力:探索
开放集
的
边缘
MIC: Mining Interclass Characteristics for Improved Metric Learning
MIC:挖掘
类间特征
以
改进
度量学习
Self-Supervised Representation Learning via Neighborhood-Relational Encoding
基于
邻域关系编码
的
自监督
表示学习
AWSD: Adaptive Weighted Spatiotemporal Distillation for Video Representation
自适应加权
时空蒸馏
在
视频表示
中的应用
Bilinear Attention Networks for Person Retrieval
用于
人检索
的
双线性注意网络
Discriminative Feature Learning With Consistent Attention Regularization for Person Re-Identification
基于
一致注意正则化
的
判别特征学习
用于
人再识别
Semi-Supervised Domain Adaptation via Minimax Entropy
基于
极大极小熵
的
半监督
域自适应
Boosting Few-Shot Visual Learning With Self-Supervision
自我监督
促进
少镜头
视觉学习
FDA: Feature Disruptive Attack
FDA:
功能破坏性
攻击
A Novel Unsupervised Camera-Aware Domain Adaptation Framework for Person Re-Identification
一种新的
无监督摄像机感知
域自适应
框架实现
人再识别
Recover and Identify: A Generative Dual Model for Cross-Resolution Person Re-Identification
恢复与识别:一种
生成性
双重模型
实现
交叉分辨
人再识别
Cross-View Policy Learning for Street Navigation
用于
街道导航
的
交叉视野
策略学习
Learning Across Tasks and Domains
跨任务
、
跨领域
学习
EMPNet: Neural Localisation and Mapping Using Embedded Memory Points
EMPNet:基于
嵌入式存储点
的
神经
定位
与
映射
AVT: Unsupervised Learning of Transformation Equivariant Representations by Autoencoding Variational Transformations
AVT:
自编码变分变换
实现
变换等变表示
的无监督学习
Composite Shape Modeling via Latent Space Factorization
基于
潜在空间分解
的
复合
形状建模
Deep Comprehensive Correlation Mining for Image Clustering
基于
深度
综合相关挖掘
的
图像聚类
Unsupervised Multi-Task Feature Learning on Point Clouds
点云上
的
无监督
多任务
特征学习
Reciprocal Multi-Layer Subspace Learning for Multi-View Clustering
基于
互反多层
子空间学习
的
多视图聚类
Geometric Disentanglement for Generative Latent Shape Models
基于
几何解缠
的
生成性潜在
形状模型
GAN-Tree: An Incrementally Learned Hierarchical Generative Framework for Multi-Modal Data Distributions
GAN-Tree:一种
多模态数据分布
的
增量学习分层生成框架
GODS: Generalized One-Class Discriminative Subspaces for Anomaly Detection
GODs:
广义
一类判别
子空间
用于
异常检测
Neighborhood Preserving Hashing for Scalable Video Retrieval
可分级
视频检索
中的
邻域保持
哈希算法
Self-Training With Progressive Augmentation for Unsupervised Cross-Domain Person Re-Identification
无监督跨域
人再识别
的
渐进增强自训练
SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects
SCRDet:对
小的、杂乱的和旋转
的
物体
进行更稳健的
检测
Cross-X Learning for Fine-Grained Visual Categorization
基于
Cross-X学习
的
细粒度
视觉分类
Maximum-Margin Hamming Hashing
最大边缘
汉明散列
Conservative Wasserstein Training for Pose Estimation
基于
保守Wasserstein训练
的
姿势估计
Learning to Rank Proposals for Object Detection
基于
排序建议学习
的
目标检测
Vehicle Re-Identification With Viewpoint-Aware Metric Learning
基于
视点感知
度量学习
的
车辆再识别
WSOD2: Learning Bottom-Up and Top-Down Objectness Distillation for Weakly-Supervised Object Detection
WSPD2:基于
自下而上和自上而下
对象蒸馏学习
的
弱监督
对象检测
Localization of Deep Inpainting Using High-Pass Fully Convolutional Network
基于
高通全卷积网
络的
深度修补
定位
Clustered Object Detection in Aerial Images
航空图像中
的
簇状目标检测
Unsupervised Graph Association for Person Re-Identification
基于
无监督图关联
的
人再识别
Learning a Mixture of Granularity-Specific Experts for Fine-Grained Categorization
基于
粒度特定专家混合
学习
的
细粒度分类
advPattern: Physical-World Attacks on Deep Person Re-Identification via Adversarially Transformable Patterns
advPattern:通过
对抗转换模式
实现对
人再识别
进行物理世界
攻击
ABD-Net: Attentive but Diverse Person Re-Identification
ABD-Net
:
专注但多元的
人再识别
From Open Set to Closed Set: Counting Objects by Spatial Divide-and-Conquer
从开集到闭集:基于
空间分治
的
对象计数
Towards Precise End-to-End Weakly Supervised Object Detection Network
精确的
端到端弱监督
目标检测
网络
Learn to Scale: Generating Multipolar Normalized Density Maps for Crowd Counting
学习缩放:生成用于
人群计数
的
多极归一化密度图
Ground-to-Aerial Image Geo-Localization With a Hard Exemplar Reweighting Triplet Loss
具有
难样本重加权三元损失
的
地-空图像
地理定位
Learning to Discover Novel Visual Categories via Deep Transfer Clustering
通过
深度转移聚类学习
发现新的视觉类别
AM-LFS: AutoML for Loss Function Search
AM-LFS:用于
损失函数搜索
的
AutoML
Few-Shot Object Detection via Feature Reweighting
基于
特征重加权
的
少镜头
目标检测
Objects365: A Large-Scale, High-Quality Dataset for Object Detection
Objects365:用于
目标检测
的
大规模高质量
数据集
Efficient and Accurate Arbitrary-Shaped Text Detection With Pixel Aggregation Network
基于
像素聚集网络
的
任意形状
文本检测
Foreground-Aware Pyramid Reconstruction for Alignment-Free Occluded Person Re-Identification
基于
前景感知金字塔重建
的
无对齐遮挡
人再识别
Collect and Select: Semantic Alignment Metric Learning for Few-Shot Learning
收集和选择:用于
少镜头学习
的
语义对齐
度量学习
Bayesian Adaptive Superpixel Segmentation
贝叶斯自适应
超像素分割
CapsuleVOS: Semi-Supervised Video Object Segmentation Using Capsule Routing
CapsuleVOS:基于
胶囊路由
的
半监督
视频对象分割
BAE-NET: Branched Autoencoder for Shape Co-Segmentation
BAE-NET:基于
分支自动编码器
的
形状共分割
VV-Net: Voxel VAE Net With Group Convolutions for Point Cloud Segmentation
VV网:
基于组卷积的
体素VAE网
用于
点云分割
Miss Detection vs. False Alarm: Adversarial Learning for Small Object Segmentation in Infrared Images
漏检与虚警:
红外图像
小目标分割
的
对抗学习
Group-Wise Deep Object Co-Segmentation With Co-Attention Recurrent Neural Network
基于
共注意力
递归神经网络
的
组深度
目标共分割
Human Attention in Image Captioning: Dataset and Analysis
图像标注
中的
人注意
:
数据集
与
分析
Variational Uncalibrated Photometric Stereo Under General Lighting
一般光照下
变分非定标
光度立体
SPLINE-Net: Sparse Photometric Stereo Through Lighting Interpolation and Normal Estimation Networks
SPLINE网:通过
光插值
和
法向估计网络
的
稀疏
光度立体
Hyperspectral Image Reconstruction Using Deep External and Internal Learning
基于
内、外深度学习
的
高光谱图像重建
Gravity as a Reference for Estimating a Person's Height From Video
参考重力
实现
视频中
估计身高
的
Shadow Removal via Shadow Image Decomposition
基于
阴影图像分解
的
阴影去除
OperatorNet: Recovering 3D Shapes From Difference Operators
OperatorNet:从
差分运算符
恢复三维形状
Neural Inverse Rendering of an Indoor Scene From a Single Image
单幅图像的
室内场景
神经逆绘制
ForkNet: Multi-Branch Volumetric Semantic Completion From a Single Depth Image
ForkNet
:
单深度图像的
多分支
体积语义补全
Moving Indoor: Unsupervised Video Depth Learning in Challenging Environments
室内移动:
挑战环境下的
无监督
视频深度学习
GraphX-Convolution for Point Cloud Deformation in 2D-to-3D Conversion
基于
GraphX卷积
的
二维到三维转换中
点云变形
FrameNet: Learning Local Canonical Frames of 3D Surfaces From a Single RGB Image
FrameNet:
从单个RGB图像
中
学习
三维曲面
的
局部规范框架
Holistic++ Scene Understanding: Single-View 3D Holistic Scene Parsing and Human Pose Estimation With Human-Object Interaction and Physical Commonsense
Holistic++场景理解:单视图
三维整体
场景解析
和
基于人-物交互和物理常识的
人体姿态估计
MMAct: A Large-Scale Dataset for Cross Modal Human Action Understanding
MMAct:用于
跨模态
人类行为理解
的
大规模数据集
HACS: Human Action Clips and Segments Dataset for Recognition and Temporal Localization
HACS:用于
识别
和
时间定位
的
人类
动作片段
和
分割
数据集
3C-Net: Category Count and Center Loss for Weakly-Supervised Action Localization
3C-Net:基于
类别计数
和
中心损失
的
弱监督
动作定位
Grounded Human-Object Interaction Hotspots From Video
视频中
固定的
人-机交互热点
Hallucinating IDT Descriptors and I3D Optical Flow Features for Action Recognition With CNNs
利用
幻觉IDT描述子
和
I3D光流特征
实现
基于CNNs的
动作识别
Learning to Paint With Model-Based Deep Reinforcement Learning
基于模型的
深度强化学习
在
绘画
中的应用
Neural Re-Simulation for Generating Bounces in Single Images
基于
神经网络再模拟
的单幅图像
反弹生成
Deep Appearance Maps
深度外观图
GarNet: A Two-Stream Network for Fast and Accurate 3D Cloth Draping
GarNet:一种快速准确的
三维
布料覆盖
的
双流网络
Joint Embedding of 3D Scan and CAD Objects
三维扫描
与
CAD对象
的
联合嵌入
CompoNet: Learning to Generate the Unseen by Part Synthesis and Composition
CompoNet:通过
部分合成
和
组合
学习
生成看不见的部分
DDSL: Deep Differentiable Simplex Layer for Learning Geometric Signals
DDSL:基于
深度可微单纯形层
的
几何信号学习
EGNet: Edge Guidance Network for Salient Object Detection
EGNet:用于
显著目标检测
的
边缘引导网络
SID4VAM: A Benchmark Dataset With Synthetic Images for Visual Attention Modeling
SID4VAM:用于
视觉注意建模
的
合成图像
基准数据集
Two-Stream Action Recognition-Oriented Video Super-Resolution
面向
双流
动作识别
的
视频超分辨率
Where Is My Mirror?
我的镜子在哪里?
Disentangled Image Matting
分离
图像抠图
Guided Super-Resolution As Pixel-to-Pixel Transformation
通过
像素到像素转换
引导
超分辨率
Deep Learning for Light Field Saliency Detection
光场
显著性检测
的
深度学习
Optimizing the F-Measure for Threshold-Free Salient Object Detection
基于
F-测度优化
的
无阈值
显著目标检测
Image Inpainting With Learnable Bidirectional Attention Maps
基于
可学习
双向注意图
的
图像修复
Joint Demosaicking and Denoising by Fine-Tuning of Bursts of Raw Images
通过对
原始图像序列的微调
实现
联合去
马赛克
和
去噪
DeblurGAN-v2: Deblurring (Orders-of-Magnitude) Faster and Better
BeblurGAN-v2
:
去模糊
(数量级)更快更好
Reflective Decoding Network for Image Captioning
基于
反射解码网络
的
图像标注
Joint Optimization for Cooperative Image Captioning
协同
图像标注
的
联合优化
Watch, Listen and Tell: Multi-Modal Weakly Supervised Dense Event Captioning
看、听、说:
多模弱监督
密集事件标注
Joint Syntax Representation Learning and Visual Cue Translation for Video Captioning
基于
联合
句法表示学习
与
视觉线索翻译
的
视频标注
Entangled Transformer for Image Captioning
基于
纠缠变换
的
图像标注
Shapeglot: Learning Language for Shape Differentiation
Shapeglot:基于
语言学习
的
形态分化
nocaps: novel object captioning at scale
nocaps:
尺度上的
新对象标注
Fully Convolutional Geometric Features
完全卷积
几何特征
Learning Local RGB-to-CAD Correspondences for Object Pose Estimation
基于
局部RGB-CAD的对应关系学习
的
目标
姿态估计
Depth From Videos in the Wild: Unsupervised Monocular Depth Learning From Unknown Cameras
野外视频的深度:
未知摄像机的
无监督单目深度学习
OmniMVS: End-to-End Learning for Omnidirectional Stereo Matching
OmniMVS:
全方位
立体匹配
的
端到端学习
多视角的立体匹配
On the Over-Smoothing Problem of CNN Based Disparity Estimation
基于
CNN的
视差估计
的
过平滑问题
Disentangling Propagation and Generation for Video Prediction
视频预测
的
分离传播与生成
Guided Image-to-Image Translation With Bi-Directional Feature Transformation
基于
双向特征变换
的
图像-图像的转换
Towards Multi-Pose Guided Virtual Try-On Network
面向多姿态引导
的
虚拟Try-On网络
Photorealistic Style Transfer via Wavelet Transforms
基于
小波变换
的
真实感
风格转换
Personalized Fashion Design
个性化服装设计
Tag2Pix: Line Art Colorization Using Text Tag With SECat and Changing Loss
Tag2Pix:使用
带有SECat和Changing损失的
文本标记
进行
线条艺术着色
Free-Form Video Inpainting With 3D Gated Convolution and Temporal PatchGAN
基于
三维门控卷积
和
时域PatchGAN
的
自由形式
视频修补
TextDragon: An End-to-End Framework for Arbitrary Shaped Text Spotting
TextDragon:用于
任意形状
文本定位
的
端到端框架
Chinese Street View Text: Large-Scale Chinese Text Reading With Partially Supervised Learning
中文街景文本:基于
部分监督学习
的
大规模
中文文本阅读
Deep Floor Plan Recognition Using a Multi-Task Network With Room-Boundary-Guided Attention
房间边界引导注意
的
多任务网络
实现
深度楼层平面识别
GA-DAN: Geometry-Aware Domain Adaptation Network for Scene Text Detection and Recognition
GA-DAN:用于
场景文本
检测和识别
的
几何感知
域自适应网络
Large-Scale Tag-Based Font Retrieval With Generative Feature Learning
基于
生成特征学习
的
大规模标签
字体检索
Convolutional Character Networks
卷积
字符网络
Geometry Normalization Networks for Accurate Scene Text Detection
用于
精确
场景文本检测
的
几何规范化网络
Symmetry-Constrained Rectification Network for Scene Text Recognition
对称约束校正网络
在
场景文本识别
中的应用
YOLACT: Real-Time Instance Segmentation
YOLACT:
实时
实例分割
见图2,先分割出对象BB,再进行像素级实例分割
Expectation-Maximization Attention Networks for Semantic Segmentation
基于
期望最大化
注意力网络
的
语义分割
如图2,将EM算法的思想和迭代过程,嵌入到深度网络中,目的是替代自监督Attention过程(无需访问所有数据,较Non-Local更为灵活,且可以提升速度)
Multi-Class Part Parsing With Joint Boundary-Semantic Awareness
基于
联合边界语义感知
的
多类部分解析
Explaining Neural Networks Semantically and Quantitatively
神经网络
的
语义和定量地
解释
PANet: Few-Shot Image Semantic Segmentation With Prototype Alignment
PANet:基于
原型对齐
的
少镜头图像
语义分割
ShapeMask: Learning to Segment Novel Objects by Refining Shape Priors
ShapeMask:通过
精化形状先验
学习
分割新对象
Sequence Level Semantics Aggregation for Video Object Detection
基于
序列级
语义聚合
的
视频对象检测
Video Object Segmentation Using Space-Time Memory Networks
基于
时空存储网络
的
视频对象分割
Zero-Shot Video Object Segmentation via Attentive Graph Neural Networks
基于
注意力
图神经网络
的
零镜头
视频对象分割
MeteorNet: Deep Learning on Dynamic 3D Point Cloud Sequences
MeteorNet:
动态三维点云序列
的
深度学习
3D Instance Segmentation via Multi-Task Metric Learning
基于
多任务
度量学习
的
三维
实例分割
DeepGCNs: Can GCNs Go As Deep As CNNs?
DeepGCN:
GCN
能像
CNN
一样深吗
?
Deep Hough Voting for 3D Object Detection in Point Clouds
点云中
基于
深度Hough投票
的
三维目标检测
M3D-RPN: Monocular 3D Region Proposal Network for Object Detection
M3D-RPN:用于
目标检测
的
单目3D区域建议网络
SemanticKITTI: A Dataset for Semantic Scene Understanding of LiDAR Sequences
semanticKITTI:用于
激光雷达序列
语义场景理解
的
数据集
WoodScape: A Multi-Task, Multi-Camera Fisheye Dataset for Autonomous Driving
WoodScape:一个用于
自动驾驶
的
多任务、多摄像机
鱼眼数据集
Scalable Place Recognition Under Appearance Change for Autonomous Driving
面向自主驾驶
的
外观变化下的
可扩展
位置识别
Exploring the Limitations of Behavior Cloning for Autonomous Driving
探索在
自主驾驶
中
行为克隆
的
局限性
Habitat: A Platform for Embodied AI Research
Habitat:
体现
人工智能研究
的平台
Towards Interpretable Face Recognition
面向
可解释的
人脸识别
Co-Mining: Deep Face Recognition With Noisy Labels
联合挖掘:带
噪声标签
的
深度
人脸识别
Few-Shot Adaptive Gaze Estimation
少镜头自适应
注视估计
Live Face De-Identification in Video
视频中
的
实时
人脸反识别
Face Video Deblurring Using 3D Facial Priors
基于
三维人脸先验
的
视频
人脸去模糊
Semi-Supervised Monocular 3D Face Reconstruction With End-to-End Shape-Preserved Domain Transfer
基于
端到端形状保持
域转移
的
半监督单目
三维人脸重建
3D Face Modeling From Diverse Raw Scan Data
基于
多样的原始扫描数据
的
三维人脸建模
A Decoupled 3D Facial Shape Model by Adversarial Training
一种基于
对抗训练
的
去耦三维人脸形状模型
Photo-Realistic Facial Details Synthesis From Single Image
基于单幅图像的
真实感
人脸细节合成
S2GAN: Share Aging Factors Across Ages and Share Aging Trends Among Individuals
S2GAN:在
各个年龄段
共享老化因素
,在
个人间
共享老化趋势
PuppetGAN: Cross-Domain Image Manipulation by Demonstration
PuppetGAN:基于
演示
的
跨域图像操作
Few-Shot Adversarial Learning of Realistic Neural Talking Head Models
真实神经说话
头部模型
的
少镜头对抗学习
Pose-Aware Multi-Level Feature Network for Human Object Interaction Detection
基于
位姿感知的
多层次特征网络
的
人机交互检测
TRB: A Novel Triplet Representation for Understanding 2D Human Body
TRB:一种新的
三元表示
实现
二维人体的理解
Learning Trajectory Dependencies for Human Motion Prediction
用于
人体
运动预测
的
轨迹依赖
学习
Cross-Domain Adaptation for Animal Pose Estimation
基于
跨域自适应
的
动物
姿态估计
NOTE-RCNN: NOise Tolerant Ensemble RCNN for Semi-Supervised Object Detection
基于
噪声容限集成RCNN
的
半监督
目标检测
Unsupervised Out-of-Distribution Detection by Maximum Classifier Discrepancy
基于
Maximum Classifier差异
的
无监督
分布外检测
SBSGAN: Suppression of Inter-Domain Background Shift for Person Re-Identification
SBSGAN:基于
域间背景漂移抑制
的
人再识别
Enriched Feature Guided Refinement Network for Object Detection
基于
丰富特征引导
细化网络
的
目标检测
Deep Meta Metric Learning
深度
元测量学习
Discriminative Feature Transformation for Occluded Pedestrian Detection
基于
判别特征变换
的
遮挡行人检测
Contextual Attention for Hand Detection in the Wild
上下文注意
在
野外
手部检测
中的应用
Meta R-CNN: Towards General Solver for Instance-Level Low-Shot Learning
元R-CNN:面向
一般解算器
的
实例级
少镜头学习
Pyramid Graph Networks With Connection Attentions for Region-Based One-Shot Semantic Segmentation
基于
连接注意
的
金字塔图网络
实现
基于区域的单镜头
语义分割
Presence-Only Geographical Priors for Fine-Grained Image Classification
用于
细粒度
图像分类
的
仅存在
地理先验
POD: Practical Object Detection With Scale-Sensitive Network
基于
尺度敏感网络
的
实用
目标检测
Human Uncertainty Makes Classification More Robust
人类的不确定性
使得
分类
更加可靠
FCOS: Fully Convolutional One-Stage Object Detection
全卷积
单级
目标检测
Self-Critical Attention Learning for Person Re-Identification
自我批判性
注意力学习
用于
人再识别
Temporal Knowledge Propagation for Image-to-Video Person Re-Identification
基于
时间知识传播
的
图像-视频
人再识别
RepPoints: Point Set Representation for Object Detection
RepPoints:用于
目标检测
的
点集表示
SegEQA: Video Segmentation Based Visual Attention for Embodied Question Answering
SegEQA:一种
基于
视频分割
的
视觉注意力
在
具体问答
中的应用
No-Frills Human-Object Interaction Detection: Factorization, Layout Encodings, and Training Techniques
无装饰的
人机交互检测
:
因子分解
、
布局编码
和
训练技术
Cap2Det: Learning to Amplify Weak Caption Supervision for Object Detection
Cap2Det:学习
增强弱字幕监控
以实现
目标检测
No Fear of the Dark: Image Retrieval Under Varying Illumination Conditions
不怕黑暗:
不同光照条件下
的
图像检索
Hierarchical Shot Detector
分层
镜头检测器
Few-Shot Learning With Global Class Representations
基于
全局类表示
的
少镜头学习
Better to Follow, Follow to Be Better: Towards Precise Supervision of Feature Super-Resolution for Small Object Detection
更好跟随,跟随更好:
小目标检测
中
特征超分辨率
的
精确监控
Weakly Supervised Object Detection With Segmentation Collaboration
基于
分割协作
的
弱监督
目标检测
AutoFocus: Efficient Multi-Scale Inference
自动聚焦:有效的
多尺度
推理
Leveraging Long-Range Temporal Relationships Between Proposals for Video Object Detection
基于
方案之间的长范围时间关系
的
视频对象检测
Transferable Contrastive Network for Generalized Zero-Shot Learning
基于
可转移
对比网络
的
广义
零镜头学习
Fast Point R-CNN
快速点
R-CNN
Mesh R-CNN
网状
R-CNN
Deep Supervised Hashing With Anchor Graph
基于
锚图
的
深度监督
哈希算法
Detecting 11K Classes: Large Scale Object Detection Without Fine-Grained Bounding Boxes
11k类别检测:
无细粒度包围盒
的
大规模
目标检测
Re-ID Driven Localization Refinement for Person Search
再识别驱动
的
定位精化
实现
人搜索
Hierarchical Encoding of Sequential Data With Compact and Sub-Linear Storage Cost
基于
压缩
和
次线性存储代价
的
序列数据
分层编码
C-MIDN: Coupled Multiple Instance Detection Network With Segmentation Guidance for Weakly Supervised Object Detection
C-MIDN:带
分割指导
的
耦合多实例检测网络
实现
弱监督
目标检测
Learning Feature-to-Feature Translator by Alternating Back-Propagation for Generative Zero-Shot Learning
基于
交替反向传播
的
特征-特征转换学习
实现
零镜头学习
Deep Constrained Dominant Sets for Person Re-Identification
用于
人再识别
的
深度约束支配集
Invariant Information Clustering for Unsupervised Image Classification and Segmentation
基于
不变信息聚类
的
无监督
图像分类
与
分割
Subspace Structure-Aware Spectral Clustering for Robust Subspace Clustering
子空间结构感知
谱聚类
在
鲁棒
子空间聚类
中的应用
Order-Preserving Wasserstein Discriminant Analysis
保序
Wasserstein判别分析
LayoutVAE: Stochastic Scene Layout Generation From a Label Set
LayoutVAE:
从标签集
生成
随机场景布局
Robust Variational Bayesian Point Set Registration
鲁棒变分贝叶斯
点集配准
Is an Affine Constraint Needed for Affine Subspace Clustering?
仿射
子空间聚类
需要
仿射约束
吗?
Meta-Learning to Detect Rare Objects
检测稀有物体
的
元学习
New Convex Relaxations for MRF Inference With Unknown Graphs
新凸松弛
实现
未知图
MRF推理
Cluster Alignment With a Teacher for Unsupervised Domain Adaptation
基于教师的
聚类对齐
实现
无监督
域自适应
Analyzing the Variety Loss in the Context of Probabilistic Trajectory Prediction
概率轨迹预测
上下文
中的
变化损失分析
Deep Mesh Reconstruction From Single RGB Images via Topology Modification Networks
基于
拓扑修正网络
的
单一RGB图像
深度网格重建
UprightNet: Geometry-Aware Camera Orientation Estimation From Single Images
UprightNet:基于
单帧图像的
几何感知
摄像机方位估计
Escaping Plato's Cave: 3D Shape From Adversarial Rendering
逃离柏拉图的洞穴:基于
对抗性渲染
的
三维形态
Deep End-to-End Alignment and Refinement for Time-of-Flight RGB-D Module
基于
深度端到端对齐与细化
的
Time-of-Flight RGB-D模块
GEOBIT: A Geodesic-Based Binary Descriptor Invariant to Non-Rigid Deformations for RGB-D Images
GEOBIT:一种
对RGB-D图像
非刚性变形
保持不变
的
基于
测地线
的
二值描述子
CDTB: A Color and Depth Visual Object Tracking Dataset and Benchmark
彩色和深度
视觉目标跟踪
数据集与基准
Learning Joint 2D-3D Representations for Depth Completion
基于
二维-三维联合
表示学习
的
深度补全
Make a Face: Towards Arbitrary High Fidelity Face Manipulation
做一张脸:朝向
任意高保真的
脸操作
M2FPA: A Multi-Yaw Multi-Pitch High-Quality Dataset and Benchmark for Facial Pose Analysis
M2FPA:一个用于
面部姿势分析
的
多偏航多俯仰高质量
数据集
和
基准
Fair Loss: Margin-Aware Reinforcement Learning for Deep Face Recognition
公平损失:面向
深度人脸识别
的
边缘感知
强化学习
Face De-Occlusion Using 3D Morphable Model and Generative Adversarial Network
基于
三维变形模型
和
GAN
的
人脸去遮挡
Detecting Photoshopped Faces by Scripting Photoshop
用
photoshop脚本
检测photoshop人脸
Ego-Pose Estimation and Forecasting As Real-Time PD Control
作为
实时PD控制
中的
自位姿
估计与预测
End-to-End Learning for Graph Decomposition
图分解
的
端到端学习
Laplace Landmark Localization
拉普拉斯
地标定位
Through-Wall Human Mesh Recovery Using Radio Signals
利用
无线电信号
进行
穿墙
人体网格恢复
Discriminatively Learned Convex Models for Set Based Face Recognition
凸模型判别学习
实现
基于集的
人脸识别
Camera Distance-Aware Top-Down Approach for 3D Multi-Person Pose Estimation From a Single RGB Image
单一RGB图像中
摄像机距离感知
自顶向下方法
实现
三维多人姿态估计
Context-Aware Emotion Recognition Networks
基于
上下文感知网络
的
情感识别
Aggregation via Separation: Boosting Facial Landmark Detector With Semi-Supervised Style Translation
基于分离的聚合:基于
半监督
风格平移
的
人脸标志检测
增强
Deep Head Pose Estimation Using Synthetic Images and Partial Adversarial Domain Adaption for Continuous Label Spaces
基于
合成图像
和
连续标签空间
部分对抗
域自适应
的
深部
头部姿态估计
Flare in Interference-Based Hyperspectral Cameras
基于干涉的高光谱相机
中的
耀斑
Computational Hyperspectral Imaging Based on Dimension-Discriminative Low-Rank Tensor Recovery
基于
维数-判别
低秩张量恢复
的
计算
高光谱成像
Deep Optics for Monocular Depth Estimation and 3D Object Detection
基于
深度光学
的
单目深度估计
和
三维目标检测
Physics-Based Rendering for Improving Robustness to Rain
基于
物理的绘制
提高了
对雨水的鲁棒性
ARGAN: Attentive Recurrent Generative Adversarial Network for Shadow Detection and Removal
ARGAN:用于
阴影检测和消除
的
注意力循环生成对抗网络
Deep Tensor ADMM-Net for Snapshot Compressive Imaging
用于
快照
压缩成像
的
深度张量ADMM网
Convex Relaxations for Consensus and Non-Minimal Problems in 3D Vision
利用
凸松弛
解决
三维视觉中
一致性
和
非极小问题
Pareto Meets Huber: Efficiently Avoiding Poor Minima in Robust Estimation
Pareto Meets Huber:
稳健估计
中
有效避免弱极小
K-Best Transformation Synchronization
K-最佳
变换同步
Parametric Majorization for Data-Driven Energy Minimization Methods
数据驱动
能量最小化方法
的
参数优化
A Bayesian Optimization Framework for Neural Network Compression
基于
贝叶斯优化框架
的
神经网络压缩
HiPPI: Higher-Order Projected Power Iterations for Scalable Multi-Matching
HiPPI:基于
高阶投影功率迭代
的
可伸缩
多匹配
Language-Conditioned Graph Networks for Relational Reasoning
基于
语言-条件图网络
的
关系推理
Tell, Draw, and Repeat: Generating and Modifying Images Based on Continual Linguistic Instruction
讲、画、重复:基于
连续语言指导
的
图像生成
与
修改
Relation-Aware Graph Attention Network for Visual Question Answering
基于
关系感知
图注意网络
的
视觉问答
Unpaired Image Captioning via Scene Graph Alignments
基于
场景图对齐
的
未配对
图像标注
Modeling Inter and Intra-Class Relations in the Triplet Loss for Zero-Shot Learning
三元损失
中
类间和类内关系建模
实现
零镜头学习
Occlusion-Shared and Feature-Separated Network for Occlusion Relationship Reasoning
基于
遮挡共享
和
特征分离
网络
的
遮挡关系推理
Compositional Video Prediction
合成视频预测
Mixture-Kernel Graph Attention Network for Situation Recognition
基于
混合核
图注意网络
的
态势识别
Learning Similarity Conditions Without Explicit Supervision
没有明确的监督下
学习相似条件
Joint Prediction for Kinematic Trajectories in Vehicle-Pedestrian-Mixed Scenes
车-人-混合场景中
运动轨迹
的
联合预测
Learning to Caption Images Through a Lifetime by Asking Questions
通过
提问
来学会在一生中给
图片加标注
VrR-VG: Refocusing Visually-Relevant Relationships
VrR-VG:重新聚焦
视觉-相关关系
TAPA-MVS: Textureless-Aware PAtchMatch Multi-View Stereo
TAPA-MVS:
无纹理感知
PatchMatch多视图立体
多视图立体匹配
U4D: Unsupervised 4D Dynamic Scene Understanding
U4D:
无监督
4D动态场景理解
Hierarchical Point-Edge Interaction Network for Point Cloud Semantic Segmentation
基于
层次点-边交互网络
的
点云语义分割
Multi-Angle Point Cloud-VAE: Unsupervised Feature Learning for 3D Point Clouds From Multiple Angles by Joint Self-Reconstruction and Half-to-Half Prediction
多角度点云VAE:基于
联合自重构
和
半对半预测
的
多角度
三维点云
无监督
特征学习
P-MVSNet: Learning Patch-Wise Matching Confidence Aggregation for Multi-View Stereo
P-MVSNet:学习
多视点立体视觉
的逐
块匹配置信聚集
多视图立体匹配
SME-Net: Sparse Motion Estimation for Parametric Video Prediction Through Reinforcement Learning
基于
强化学习
的
稀疏运动估计
实现
参数化视频预测
ClothFlow: A Flow-Based Model for Clothed Person Generation
ClothFlow:一种基于
流
的
人穿衣
生成模型
LADN: Local Adversarial Disentangling Network for Facial Makeup and De-Makeup
LADN:用于
面部化妆和卸妆
的
局部对抗分离网络
Point-to-Point Video Generation
点对点
视频生成
Semantics-Enhanced Adversarial Nets for Text-to-Image Synthesis
基于
语义增强
对抗网
的
文本-图像合成
VTNFP: An Image-Based Virtual Try-On Network With Body and Clothing Feature Preservation
VTNFP:一种
身体和衣服特征保持
的
基于图像的
虚拟试穿网络
Boundless: Generative Adversarial Networks for Image Extension
Boundless:基于
GAN
的
图像扩展
Image Synthesis From Reconfigurable Layout and Style
基于
可重构布局和风格
的
图像合成
Attribute Manipulation Generative Adversarial Networks for Fashion Images
基于
属性操作GAN
的
时尚图像
Few-Shot Unsupervised Image-to-Image Translation
少镜头无监督
图像-图像的转换
Very Long Natural Scenery Image Prediction by Outpainting
利用
Outpainting
实现
超长自然景物
图像预测
Scaling Recurrent Models via Orthogonal Approximations in Tensor Trains
张量训练中
利用
正交逼近
实现
递推模型分级
A Deep Cybersickness Predictor Based on Brain Signal Analysis for Virtual Reality Contents
虚拟现实内容
中基于
脑信号分析
的
深度晕机预测
Learning With Unsure Data for Medical Image Diagnosis
医学影像诊断
中的
不确定性数据学习
Recursive Cascaded Networks for Unsupervised Medical Image Registration
基于
递归级联网络
的
无监督
医学图像配准
DUAL-GLOW: Conditional Flow-Based Generative Model for Modality Transfer
DUAL-GLOW:
基于
条件流
的
生成模型
实现
模态转换
Dilated Convolutional Neural Networks for Sequential Manifold-Valued Data
扩张卷积神经网络
用于
序列流形-值数据
Align, Attend and Locate: Chest X-Ray Diagnosis via Contrast Induced Attention Network With Limited Supervision
对齐、出席和定位:
有限监督下
通过
造影诱导注意网络
进行
胸部x线诊断
Joint Acne Image Grading and Counting via Label Distribution Learning
基于
标签分布学习
的
痤疮图像
联合
分级
与
计数
An Alarm System for Segmentation Algorithm Based on Shape Model
基于
形状模型
的
分割算法
报警系统
HistoSegNet: Semantic Segmentation of Histological Tissue Type in Whole Slide Images
HistoSegNet:全
幻灯片图像
组织类型
的
语义分割
Prior-Aware Neural Network for Partially-Supervised Multi-Organ Segmentation
基于
先验感知神经网络
的
部分监督
多器官分割
CAMEL: A Weakly Supervised Learning Framework for Histopathology Image Segmentation
CAMEL:
组织病理学
图像分割
的
弱监督学习框架
Conditional Recurrent Flow: Conditional Generation of Longitudinal Samples With Applications to Neuroimaging
条件返流:
纵向样本的条件生成
及其在
神经影像学
中的应用
Multi-Stage Pathological Image Classification Using Semantic Segmentation
基于
语义分割
的
多阶段
病理图像分类
Semantic-Transferable Weakly-Supervised Endoscopic Lesions Segmentation
语义可转移
的
弱监督
内镜病变分割
Unsupervised Microvascular Image Segmentation Using an Active Contours Mimicking Neural Network
基于
活动轮廓模拟神经网络
的无
监督
微血管图像分割
GLAMpoints: Greedily Learned Accurate Match Points
GLAMpoints:
贪婪地学习
精确的匹配点
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/花生_TL007/article/detail/90880
推荐阅读
article
Revisiting
Spatial
-
Temporal
Similarity
: A
Deep
Lea...
Revisiting
Spatial
-
Temporal
Similarity
: A
Deep
Learning
Fram...
赞
踩
article
VGGNet
阅读理解 -
Very
Deep
Convolutional Networks for...
论文理解 -
VGGNet
-
Very
Deep
Convolutional Networks for Large-S...
赞
踩
article
论文阅读笔记--
Monocular
Human
Pose
Estimation
: A
Survey
...
趁着寒假有时间,把之前的论文补完,另外做了一点点笔记,也算是对论文的翻译,尝试探索一条适合自己的论文阅读方法。这篇笔记基...
赞
踩
article
机器
学习
(
Machine
Learning
)&深度
学习
(
Deep
Learning
)资料...
转载自
机器
学习
(
Machine
Learning
)&深度
学习
(
Deep
Learning
)资料希望转载的朋友,你可以不用...
赞
踩
article
材料
论文阅读/中文记录:
Scaling
deep
learning
for
materials
di...
【新兴技术的发展与深度学习运用到更多领域】新型功能
材料
实现了从清洁能源到信息处理等技术应用的根本性突破。从微芯片到电池和...
赞
踩
article
elementUi
重置Select
选择器
样式、
option
、
deep
、vue3、
plus
_eleme...
elementUi
重置Select
选择器
样式、
option
、
deep
、vue3、
plus
_
elementui
选择器
ele...
赞
踩
article
Deep
Learning
Techniques
for
Automatic
MRICardiac ...
Deep
Learning
Techniques
for
Automatic
MRI Cardiac
Multi
-Str...
赞
踩
article
论文阅读——
DoubleU
-
Net
: A
Deep
Convolutional Neural
Net
...
DoubleU
-
Net
: A
Deep
Convolutional Neural
Net
work for Medical...
赞
踩
article
论文阅读——
ECA
-
Net
:
Efficient
Channel
Attention
for Dee...
ECA
-
Net
:
Efficient
Channel
Attention
for
Deep
Convolutional ...
赞
踩
article
Deep
Learning
for
Medical Image Segmentation: Tric...
这篇博客将说明《
Deep
Learning
for
Medical Image Segmentation: Tricks...
赞
踩
article
无
监督
学习
:
Deep
Generative
Mode
(深度
生成
模型)...
一 前言1.1 Creation据说在费曼死后,人们在他生前的黑板上拍到如图画片,在左上角有道
:
What i canno...
赞
踩
相关标签
深度学习
lstm
神经网络
VGG
VGGNET
论文阅读
人工智能
elementui
vue.js
前端
计算机视觉
学习
机器学习
网络
卷积
算法
python