当前位置:   article > 正文

【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(11 月 28 日论文合集)_steal my artworks for fine-tuning? a watermarking

steal my artworks for fine-tuning? a watermarking framework for detecting ar

一、检测相关(9篇)

1.1 Automated Detection and Counting of Windows using UAV Imagery based Remote Sensing

基于无人机遥感图像的窗口自动检测与计数

https://arxiv.org/abs/2311.14635
  • 1

尽管建筑和测量部门的技术进步,但对在建或现有建筑物中的窗户等显著特征的检查主要是一个手动过程。此外,建筑物中存在的窗户数量与其在地震下遭受的变形程度直接相关。在本研究中,提出了一种通过部署无人机(UAV)遥感系统来精确检测和计数建筑物窗户数量的方法。所提出的两阶段方法通过开发利用来自无人机机载摄像头和其他传感器的数据的计算机视觉管道来自动识别和计数窗口。定量和定性的结果表明,我们提出的方法在准确地检测和计数的窗口相比,现有的方法的有效性。

1.2 One Strike, You’re Out: Detecting Markush Structures in Low Signal-to-Noise Ratio Images

一击出局:在低信噪比图像中检测马库什结构

https://arxiv.org/abs/2311.14633
  • 1

现代研究越来越依赖于自动化方法来帮助研究人员。一个例子是光学化学结构识别(OCSR),它可以帮助化学家从大量文档中检索有关化学品的信息。马库什结构是不能被OCSR正确解析并导致错误的化学结构。本研究的重点是提出和测试一种新的方法来分类马库什结构。在该方法中,对固定特征提取和端到端学习(CNN)进行了比较。端到端方法的表现明显优于固定特征方法,与固定特征方法的0.701(0.052 SD)相比,达到了0.928(0.035 SD)的宏F1。由于实验的性质,这些数字是下限,可以进一步改进。这些结果表明,马库什结构可以有效地和准确地使用所提出的方法进行过滤。在OCSR流水线中实现时,该方法可以提高其性能,并可供其他研究人员使用。

1.3 Multi-Class Anomaly Detection based on Regularized Discriminative Coupled hypersphere-based Feature Adaptation

基于正则化判别耦合超球特征自适应的多类异常检测

https://arxiv.org/abs/2311.14506
  • 1

在异常检测中,跨不同产品类别识别异常是一项复杂的任务。本文介绍了一种新的模型,包括类判别性质获得的一个修改的正则判别变分自动编码器(RD-VAE)的特征提取过程中的耦合超球为基础的特征自适应(CFA)。通过这样做,提出的正则化判别耦合超球为基础的特征自适应(RD-CFA),形成了多类异常检测的解决方案。通过使用RD-VAE的鉴别能力来捕获复杂的类分布,结合CFA的鲁棒异常检测能力,所提出的方法在识别各种类的异常方面表现出色。使用MVTec AD和BeanTech AD数据集对多类异常检测和定位进行了广泛的评估,展示了RD-CFA与八种领先的当代方法相比的有效性。

1.4 A New Benchmark and Model for Challenging Image Manipulation Detection

一种新的挑战图像篡改检测的基准和模型

https://arxiv.org/abs/2311.14218
  • 1

检测多媒体数据中的操纵行为的能力在数字取证中至关重要。现有的图像篡改检测(IMD)方法主要是基于检测由图像编辑或双重压缩伪影引起的异常特征。所有现有的IMD技术在从大图像中检测小的篡改区域时都会遇到挑战。此外,基于压缩的IMD方法在相同质量因子的双重压缩的情况下面临困难。为了在这些具有挑战性的条件下研究最先进的(SoTA)IMD方法,我们引入了一个新的嵌入式图像操作检测(CIMD)基准数据集,该数据集由两个子集组成,分别用于评估基于编辑和基于压缩的IMD方法。数据集图像是手动拍摄的,并被篡改了高质量的注释。此外,我们提出了一种新的基于HRNet的双分支网络模型,可以在这些具有挑战性的条件下更好地检测图像编辑和压缩伪影。在CIMD基准测试上的大量实验表明,我们的模型在CIMD上的性能明显优于SoTA IMD方法。

1.5 Video Anomaly Detection using GAN

基于GaN的视频异常检测

https://arxiv.org/abs/2311.14095
  • 1

随着人们对公共安全的日益关注,监控场景中异常事件的自动检测和识别变得至关重要。由于它的复杂性和实用性,它是一个当前的开放性研究课题。自动识别异常事件,这是一项艰巨的任务,因为每个人对异常的看法是不同的。一种情况下的典型事件在另一种情况下可能被视为异常。由于拥挤和高遮挡,在具有大量人群的监控录像中,自动异常识别变得特别具有挑战性。通过使用机器学习技术,本论文的研究旨在为这种用例提供解决方案,以便不需要人力资源来监视系统记录中的任何异常活动。我们开发了一种新的基于生成对抗网络(GAN)的异常检测模型。该模型经过训练,以便它一起学习构建高维图片空间并从视频的上下文确定潜在空间。该生成器使用了一个残差自动编码器架构,该架构由一个基于多级信道注意力的解码器和一个可以实现空间和时间数据的双流深度卷积编码器组成。我们还提供了一种改进GAN模型的技术,该技术可以减少训练时间,同时还可以通过利用数据集之间的迁移学习来推广模型。使用各种评估措施,我们将我们的模型与四个基准数据集上的当前最先进的技术进行比较。实证研究结果表明,与现有技术相比,我们的网络在所有数据集上都表现良好。

1.6 RankFeat&RankWeight: Rank-1 Feature/Weight Removal for Out-of-distribution Detection

https://arxiv.org/abs/2311.13959
  • 1

The task of out-of-distribution (OOD) detection is crucial for deploying machine learning models in real-world settings. In this paper, we observe that the singular value distributions of the in-distribution (ID) and OOD features are quite different: the OOD feature matrix tends to have a larger dominant singular value than the ID feature, and the class predictions of OOD samples are largely determined by it. This observation motivates us to propose \texttt{RankFeat}, a simple yet effective \emph{post hoc} approach for OOD detection by removing the rank-1 matrix composed of the largest singular value and the associated singular vectors from the high-level feature. \texttt{RankFeat} achieves \emph{state-of-the-art} performance and reduces the average false positive rate (FPR95) by 17.90% compared with the previous best method. The success of \texttt{RankFeat} motivates us to investigate whether a similar phenomenon would exist in the parameter matrices of neural networks. We thus propose \texttt{RankWeight} which removes the rank-1 weight from the parameter matrices of a single deep layer. Our \texttt{RankWeight}is also \emph{post hoc} and only requires computing the rank-1 matrix once. As a standalone approach, \texttt{RankWeight} has very competitive performance against other methods across various backbones. Moreover, \texttt{RankWeight} enjoys flexible compatibility with a wide range of OOD detection methods. The combination of \texttt{RankWeight} and \texttt{RankFeat} refreshes the new \emph{state-of-the-art} performance, achieving the FPR95 as low as 16.13% on the ImageNet-1k benchmark. Extensive ablation studies and comprehensive theoretical analyses are presented to support the empirical results.

1.7 Periodically Exchange Teacher-Student for Source-Free Object Detection

周期性地交换教师和学生以实现无源对象检测

https://arxiv.org/abs/2311.13930
  • 1

无源对象检测(SFOD)的目的是在没有源域数据的情况下,使源检测器适应未标记的目标域数据。大多数SFOD方法遵循相同的自我训练范式,使用均值-教师(MT)框架,其中学生模型仅由一个教师模型指导。然而,这种范式很容易陷入训练不稳定性问题,即当教师模型由于域转移而无法控制地崩溃时,学生模型也会遭受严重的性能下降。为了解决这个问题,我们提出了定期交换教师-学生(PETS)的方法,一个简单而新颖的方法,引入了一个多教师的框架,包括一个静态的教师,一个动态的教师和一个学生模型。在训练阶段,我们定期在静态教师和学生模型之间交换权重。然后,我们使用已经由静态教师交换的学生模型的移动平均值来更新动态教师。通过这种方式,动态教师可以整合过去的知识,有效地减少错误积累,并在基于MT的框架内实现更稳定的培训过程。此外,我们开发了一个共识机制来合并两个教师模型的预测,为学生模型提供更高质量的伪标签。在多个SFOD基准测试上的大量实验表明,与其他相关方法相比,该方法具有最先进的性能,证明了该方法在SFOD任务上的有效性和优越性。

1.8 Steal My Artworks for Fine-tuning? A Watermarking Framework for Detecting Art Theft Mimicry in Text-to-Image Models

为了微调而偷我的艺术品?一种用于检测文本到图像模型中艺术品盗窃模仿的水印框架

https://arxiv.org/abs/2311.13619
  • 1

文本到图像模型的进步带来了惊人的艺术表现。然而,一些工作室和网站非法微调这些模型使用艺术家的艺术作品模仿他们的风格以获取利润,这侵犯了艺术家的版权,并削弱了他们制作原创作品的动力。目前,对这一问题的研究明显不足。在本文中,我们提出了一种新的水印框架,检测模仿文本到图像模型,通过微调。该框架将微妙的水印嵌入到数字艺术作品中,以保护其版权,同时仍然保留艺术家的视觉表达。如果有人将带水印的艺术品作为训练数据来模仿艺术家的风格,这些水印可以作为可检测的指标。通过分析这些水印在一系列生成图像中的分布,使用被盗受害者数据进行微调模仿的行为将被曝光。在各种微调方案和水印攻击方法,我们的研究证实,分析人工生成的图像中的水印分布可靠地检测未经授权的模仿。

1.9 Detection and Identification Accuracy of PCA-Accelerated Real-Time Processing of Hyperspectral Imagery

主成分分析加速的高光谱图像实时处理的检测和识别精度

https://arxiv.org/abs/2311.13779
  • 1

实时或近实时的高光谱检测和识别在许多领域都是非常有用和需要的。这些数据集可能非常大,并且算法可能需要大量计算,从而减慢了过程。一种常见的加速方法是使用主成分分析(PCA)进行降维。在由主成分的子集提供的降维空间中,处理数据所需的计算更少,从而导致更快的运行时间。在本文中,我们提出了一种方法,以进一步减少使用PCA所需的时间,通过调查有多少主成分可以省略,对检测率的影响最小。使用ACE进行检测,然后使用概率和谱拟合进行识别,我们发现,在检测率出现明显变化之前,主成分的数量可以大幅减少。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/362259
推荐阅读
相关标签
  

闽ICP备14008679号