赞
踩
作者:禅与计算机程序设计艺术
随着机器学习和深度学习在图像、文本、音频等领域的广泛应用,越来越多的人开始关注数据质量问题,如何发现并移除异常数据的处理方法成为一个重要课题。传统的数据质量检测方法如PCA分析法或独立同分布(IDD)检验方法已有一定研究,但仍存在着一些缺陷。例如,无法捕获多维特征之间的复杂相互关系;只能检测出明显的异常点,对噪声很敏感且易受干扰;无法有效区分正常样本与异常样本,无法识别不同分布的异常样本。为了解决这些问题,近年来出现了许多基于深度学习的无监督学习模型,如Variational Autoencoder (VAE)、Adversarial Autoencoder (AAE)、Generative Adversarial Network (GAN)。通过生成合成数据的方式,GAN可以产生高可靠的训练样本,并进一步提升数据质量检测的效果。其中,GANomaly是一个基于GAN的方法,其特点是能够通过潜在空间中不规则分布的散布来进行异常点的判别和分类。在本篇文章中,我将从GANomaly模型的基本概念和原理出发,讲述其工作原理和实现过程。
在深度学习的语境下,生成模型就是利用机器学习的手段,对原始数据生成符合某种概率分布的假数据。这里所说的“生成”,不仅指直接随机生成新的数据,还可能指根据输入数据生成新的样本。通俗地讲,生成模型就是要能够“自己造航母”。生成模型的目标是通过学习数据中的结构特性,从而能够生成具有类似真实数据的假数据。在实际应用中,通常
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。