赞
踩
NSFW(not suitable for work)图片,顾名思义,就是一些不太适合在工作中浏览的图片,本文介绍的工作是通过深度卷积神经网络来对此类图片进行自动化的审核,由于NSFW图片的定义范围比较广泛,本文主要针对色情图片的审核,不包括文字,写实暴力,政治相关不当内容的审核。
随着计算机视觉、改进的训练数据和深度学习算法的发展,计算机现在能够以更高的精度来自动分类 NSFW 图像内容,近年来,卷积神经网络已经在图像分类问题中取得了巨大成功。自2012年以来,新的卷积神经网络架构一直在不断改进标准 ImageNet 分类挑战的精度。一些主要突破包括了 AlexNet(2012)、GoogLeNet、VGG(2013)和残差网络(Residual Networks)(2015)等等, 这些架构都在当年的ImageNet分类挑战上取得了独领风骚的成绩。
通过训练深度神经网络模型,用于NSFW图片的智能审核,可以降低人工审核的成本,我把他认为是知识技能的迁移,神经网络有及其强大的拟合能力,让其拟合审核人员对于图片的审核判定基准,就类似于将人的技能迁移到了网络模型中,解放了人工,当然,后续任然需要迁移新的知识给模型,让模型进行更新和迭代。
自动识别一张图片是不是NSFW图片是研究者们几十年来一直在试图解决的重要问题。由于当下图像与用户生成的内容主宰了互联网,过滤 NSFW 图像成为网页应用和移动应用的一个重要组成部分。下面主要是阐述yahoo和美团点评在这一块的工作。
yahoo 在2016年的时候,开源了首个色情图像检测深度学习解决方案,博客地址
在训练过程中,图像被重新调整到256x256像素,水平翻转进行数据增强,并被随机裁剪为224x224像素,然后送入网络。在训练网络时,我们使用了ResNet 论文中scale augmentation 来避免过度拟合。并评估各种架构来找到运行时间和精度之间的权衡。
MS_CTC[4]—这种架构是由微软约束时间成本的那篇论文[4]提出。在速度和精度方面都优于AlexNet
Squeezenet[3]—构提出了 fire module,有一些层用于挤压然后扩大输入数据团。这有助于节省参数数量,使 Imagenet的精度与 AlexNet 的一样好,尽管内存需求仅为6MB。
VGG[2]—有13层卷积层和 3层 FC 层。
GoogLeNet[5]—GoogLeNet 提出了 inception module 并拥有 20 个 convolutional layer statges。它还在中间层中使用 hanging loss functions来解决深度网络中的梯度衰减问题。
ResNet-50[1]— 使用shortcut connections 解决梯度衰减问题。我们使用了作者所发布的 50 层的残差网络。
ResNet-50-thin—该模型是使用我们的
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。