赞
踩
论文推荐
“SFFAI115期来自北京邮电大学的严渊蒙推荐的文章主要关注于自然语言处理的对话系统领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。”
关注文章公众号
回复"SFFAI115"获取本主题精选论文
01
推荐理由:本文提出了用于一般性OOD样本检测的基线方法:即基于最大Softmax概率(MSP)的OOD检测方法,并且在图像分类、文本分类、情感分类、词性标注、语音识别等诸多任务上进行了实验。我们将其选作我们的基线之一。
02
推荐理由:本文提出了文档级的OOD检测方法(作者将其称为开放世界分类,Open-world Classification),叫作DOC。方法上,作者采用基于CNN的编码器,然后将分类任务转换为对每个类别的一个二分类任务(每个类别都使用一个sigmoid的激活函数)。在预测时,当所有类别的得分低于某阈值时,则认为其为OOD样本。我们将其选作我们的基线之一。
03
推荐理由:本文通过在训练阶段(仅包含域内样本)优化特征表示空间,以在OOD意图分类时获得更好的OOD检测性能。具体来说,本文使用Large-margin Cosine Loss (LMCL),在训练时最小化样本间的类内距离同时最大化类间距离,这样训练出来的表示空间能够最大程度分开域内样本和域外随机分布的样本之间的界限。在预测时本文使用LOF算法进行OOD检测。我们将其选作我们的基线之一。
04
推荐理由:本文同样基于生成式方法,它们通过为每个类别训练语言模型(最大化该句子的似然分数),然后使用训练好的语言模型评价预测样本的似然分数,并且基于预设的阈值进行OOD样本检测。为了消除无关的背景信息的影响,本文进一步引入似然比的概念,通过训练一个公共的语言模型(可以认为编码了公共的、类别无关的背景知识)作为分值的归一化,以消除类别公共(背景)信息的影响。
05
推荐理由:本文提出了一个基于高斯判别分析的框架,用于检测分布外的、对抗攻击生成的样本。本文主要使用高斯判别分析代替Softmax分类器,以解决模型过度自信的问题。我们的方法也是主要受到这篇文章的启发。与其不同的是,我们关注于对话系统中的意图分类任务上,同时比较了欧氏距离和马氏距离之间的性能差异。
06
推荐理由:本文提出了一种用对比学习进行OOD检测的新方法。该方法避免了显式地在输入空间中建模域内和域外样本的概率密度,易于融入现有框架,并且不需要额外的OOD样本参与训练。此外,作者还提出了一种用于评估OOD数据集的指标。
会议内容
会议简介
在任务型对话系统中,域外(Out-of-domain, OOD)意图检测是相当重要的一个模块。它能够防止模型将这类意图错误分类为某个域内意图,从而发生预期外的系统行为。例如对于一个智能音乐软件里的对话系统,用户给出例如“购买某本图书”的对话请求即为域外意图。本期我们邀请到来自北京邮电大学的严渊蒙,分享他如何在无监督设置下基于马氏距离的生成式分类器来检测OOD样本。
讲者介绍
严渊蒙,北京邮电大学模式识别实验室硕士生,自然语言处理方向,导师为徐蔚然老师。其主要研究方向为对话系统中的口语理解,特别是少样本情况下的迁移学习、自监督学习等技术,目前已在ACL、EMNLP等会议上发表多篇论文。
会议题目
一种基于马氏距离的生成式OOD检测方法
会议摘要
本文中我们主要探索无监督设置下的OOD意图检测方法,即训练过程中只有有监督的域内语料是可获取的,而无法获取到域外的标注语料。我们提出了一个简单但强大的基于马氏距离的生成式分类器来检测OOD样本。具体来说,我们使用高斯判别分析(Gaussian Discriminant Analysis, GDA)对编码器导出的域内样本的特征进行建模以避免基于softmax的分类器过度自信的问题;同时我们比较了在特征空间中使用欧氏距离和马氏距离进行OOD意图判别的性能,显示了使用马氏距离进行OOD意图判别的优势。我们在四个基准数据集上进行实验,结果证明我们的方法显著优于若干基线。
论文标题:A Deep Generative Distance-Based Classifier for Out-of-Domain Detection with Mahalanobis Space
论文下载:关注本公众号,对话框回复“SFFAI115”,获取下载
会议亮点
1、我们提出了一种基于距离函数的生成式OOD检测方法,用于无监督的OOD意图检测任务;
2、我们在传统欧氏距离的基础上,引入马氏距离,并且比较了欧氏距离和马氏距离的性能优劣,结果显示马氏距离相比欧氏距离能够更好地处理特征之间的相关性,从而在OOD意图检测任务上获得更好的效果;
3、在四个公开数据集上的实验证明了我们的方法显著优于此前的基线。
直播时间
2021年7月25日(周日)20:00—21:00 线上直播
关注本公众号,对话框回复“SFFAI115”,获取入群二维码
注:直播地址会分享在交流群内
SFFAI招募!
现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献,欢迎大家关注SFFAI论坛:https://bbs.sffai.com。
论文推荐
请点击文章底部“阅读原文”查看
分享、点赞、在看,给个三连击呗!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。