赞
踩
发表时间:2022年
发表会议/期刊:Conference on Empirical Methods in Natural Language Processing(EMNLP)
会议/期刊级别:CCF-B
随着社交媒体的普及,网络上出现了大量的攻击性言论,这些言论不仅影响了网络环境的文明程度,也对使用预训练语言模型的应用带来了潜在的风险。因此,检测和过滤攻击性言论是一项重要的任务,也是自然语言处理领域的一个研究热点。然而,目前针对中文攻击性言论检测的研究还很少,主要原因是缺乏可靠的数据集。
为了推动中文攻击性言论检测的研究,本文提出了一个基准测试——COLD,包括一个中文攻击性言论数据集——COLDATASET和一个基于该数据集训练的检测器——COLDETECTOR,并针对以下几个问题:
为了提高收集效率,本文训练一个分类器从候选数据中发现目标数据,并为训练集和测试集采用不同的标记策略,同时邀请了一些专业的标注人员,对这些数据进行了人工标注,按照是否含有攻击性言论和攻击性言论的类别进行了分类。
(1)每个模型都具有不同程度的攻击性
(2)由不同的提示引发的攻击性(目标关键词、消极态度、偏差)
文章总结如下:
文章可以有待改进的地方如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。