赞
踩
Named Entity Recognition without Labelled Data:A Weak Supervision Approach
无标记数据的命名实体识别: 一种弱监督方法
挪威奥斯陆大学 — 挪威
问题:在目标域没有手工标记的数据时,NER怎么进行问题?
解决:提出弱监督方案;依赖于广泛的标签函数来自动注释目标域的文本,然后使用Markov模型把这些标签整合在一起,把整合后的标注送入到最终的NER模型进行识别。
效果:经过两个英文数据集做实验在实体层次上有7个百分点的提升;
背景:NER很重要,可在实际的环境中,研究的目标域因为没有标注数,不可作迁移学习。
解决方法:提出ws在没有标签数据的情况下去bootstrap(提升)NER模型;这个方法主要是依赖标注函数去标注,然后通过考虑标注的准确性与混淆性使用HMM模型统一这些带有noise的标签,最后再采用最终的模型去进行训练。
特点:标注函数允许我们向序列标注模型注入专业的知识;
贡献:
1. NER的广泛的标签函数集合,包括在不同文本领域上训练的神经模型、地名 词典、启发式函数和文档级约束。
2. 一种新的弱监督模型,适合于序列标签任务,并能够包括概率标签预测。
3. 标签函数和聚合模型开源;
无监督域适应试图调整来自源域的知识来预测通常具有本质上不同特征的目标域中的新实例。
方法:
使用pivots调整特征空间(SCL);
代维转换特征空间;
划分成一般与域特征;
多任务;
基于域自适应的微调;
1. Bayesian Classifier Combination approach;
2. learn a generative model;
3. Conditional Random Fields (CRFs);
4. Hidden Markov Model;
5. Fully Bayesian approach;
1. distant supervision
2. Snorkel framework;
3. Deep probabilistic logic: A unifying framework for indirect supervision
4. Swellshark
5. 2020 - Weakly supervised sequence tagging from noisy rules
文章提出:linking rules
bagging, boosting and random forests
域外模型:使用已有的标注数据中进行训练模型,来自于四个数据(Ontonotes, CoNLL 2003,Broad Twitter Corpus, NER-annotated corpus of SEC filings)。
这些模型都是由biLSTM+CRF的模型训练出来的;
Gazetteers:Wikipedia,Geonames,Crunchbase Open Data Map, DBPedia
Heuristic functions(启发式): 每个函数专门识别特定类型的命名实体。例如 日期、时间、金额、百分比和基数/序号值这些特殊实体,是由专门的启发式来处理。
Document-level relations: 引入一个标签函数来捕获文档中的标签一致性约束;
HMM模型。
相关模型图:
参数评估
略
数据集:
CoNLL 2003,
Reuters & Bloomberg
基线:
Ontonotes-trained NER,
Majority voting (MV) ,
Snorkel model,
mSDA,
AdaptaBERT,
Mixtures of multinomials,
Accuracy model (ACC) ,
Confusion vector (CV),
Confusion matrix (CM) ,
Sequential Confusion Matrix (SEQ),
Dependent confusion matrix (DCM)
结果:
从这个数据来分析,启发式的规则,还是比较不错的。虽然是有提升的,可是总感觉提升出来的结果不是太优秀,或者可能是受到了实验数据的影响。
WS的一个应用, 模型思想是一个旧思想。文章设置的函数值得借鉴学习下。实验还是比较丰富的。
https://www.aclweb.org/anthology/2020.acl-main.139/
https://github.com/NorskRegnesentral/weak-supervision-for-NER
Structural Correspondence Learning:结构对应学习包括一个源域和一个目标域。两个域都有足够的未标记数据,但只有源域有标记的训练数据。
该方法通过建模来自不同领域的特征与支点特征的相关性来识别这些特征之间的对应关系.
happyprince
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。