赞
踩
非结构化数据:诸如图片、文本、video、音频等数据,需要加以处理才能被模型训练。
抽取实体: 人、地名、时间,比如医疗领域:蛋白质、疾病、药物等等。
抽取关系:位于、工作在、部分等。
指代消解:判断一个代词具体是指向哪个实体。
命名实体识别(NER):识别文本中具有特定意义的实体。NER任务中的常用模型包括生成式模型HMM、判别式模型CRF等,但是之后出现的BILSTM-CRF效果要远好于之前的常用模型,并且成为目前基于深度学习的NER方法中的最主流模型。
NER评估方法:精确率/召回率,F1-score。
1、利用一个制定好的规则
2、利用已经定义好的词典
即统计每个单词的实体类型,记录针对于每个单词,概率最大的实体类型。
非时序模型:逻辑回归、SVM
时序模型:HMM,CRF,LSTM-CRF
参考文章:
信息抽取——关系抽取.
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。