当前位置:   article > 正文

实体抽取

实体抽取

第1关:基于Bilstm实现军事情报文本信息抽取

实验背景
命名实体识别是指从文本中识别出具有特定意义的实体,一般会定义一个标签集合,来表示所有可能取到的预测结果。与通用实体抽取不同,军情文本情报关注的命名实体包括人物军衔、国家(地区)、武器装备、设施、活动阵位、训练演习等,故无法使用通用数据集来训练模型,更无法利用现有的模型直接对文本情报进行实体抽取。因此,需要结合现实业务需求的针对性,设计一套满足jq情报需求的实体抽取模型。
任务描述
要求在构建好的模拟军事情报文本标注数据集上,利用keras深度学习框架,设计基于深度学习方法的命名实体抽取模型,从给定的非结构化情报文本中完成8种类别实体(具体如表1所示)的抽取任务,要求训练出的模型在测试集上的综合F1值达到0.85。
具体要求:
(1)数据转换: 将原始数据标签转换为BIO标注格式
(2)模型构建: 基于Keras深度学习框架构建面向军事情报文本领域的信息抽取模型。
(3)模型训练与测试: 基于带BIO标签的训练数据集,训练实体抽取模型;将训练好的模型提交在线实训平台,在测试集上进行实时评测。
(4)模型参数调优与结构优化: 根据模型在测试集上的表现性能,调整模型超参数,体会不同参数对模型训练过程和测试结果的影响;深入分析在测试集上抽取结果,优化网络结构。

import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Seque
  • 1
  • 2
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/554921
推荐阅读
相关标签
  

闽ICP备14008679号