赞
踩
实验背景
命名实体识别是指从文本中识别出具有特定意义的实体,一般会定义一个标签集合,来表示所有可能取到的预测结果。与通用实体抽取不同,军情文本情报关注的命名实体包括人物军衔、国家(地区)、武器装备、设施、活动阵位、训练演习等,故无法使用通用数据集来训练模型,更无法利用现有的模型直接对文本情报进行实体抽取。因此,需要结合现实业务需求的针对性,设计一套满足jq情报需求的实体抽取模型。
任务描述
要求在构建好的模拟军事情报文本标注数据集上,利用keras深度学习框架,设计基于深度学习方法的命名实体抽取模型,从给定的非结构化情报文本中完成8种类别实体(具体如表1所示)的抽取任务,要求训练出的模型在测试集上的综合F1值达到0.85。
具体要求:
(1)数据转换: 将原始数据标签转换为BIO标注格式
(2)模型构建: 基于Keras深度学习框架构建面向军事情报文本领域的信息抽取模型。
(3)模型训练与测试: 基于带BIO标签的训练数据集,训练实体抽取模型;将训练好的模型提交在线实训平台,在测试集上进行实时评测。
(4)模型参数调优与结构优化: 根据模型在测试集上的表现性能,调整模型超参数,体会不同参数对模型训练过程和测试结果的影响;深入分析在测试集上抽取结果,优化网络结构。
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Seque
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。