实体抽取

作者：2023面试高手 | 2024-05-11 13:21:08

踩

实体抽取

第1关：基于Bilstm实现军事情报文本信息抽取

实验背景
命名实体识别是指从文本中识别出具有特定意义的实体，一般会定义一个标签集合，来表示所有可能取到的预测结果。与通用实体抽取不同，军情文本情报关注的命名实体包括人物军衔、国家（地区）、武器装备、设施、活动阵位、训练演习等，故无法使用通用数据集来训练模型，更无法利用现有的模型直接对文本情报进行实体抽取。因此，需要结合现实业务需求的针对性，设计一套满足jq情报需求的实体抽取模型。
任务描述
要求在构建好的模拟军事情报文本标注数据集上，利用keras深度学习框架，设计基于深度学习方法的命名实体抽取模型，从给定的非结构化情报文本中完成8种类别实体（具体如表1所示）的抽取任务，要求训练出的模型在测试集上的综合F1值达到0.85。
具体要求：
（1）数据转换：将原始数据标签转换为BIO标注格式
（2）模型构建：基于Keras深度学习框架构建面向军事情报文本领域的信息抽取模型。
（3）模型训练与测试：基于带BIO标签的训练数据集，训练实体抽取模型；将训练好的模型提交在线实训平台，在测试集上进行实时评测。
（4）模型参数调优与结构优化：根据模型在测试集上的表现性能，调整模型超参数，体会不同参数对模型训练过程和测试结果的影响；深入分析在测试集上抽取结果，优化网络结构。

import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Seque1
2

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/2023面试高手/article/detail/554921