NLP命名实体识别和关系抽取_使用nlp技术,例如命名实体识别和关系提取,从广告文本中提取商品名称和价格信息。

作者：IT小白 | 2024-07-25 23:20:29

踩

使用nlp技术,例如命名实体识别和关系提取,从广告文本中提取商品名称和价格信息。

最近一直在做相关的研究。
但是输出太少，我也不知道自己到底懂了没懂。
以后将每日学习记录输出到博客自己看。
剩下一个月好好加油（之前都实习去了，乱七八糟）
关系抽取中的几个文件
initial文件
reading word embedding data
处理词向量
vec.txt预览
vec.txt是预训练词嵌入文件。
此文件是从《纽约时报注释语料库》（LDC数据LDC2008T19）中学习的。
从纽约时报注释语料库中获取。

实体嵌入是随机初始化的。
实体嵌入中的实体数应与train.txt中的实体数相同。
原data目录中含五个文件
train.txt：训练文件，格式
（fb_mid_e1，fb_mid_e2，e1_name，e2_name，关系，句子）。

{
"text": "Not many people have cooler family closets to raid than Theodora Richards , the daughter of the Rolling Stones guitarist Keith Richards and the 70 's supermodel Patti Hansen .",
"relation": "/people/person/children", 
"h": {"id": "/guid/9202a8c04000641f8000000000dad102", 
"name": "Patti Hansen",
"pos": [161, 173]},
"t": {"id": "/guid/9202a8c04000641f8000000000d4eb59",
"name": "Theodora Richards", 
"pos": [56, 73]}}
1
2
3
4
5
6
7
8
9

test.txt：测试文件，格式与train.txt相同。
Relation2id.txt：所有关系和对应的ID，每行一个。

vec.txt：预训练词嵌入文件。
entity_ebd.npy：实体嵌入文件。

在这里插入图片描述

在这里插入图片描述
CRF层，用于学习到标签的约束条件。
参考
https://www.bilibili.com/video/BV1BK4y1C7Hj?from=search&seid=16670832614159685369

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/882402?site