当前位置:   article > 正文

知识图谱de构建与应用(三):知识融合_知识图谱知识融合

知识图谱知识融合

本章首先介绍知识融合的定义、难点和流程,接着概括性地介绍本体对齐和实体对齐的常用方法,最后介绍知识融合在工业领域实践过程中的方法和评估体系。

3.1 知识融合概述

3.1.1 知识融合的主要难点

对于很多需要构建知识图谱的领域,由于从业者甚多,自然而然地会沉淀出数量众多的数据库或知识库,比如在影视子领域,百度百科、维基百科、豆瓣等都是很好的知识库,因而在构建知识图谱的过程中往往会对多个知识库的知识进行合并,以期获得最全面的知识,这个过程就称为知识融合。此外,由于被合并的各个知识库里的知识难免会存在错误,因而知识融合会对多个知识库的知识进行交叉验证,知识融合之后获得的知识相比融合前的单知识库会更准确。

由于自然语言的开放性,各个领域的知识融合任务往往面临以下四个难点。

(1)异构问题。不同知识库对同一个实体或知识的表达差异很大,具体体现在一个相同的实体存在大量的别名。如图3-1(a)所示,不同数据源对同一个实体“华为P30”有不同的描述。

(2)歧义问题。不同的实体使用同样或类似的文本表达。如图3-1(b)所示,在电商领域中,“苹果”既可以作为一个品类名称,也可以是一个品牌名称,甚至可以作为一种颜色或是图案名称出现。在工程实践中容易造成准确率的下降。

(3)数据噪声问题。在工业界知识图谱实践中,数据噪声问题是广泛存在的,多知识库融合会放大噪声问题,容易造成准确率的下降。如图3-1(c)所示,该商品实体的属性值很多是“不详

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/479833
推荐阅读
相关标签
  

闽ICP备14008679号