当前位置:   article > 正文

知识图谱-知识融合(一)_知识图谱 知识融合

知识图谱 知识融合

知识融合

1.什么是知识图谱的融合

1.1 概念&术语

  • 本体层:描述特定领域的抽象概念、属性、公理
  • 实体层:描述具体的实体对象,实体间的关系,包含大量的事实以及数据

1.2 为什么要进行知识图谱融合

  • 本体层能够解决特定应用的知识共享问题,但若要构建一个统一庞大覆盖世界万物的本体无法实现,一是由于知识是无限的,二是由于本体层的构建受到主观以及分布性的影响,无法得到统一的认可。
  • 在知识图谱的应用中,为了融合其他应用所拥有的信息,以及联合其他应用实现更加强大的功能,但这在异构的本体层或是实体层是无法进行上述的信息交流。

1.3 进行知识融合要解决的问题

  • 分析造成本体和实体异构的原因
  • 明确融合的对象
  • 建立何种映射进行融合
  • 映射的复杂度分析

2.知识图谱中的异构问题

  • 知识图谱的不匹配是导致知识图谱异构的根本原因
  • 异构的情形划分为两个层次:语言层的不匹配以及模型层的不匹配

2.1语言层不匹配

  • 本体语言之间并非完全兼容与匹配
  • 总的来说语言层次上的不匹配情形包含语法不匹配,逻辑表示不匹配,原语语义不匹配和语言表达能力不匹配
1)语法不匹配
  • 不同的知识表示常用不同的语言,这就造成了进行知识融合时语法不匹配的问题出现,就例如不同语言对定义一个类的书写方式不同,造成了语法上的不匹配,若是两个知识图谱中表示的成分均出现,这种问题就可以采用重写就可以解决。但实际情形是语法的不匹配与其他语言层上的问题或共同出现,简单的重写显然不能解决问题。因此将不同的语言转化为相同的语法格式能够方便解决其他本体不匹配的问题。
2)逻辑表示不匹配
  • 不同的语言对一些逻辑的表示也不尽相同,例如对两个类的相交,一些语言有明确的声明,而有的语言则需要通过子类和非算子来完成同样的声明。
  • 这一类问题的解决办法也很简单,通过定义语言L1逻辑表示到语言L2的逻辑表示的转换规则
3)原语的语义不匹配
  • 在不同的语言中会使用相同的原语来进行本体的构建,但在不同的语言中这些原语有着细微的差别,如class在OWL Lite 和 OWL DL语言中只能表示本体中的概念,而在其他语言中则可以表示一个类或者一个实例。
4)语言表达能力不匹配
  • 语言表达能力的不匹配指不同本体语言上表达能力上存在差异,一些语言可以表达出的事情在另一种语言中可能会表达不出来
  • 这种问题的解决办法是表达能力弱的语言向表达能力强的转换,但若表达能力强的对表达能力弱的存在不兼容的问题,这样就会导致信息的缺失

2.2模型层的不匹配

  • 模型层的不匹配出现在本体描述相关或是交叉领域中也会出现。这与构建本体所使用的语言无关,在相同的构建语言中也会出现模型层不匹配的情形。
  • 模型层的不匹配又可以分为概念化的不匹配以及解释不匹配两种情况
1)概念化不匹配
  • 概念化的不匹配又可以分为概念范围的不匹配以及模型覆盖的不匹配两类
① 概念范围的不匹配
  • 同一名称不同的领域表示的含义不同;不同的名称可能表示同一概念,也可能只是相交的关系。
  • 建模者在本体建模的过程中,如果需求不同,可能会对一个概念的划分有不同的看法。比方说“动物”可以分为“哺乳动物”和“非哺乳动物”,也可以分为“食肉动物”和“非食肉动物”。
② 模型覆盖的不匹配
  • 不同本体对于描述的领域往往在覆盖知识范围上有差异,而且在所覆盖的知识范围中,对本体之间描述的详细程度也会存在差异。
  • 模型的广度。也就是模型描述覆盖的领域范围
  • 模型的粒度。也就是对本体之间描述的详细程度
  • 本体建模的观点。这决定了本体是从什么角度来描述领域内的知识。(由于本体的建模反应了建模者的主观性,这一类的不匹配情况在实际中很普遍)
2)解释不匹配
  • 解释不匹配包含模型风格的不匹配以及建模术语的不匹配
①模型风格不匹配
范例不匹配
  • 不同的范例表示相同的概念,这就造成了不匹配。例如对时间的表示既可以采用时间间隔的方式,也可以采用时间点的方式
  • 其次,建模过程中采用不同的上层本体也会导致范例的不匹配,这是由于不同的上层本体往往对时间,行为,计划因果以及态度的概念划分是不一样的。
概念描述不匹配
  • 对于同一概念的建模有多种选择,例如为了区别两个类可以通过属性来进行区分,也可以通过构建一个新类进行区分。
  • 概念描述时的方法也是不一样的,有的概念描述自高层向底层描述,有的则从低层到高层描述
② 建模术语不匹配
同义术语
  • 对于不同本体上含义相同的概念会由于建模者的习惯不同而采用不同的命名方式
  • 这类问题同语义问题共同存在,在没有人工以及其他技术的帮助下,机器无法识别这些术语是否是同义的。
同形异义术语
  • 建模术语不匹配是术语之间的同形异义现象。 例如:"Conductor"在音乐领域和电子工程领域的意义分别是“指挥家”和“半导体”。
  • 这类问题需要根据考虑语义的上下文以及借助人类的知识来解决
编码格式
  • 编码格式的不匹配例如:人名的表示可以是"FullName "也可以采用"FirstName+LastName"的形式
    综上而言,对于语言层的不匹配进行语言上的转换即可,而对于模型层的不匹配则需要根据何种不匹配来选择合适的算法。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/528863
推荐阅读
相关标签
  

闽ICP备14008679号