赞
踩
欢迎大家关注我的博客 http://pelhans.com/ ,所有文章都会第一时间发布在那里哦~
本节对本体任务推理做一个简单的介绍,并介绍本体推理任务的分类。而后对本体推理的方法和工具做一个介绍。
所谓推理就是通过各种方法获取新的知识或者结论,这些知识和结论满足语义。其具体任务可分为可满足性(satisfiability)、分类(classification)、实例化(materialization)。
可满足性可体现在本体上或概念上,在本体上即本体可满足性是检查一个本体是否可满足,即检查该本体是否有模型。如果本体不满足,说明存在不一致。概念可满足性即检查某一概念的可满足性,即检查是否具有模型,使得针对该概念的解释不是空集。
上图是两个不可满足的例子,第一个本体那个是说,Man 和 Woman 的交集是空集,那么就不存在同一个本体Allen 既是Man 又是Women。 第二个概念是说概念Eternity是一个空集,那么他不具有模型,即不可满足。
分类,针对Tbox的推理,计算新的概念包含关系。如:
即若Mother 是 Women的子集,Women是 Person的子集,那么我们就可以得出 Mother是 Person的子集这个新类别关系。
实例化即计算属于某个概念或关系的所有实例的集合。如:
第一个是计算新的类实例信息,首先已知Alice 是Mother,Mother 是 Women的子集,那么可知Alice 是一个Women。即为Women增加了一个新的实例。下面那个是计算新的二元关系,已知Alice 和Bob 有儿子,同时has_son 是has_child的子类,那么可知Alice 和Bob has_child。
OWL本体语言是知识图谱中最规范(W3C制定)、最严谨(采用描述逻辑)。表达能力最强的语言(是一阶谓词逻辑的子集),它基于RDF语法,使表示出来的文档具有语义理解的结构基础。促进了统一词汇表的使用,定义了丰富的语义词汇。同时允许逻辑推理。
关于OWL语言的规范性我们再之前讨论过,此处我们介绍一下它的逻辑基础:描述逻辑。
描述逻辑(Description Logic)是基于对象的知识表示的形式化,也叫概念表示语言或术语逻辑,是一阶谓词逻辑的一个可判定子集。
一个描述逻辑系统由四个基本部分组成:
不同的描述逻辑系统的表示能力与推理机制由于对这四个组分的不同选择而不同。下面对四个组分中的概念做一个简单介绍。
最基本的元素有概念、关系、个体。
TBox为术语集,它是泛化的知识,是描述概念和关系的知识,被称之为公理(Axiom)。由于概念之间存在包含关系,TBox 知识形成类似格(Lattice)的结构,这种结构是由包含关系决定的,与具体实现无关。TBox语言有定义和包含,其中定义为引入概念及关系的名称,如Mother、Person、has_child,包含指声明包含关系的公理,例如
ABox是断言集,指具体个体的信息,ABox包含外延知识(又称为断言(Assertion)), 描述论域中的特定个体。**描述逻辑的知识库
描述逻辑语义:解释I是知识库K的模型,当且仅当I是K中每个断言的模型。若一个知识库K有一个模型,则称K是可满足的。若断言σ对于K的每个模型都是满足的,则称K逻辑蕴含σ,记为
描述逻辑依据提供的构造算子,在简单的概念和关系上构造出复杂的概念和关系。描述逻辑至少包含以下构造算子:交 (
下图给出描述逻辑的语义表:
因为OWL采用描述逻辑,因此下图给出了描述逻辑与OWL词汇的对应表:
基于本体推理的方法常见的有基于Tableaux运算的方法、基于逻辑编程改写的方法、基于一阶查询重写的方法、基于产生式规则的方法等。
下面对上面的几种方法做详细介绍。
基于Tableaux运算适用于检查某一本体的可满足性,以及实例检测。其基本思想是通过一系列规则构建Abox,以检测可满足性,或者检测某一实例是否存在于某概念。这种思想类似于一阶逻辑的归结反驳。
Tableaux运算规则(以主要DL算子举例)如下:
这里对第一个解释一下,其他的类似。第一个是说如果C 和D(x) 的合取是
现在给定如下本体,检测实例Allen 是否在 Woman中? 即:
检测 Woman(Allen)?其解决流程为:
初始Abox,记为
运用
运用
运用
得出Allen 不在Woman的结论。如果Woman(Allen)在初始情况已存在于原始本体,那么推导出该本体不可满足!
Tableaux运算的基于Herbrand模型,Herbrand模型你可以把它简单的理解为所有可满足模型的最小模型,具体的可以去看逻辑方面的书。
本体推理具有一定的局限性,如仅支持预定义的本体公理上的推理,无法针对自定义的词汇支持灵活推理;用户无法定义自己的推理过程等。因此引入规则推理,它可以根据特定的场景定制规则,以实现用户自定义的推理过程。
基于以上描述,引入Datalog语言,它可以结合本体推理和规则推理。面向知识库和数据库设计的逻辑语言,表达能力与OWL相当,支持递归,便于撰写规则,实现推理。
Datalog 的基本语法包含:
下图给出一个Datalog 推理的例子:
基于查询重写我们可以高效地结合不同数据格式的数据源;同时重写方法关联起了不同的查询语言。
一阶查询是具有一阶逻辑形式的语言,因为Datalog是数据库的一种查询语言,同时具有一阶逻辑形式,因此可以以Datalog 为中间语言,首先重写SPARQL 语言为Datalog ,再将Datalog 重写为SQL 查询。
下图给出查询重写的基本流程:
查询所有研究人员及其所从事的项目? 用 SPARQL表述为:
给定Datalog 规则如下:
底层数据具体为某数据库中为下图中的两张表:
步骤一: 重写为Datalog 查询
过滤不需要的公理 (通过语法层过滤)
生成所有相关的Datalog 查询
产生式系统是一种前向推理系统,可以按照一定机制执行规则从而达到某些目标,与一阶逻辑类似,但也有区别。被应用于自动规划、专家系统上。
产生式系统由: 事实集合(Working Memory)、产生式/规则集合、推理引擎组成:
产生式系统的执行流程如下图所示:
上面的WM 和产生式集合是我们定义的数据,相当于ABox 和 TBox,中间部分是推理引擎。其实大部分推理系统都是由这三部分组成。
模式匹配即 用每条规则的条件部分匹配当前WM。,一种高效的模式匹配算法是RETE 算法,1979年由Charles Forgy (CMU)提出, 将产生式的LHS组织成判别网络形式,是一种典型的以空间换时间的算法。其流程如下图所示:
Drools 是商用规则管理系统,其中提供了一个规则推理引擎,核心算法是基于RETE算法的改进。提供规则定义语言 ,支持嵌入Java代码。
Jena 用于构建语义网应用Java 框架,提供了处理RDF、RDFs、OWL 数据的接口,还提供了一个规则引擎。提供了三元组的内存存储于查询。
RDF4J 是一个处理RDF 数据的开源框架,支持语义数据的解析、存储、推理和查询。能够关联几乎所有RDF存储系统,能够用于访问远程RDF存储。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。