当前位置:   article > 正文

知识图谱的概述_知识图谱概念

知识图谱概念

目录

1. 知识图谱的起源

2. 知识图谱的基本概念

3. 知识图谱的应用


1. 知识图谱的起源

        知识图谱(Knowledge Graph)的概念在 2012 年由 Google 公司提出,意在利用其作为知识库来提高搜索引擎的性能。搜索引擎可以通过构建的知识图谱来提取用户的查询语句的语义,通过知识图谱的进一步推断可以反馈给用户更精确、结构化更好的查询结果,这样可以尽可能满足用户的需求,直接给予用户最想获得的数据。

        剑桥语言研究组的 Richard H. Richens 在 1956 年首先发明了语义网络(Semantic Network),这个语义网络基于图结构来存储各个知识。构建了图,计算机可以更好地表示自然语言结构,从而可以更好地提取自然语言的语义,这种技术在自然语言处理与机器翻译中被广泛使用。其中图结构的 Node 代表了概念或者实体,图结构的边缘代表了概念或者实体之间的关系。这一构想在 60 年代早期由 M. Ross Quillian、Robert F. Simmons 等人独立实现。随后在 1969 年 M.  Ross Quillian 和 Allan M. Collins 利用这一构想将时间信息与知识结合起来。之后在 1975 年,Allan M. Collins 和 Elizabeth F. Loftus 基于之前的研究结果提出了扩散激发模式(Spreading- Activation Theory),这种模式可以通过网络结构中的连接线的长短表示相关强度。

        20 世纪 90 年代,研究者们提出了机构知识库的概念,开始深入研究如何表示知识以及如何组织知识,这些方法在繁复的资料整理中被广泛应用。而在语义网络发展的同时,其与知识图谱之间的区别渐渐开始模糊。

        互联网在 21 世纪高速发展,信息量开始指数爆炸増长,而此时搜索引擎出现,人们期待着更加快速、精确的搜索方法与结果。2001 年,Tim Berners-Lee 等学者提出了语义网(Semantic Web)的概念阿,其成为语义网络的新的应用场景,可以用来提高互联网中互连资源的实用性与易用性。2012 年 11 月,Google 公司开始了他们的知识图谱项目,该项目的关键在于从互联网的海量资源、信息中提取实体、属性、实体关系等,并利用这些信息构建知识图谱,用来解决并优化个性化推荐、信息检素、智能问答这三个方面出现的问题。在 Google 知识图谱项目的基础上,知识图谱的概念正式出现,现在知识图谱就是一个旨在将所有不同类型、语言的信息连在一起的网络结构,并可以利用这个网络可以实现将海量知识的更加智能地存储、管理和检索。

2. 知识图谱的基本概念

       " Things, not strings"是 Google 知识图谱的宣传语,意思很明显:信息与知识并不是无意义的字符串,我们要做的是获取这些字符串所代表的真正语义。

        知识图谱的思想可以追溯到上世纪提出的语义网络。在语义网络中,网络的节点表示了概念或者实体,网络的边缘线表示了概念或者实体之间的关系,这些关系包含了 is-a、part-of 等关系。在表现形式上,语义网络与知识图谱是很相似的,所以知识图谱具有语义网络的特性与优点。但是语义网络更偏向于描述概念与描述概念之间的关系,而知识图谱更偏向于描述实体与实体之间的关系。

        语义网络其实存在着许多缺陷:1、语义网络中的节点与边的构建没有明确的标准,一定程度上缺乏了客观性;2、语义网络很难区分对象与概念节点;3、因为没有标准,语义网络很难将多源数据进行融合;4、语义网络无法对节点和边的标签进行定义。而知识图谱的出现可以有效解决这些问题。

        知识图谱可以看作是由多条能表示为 Subject-predicate- Object (SPO)三元组的知识所组成。我们可以用 W3C 所制定的资源描述框架来形式化地表示这种关 系,这种框架是一种用来描述实体/资源的标准数据模型。

        现在的知识图谱有时被用来被泛指为各类大型知识库。2001 年,维基百科(Wikipedia)协作计划开始,目的是为了向所有人提供一个多语言、全球性的自由的百科全书。到目前为止,全球在短短十几年的时间向其中补充了上百万条知识。这个计划极大地推动了 Dbpedial、Yago 等许多基于该百科全书的结构化知识的知识库的构建。由于这些知识库都大部分是基于英文的,即使是多语言的知识库也是以英文为主的,所以国内近几年也推出了大量的中文为主的知识库,比如清华大学的 Lore、上海交通大学的 zhishime 等基于百度百科、维基百科中结构化知识所构建起来的知识库。2017 年,由国内众多高校发起的 cnSchema.org 项目,是一个基于社区维护的开放知识图谱 Schema 标准。

3. 知识图谱的应用

        知识图谱将所有实体、实体间关系组成了网络,通过推理引擎使计算机有了推理能力。随着不断地发展,知识图谱技术也在搜、自动问答等领域有了更深程度的应用。

        智能检索是知识图谱比较成的应用。通过借助知识图谱理解用户的搜索语义,从而更深层次地理解用户的需求,大大提升了用户的使用体验,使用户能获得更精确、更智能的搜索结果。自动问答通过借助知识图谱可以使计算机根据用户所提出的问题直接做出回答,这也是智能检索未来发展的趋势。知识图谱为智能问答提供了知识库,然后基于其强大的推理能力,为用户做出基于推理结果的回答。

        除了在以上领域,知识图谱在其他领域也有广泛应用。比如在推荐领域,知识图谱就可以将其本来就存在的知识库引入到推荐系统中,这样可以解决一些冷启动或者稀疏性的常见问题。目前一般都通过依次学习、交替学习、联合学习等方式在推荐系统中使用。

 图 3.1 知识图谱用于推荐系统

        知识图谱还可以在反欺诈领域中应用。反欺诈是金融等行业中的重要环节,由于很多欺诈案件会涉及很复杂的关系网络,并且有很多不同的数据源,而使用知识图谱可以解决这些问题。知识图谱还可以通过描述、推理帮助我们应对在复杂的关系网络中存在的潜在风险。

        知识图谱同样还可以在股票研究分析中使用。由于在股票行情分析中,数据源是公司年报、半年报、公告、招股书、新闻等很多非结构化文本,需要在众多数据源中抽取获得公司的各种属性与关系,比如股东、子公司、客户等信息,这样才能构建出知识图谱网络。通过运用知识图谱可以辅助券商分析员、交易员等基金投资人员分析该公司的具体情况,做出更好的判断与决策。

        而现在随着知识图谱越来越广泛的应用,知识图谱未来将会以其强大的非结构化数据处理能力、知识推理能力在各个领域尤其是工业领域中成为热门工具。

图 3.2 常见的知识图谱产品 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/150431
推荐阅读
相关标签
  

闽ICP备14008679号