赞
踩
由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。
谷歌于2012年5月16日首先发布了知识图谱(Knowledge Graph)。
知识图谱是一种互联网环境下的知识表示方法。
知识图谱的目的是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。
Google、百度和搜狗等搜索引擎公司构建的知识图谱,分别称为知识图谱、知心和知立方。
知识图谱(Knowledge Graph/Vault),又称科学知识图谱,用各种不同的图形等可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱是由一些相互连接的实体及其属性构成的。
三元组是知识图谱的一种通用表示方式:
(实体1-关系-实体2):中国-首都-北京
(实体-属性-属性值):北京-人口-2069万
知识图谱也可被看作是一张图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。
模式层与数据层。
数据层主要是由一系列的事实组成,而知识以事实为单位进行存储。
模式层构建在数据层之上,是知识图谱的核心。
获取知识的资源对象大体可分为:
结构化数据是指知识定义和表示都比较完备的数据。
半结构化数据是指部分数据是结构化的,但存在大量结构化程度较低的数据。
非结构化数据是指没有定义和规范约束的“自由”数据。
(1)自顶向下指的是先为知识图谱定义好本体与数据模式,再将实体加入到知识库。
(2)自底向上指的是从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式
维基百科(Wikipedia)由维基媒体基金会负责运营的一个自由内容、自由编辑的多语言知识库。
DBpedia由2007年德国柏林自由大学以及莱比锡大学的研究者从维基百科里萃取结构化知识的项目开始建立
YAGO由德国马克斯-普朗克研究所(MPI)构建的大型多语言的语义知识库,从10个维基百科以不同语言提取事实和事实的组合。
XLORE是清华大学构建的基于中、英文维基和百度百科的开放知识平台,是第一个中英文知识规模较为平衡的大规模中英文知识图谱。
欢迎大家加我微信交流讨论(请备注csdn上添加)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。