赞
踩
知识图谱(Knowledge Graph)的概念由Google公司在2012年提出[1],是指其用于提升搜索引擎性能的知识库。
知识图谱以结构化的形式描述客观世界中的概念、实体及其之间的关系。如下图所示:
知识图谱涉及专家系统、语言学、语义网、数据库,以及信息抽取等众多领域
包括:实体、属性、关系
节点是实体
节点有属性标签(可以包含类型)
两个节点的边是实体间关系
强调实体,但也可以描述概念
知识和主观性知识
3. 静态知识和动态知识
4. 百科知识、领域知识、场景知识、语言知识、常识知识等
语言知识图谱:主要是存储人类语言方面的知识
常识知识图谱:主要有Cyc和ConceptNet等
语言认知知识图谱:中文知网词库HowNet是一种典型的语言认知知识图谱
领域知识图谱:针对特定领域构建的知识图谱,专门为特定的领域服务
百科知识图谱:主要以Linked Open Data(LOD)项目支持的开放知识图谱为核心
经典知识图谱
采用什么样的方式表达知识,其核心是构建一个本体对目标知识进行描述
输入
输出
关键技术
作为语义网的应用,知识图谱的知识建模采用语义网的知识建模方式,分为概念、关系、概念关系三元组三个层次,并利用“资源描述框架(RDF)”进行描述。
RDF的基本数据模型包括了三个对象类型:
三元组<主体(subject),谓词(predicate),宾语(object)>。
输入
输出:领域知识
关键技术
网络文本信息结构
结构化数据
半结构化数据
纯文本
知识获取:实体识别
实体识别任务的目标是从文本中识别实体信息
早期有关实体识别的研究主要是针对命名实体的识别
在知识图谱领域,从文本中识别实体不仅仅局限于命名实体,还包括其他类别的实体,特别是领域实体
与实体识别相关的任务是实体抽取
知识获取:实体消歧
目标是消除指定实体的歧义
实体消歧对于知识图谱构建和应用有着重要的作用,也是建立语言表达和知识图谱联系的关键环节
从技术路线上划分,实体消歧任务可以分为实体链接和实体聚类两种类型
知识获取:关系抽取
目标是获取两个实体之间的语义关系。
可以是一元关系(例如实体的类型),也可以是二元关系(例如实体的属性)甚至是更高阶的关系。
关系抽取对于构建知识图谱非常重要,是图谱中确定两个节点之间边上语义信息的关键环节。
关系抽取方法分类
知识获取:事件抽取
目标是从描述事件信息的文本中抽取出用户感兴趣的事件信息并以结构化的形式呈现出来。
事件是发生在某个特定的时间点或时间段、某个特定的地域范围内,由一个或者多个角色参与的,一个或者多个动作组成的
事情或者状态的改变。
任务:对不同来源、不同语言或不同结构的知识进行融合,,从而对于已经有的知识图谱进行补充、更新和去重。
输入
输出
关键技术
融合方式
从融合的对象看,知识融合分为知识体系的融合和实例的融合。核心问题是计算两个知识图谱中两个节点或边之间的语义映射关系。
从融合的知识图谱类型看,知识融合分为:竖直方向的融合和水平方向的融合
任务:研究采用何种方式将已有知识图谱进行存储。
因为目前知识图谱大多是基于图的数据结构,它的存储方式主要有两种形式:
输入
输出
主要技术
由于处理数据的不完备性,知识图谱中肯定存在知识缺失现象(包括实体缺失、关系缺失)。
目前知识推理的研究主要集中在针对知识图谱中缺失关系的补足,即挖掘两个实体之间隐含的语义关系。所采用的方法可以分为两种:
知识图谱应用场景
知识图谱落地模式
金融证券领域
企业风险评估:基于企业的基础信息、投资关系、诉讼、失信等多维度关联数据,利用图计算等方法构建科学、严谨的企业风险评估体系,有效规避潜在的经营风险与资金风险。
反欺诈:不一致性验证可以用来判断一个借款人的欺诈风险,类似交叉验证。比如借款人A和借款人B填写的是同一个公司电话,但借款人A填写的公司和借款入B填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。
东南大学知识图谱课程
深蓝课程
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。