赞
踩
知识图谱中属性和关系的区别主要是在于其面对的实体不同。
为了方便计算机的处理和理解,知识图谱使用了更加形式化、简洁化的方式去表示知识,就是三元组(triple)。
“姚明出生于中国上海” 可以用三元组表示为(Yao Ming, PlaceOfBirth, Shanghai)。
这里我们可以简单的把三元组理解为(实体entity,实体关系relation,实体entity)。如果我们把实体看作是结点,把实体关系(包括属性,类别等等)看作是一条边,那么包含了大量三元组的知识库就成为了一个庞大的知识图。
实体关系分为两种,一种是属性property,一种是关系relation。其最大区别在于,属性所在的三元组对应的两个实体,常常是一个topic和一个字符串,如属性Type/Gender,对应的三元组(Justin Bieber, Type, Person),而关系所在的三元组所对应的两个实体,常常是两个topic。如关系PlaceOfBrith,对应的三元组(Justin Bieber, PlaceOfBrith, London)。、
属性提取这个名词感觉更偏业务。 比如描述一件商品,“某某衣服面料质地粗糙”,面料质量就是衣服的属性,质地粗糙就是属性值。又比如“你看你作死的样,这里的属性其实就隐藏掉了,属性应该是指人的行为。
命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,以及时间、数量、货币、比例数值等文字的识别抽取。 这个词语更加面向于技术。
所以,属性提取可以用到命名识别的方法来去做,也可以用其他的方法,例如规则匹配。
二手属性抽取在NLP领域属于信息抽取(Information Extraction)问题,通常的做法是拆解为命名实体识别(NER)任务和文本分类(Text Classification)任务。
其实用英文表述,两者的区别就很清晰了。属性->data properties,举个例子:张三的年龄是二十四,“年龄”就是属性。关系->object properties,举个例子:张三的爸爸是张二,“爸爸”就是关系。关系用于刻画实体和实体之间的联系,属性是实体的固有特性。
从定义的角度,关系的的两端是实体,属性的两端是实体和实体描述(属性值)。
从应用的角度,个人觉得都差不多,如果属性值哪天被定义成了一个实体,属性也就变成个关系。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。