搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
weixin_40725706
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
黑客(网络/信息安全)技术速成自学
2
python中的dict类型_python dict 类型
3
命名实体识别的三中标注方法BIO,BIOES,BMES_bmes方法
4
CVPR24_Domain-Agnostic Mutual Prompting for Unsupervised Domain Adaptation
5
[论文阅读笔记17]A Survey on Knowledge Graph-Based Recommender Systems_代码a knowledge-enhanced deep recommendation framewo
6
chatgpt赋能python:PythonRewind:重新审视Python的历史和未来_rewind gpt
7
Python实现贝叶斯算法疫情微博评论情感分析_评论情感分析python
8
行行出状元!为什么偏偏要选择IT行业中的运维工程师?
9
解决Sentence Transformers中all-minilm-l6-v2等模型下载问题
10
python深度学习实战:构建智能问答系统解决自然语言问题_python智能问答系统开发
当前位置:
article
> 正文
I. 知识图谱 应用案例_知识图谱的构建实例
作者:weixin_40725706 | 2024-04-08 09:57:54
赞
踩
知识图谱的构建实例
I.
知识图谱
应用案例
电商知识图谱的构建与应用
业务背景
复杂购物场景:新零售、多语言、线上线下相结合
电商交易逐渐转变为集B2C、B2B、跨境为一体,覆盖“实物+虚拟”商品,结合跨领域搜索发现、导购、交互多功能的新型电商交易
与通用知识图谱的区别
首先,电商知识图谱的核心是商品。整个商业活动中由品牌商、平台运营、消费者、国家机构、物流商等多角色参与。相对于网页来说,数据的产生、加工、使用、反馈控制得更加严格,约束性更强。
其次,电商数据的结构化程度相对于通用领域来说做的更好。
再次,面向不同的消费者和细分市场,不同角色、不同市场、不同平台对商品描述的侧重都不同,使得对同一个实体描述时会有不同的定义。知识融合就变得非常重要。
最后,与通用知识图谱相比较而言,电商知识图谱有大量的大量的国家标准、行业规则、法律法规对商品描述进行着约束。存在大量的人的经验来描述商品做大跟消费者需求的匹配,知识推理显得更为重要。
案例 — 阿里巴巴
思路:以商品为核心,以人、货、场为主要框架
目前共涉及9大类一级本体和27大类二级本体
一级本体:人、货、场、百科知识、行业竞争对手、品质、类目、资质和舆情
人、货、场构成了商品信息流通的闭环,其他本体主要给予商品更丰富的信息描述
目前有百亿级的节点和百亿级的关系边
数据来源
主要是知识众包,其中关键就是知识图谱本体设计。
在设计上要考虑商品本身,又要考虑消费者需求和便于平台运营管理
另一个核心工作是要开发面向电商各种角色的数据采集工具,例如面向卖家的商品发布端
另一个来源是文本数据,例如商品标题、图片、详情、评价、舆情中的品牌、型号、卖点、场景等信息。这就要求命名识别系统具有跨越大规模实体类型的识别能力,能够支持电商域数据、人机语言交互自然语言问题以及更广泛的微博、新闻等舆情域数据的识别,并且把识别出的实体与知识图谱链接,特别是商品属性和属性值涉及上千类别的实体类型。主要包括:
商品域:类目、产品词、品牌、商品属性、属性值、标准产品。
LBS域:小区、超市、商场、写字楼、公司。
通用域:任务、数字、时间。
对知识图谱实体描述,除了基础的属性和属性值,很多是通过实体标签来实现的。相对来说,标签变化快,易扩展。很大一部分这类知识是通过推理获得的。例如,在食品标签生成中,知识推理通过食品的配料表数据和国家行业标准,如:
无糖;
无盐
图情知识图谱的构建与应用
业务背景
聚焦某一个特定细分行业,以整合行业内屠屏资源为目标的知识图谱
提供知识搜索、指示标引、决策支持等形态的知识应用,服务于行业内的从业人员、科研机构及行业决策者
思路
一般采用自顶向下的方式进行知识建模,通常从资源型数据入手,整理出资源的发表者、发表机构、关键词、发表载体等类型的实体及各自之间的关系,同时通过人物、机构的主页进行实体属性的扩充。
数据源主要包括:
第一类:知网、专利局等文献类网站
第二类:开放通用数据,包括百科类网站以及DBpedia等开发链接数据集
第三类:行业垂直的新闻门户
第四类:行业内企业和科研机构积累的既有数据
生活娱乐知识图谱的构建与应用:以美团为例
业务背景
知识图谱能够打破不同场景下的数据隔离
美团点评作为在线本体生活服务平台,覆盖了餐饮娱乐领域的众多生活场景,连接了数亿个用户和数千万家商店,积累了宝贵的业务数据,蕴含着丰富的日常生活相关的知识。
数据来源
原始数据
美团点评积累了40亿的公开评价数据、3450万全球上家数据、1.4亿店菜数据以及10万个性化标签
数据处理
以商户、商品、用户等为主要实体,其基本信息作为属性,商户与商品、与用户的关联为边,将多领域的信息关联起来,同时利用评论数据、互联网数据等,结合知识获取方法,填充图谱信息,从而提供更加多元化的知识。
采用统计语言模型、主题生成模型以及深度学习模型等各种模型,对商家标签、菜品标签、情感分析进行挖掘。
其次对评论标签聚合,主要采用知识图谱推理技术与标签相结合的方式
接下来,为了更精确地匹配菜品,丰富商户信息,需要对菜品标签进行挖掘。
最后对评论进行情感挖掘,对每一个用户的评论进行分析,分析出用户的一些情感的倾向。
主要业务应用有
智能搜索
ToB商户赋能
金融风险管理和反欺诈
企业商业知识图谱的构建与应用
业务背景
中国企业数量十分庞大,数据多源,需要构建统一的企业商业知识图谱
企业商业知识图谱包括企业、任务、专利等实体类型,以及任职、股权、专利所属权等关系类型,以完善企业及个人画像,助理企业潜在客户获取、客户背景调查、多层次研究报告、风险管控;辅助发现不良资产、企业风险、非法集资等
数据来源
半结构化的网页数据:包括全国企业信用信息公示系统、中国裁判文书网、中国执行信息公开网、国家知识产权局、商标局、版权局等
文本数据:如投招标信息公告、法律文书、新闻、企业年报等
创投知识图谱的构建与应用
业务背景
聚焦于工商知识图谱的一部分数据内容,旨在展示企业、投融资时间、投资机构之间的关系
思路
核心是投资,主要描述创业企业与投资机构之间以投资为主线的多种关系。
创投领域Schema中设计的概念主要包括初创公司、投资机构、投资人、公司高管、行业以及投融资事件等。
融资事件是创投的核心,不同于实体节点,融资事件描述的是一个事实,具有抽象性。
数据来源
主要来源于虎嗅、IT桔子、36Kr等科技型媒体
典型问题
数值属性表示不一致,例如金额的阿拉伯数字与中文写法的区别
实体同义,例如企业的全称与简称
不同数据源中的数据冲突
信息存储方式
在传统三元组的基础上加入其它描述字段,存储时间、轮次等信息
通过匿名节点存储事件,把时间、地点等相关信息作为事件节点的属性
中医临床领域知识图谱的构建与应用
金融证券行业知识图谱应用实践
业务背景
传统金融数据服务商历时数十年,已收集整理了大量高质量的结构化数据,并分门别类地展示给用户。
如何有效地使用这些数据,需要用户具备专业的金融经济知识,深刻理解某个数据的变动可能引发的关联、传导效应,从而帮助用户做出各种投资决策。
图谱建设步骤
从海量异构非结构化数据中辨别金融实体
定义并挖掘金融实体之间的各种关系,从而生成知识图谱
定义并表达业务逻辑,在知识图谱上实现各种具体任务,如推理等
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/weixin_40725706/article/detail/384635
推荐阅读
article
IBM
open
-sources
machine
learning
SystemML
...
IBM is aiming to popularise its proprietary
machine
learning
...
赞
踩
article
面试
了几十家,整理出这份
车载
测试
面试
题_
车载
测试
工程师
面试
题大全及答案...
年前有朋友找工作,跟我说简历改了
车载
后,收到的打招呼翻了几倍,如今
车载
测试
前景非常广阔,因为越来越多的汽车厂商正在开发新...
赞
踩
article
【
postgresql
基础入门】
数据
类型
介绍,整型,
字符串
,浮点数,日期时间
类型
特点,精度及表示范...
postgresql
数据库作为一款被各领域广泛使用的开源数据库,有丰富的
数据
类型
,像其它编程语言一样,在开始使用编程语...
赞
踩
article
华为
OD
面试
手撕
代码
真题【
加油站
】...
华为
OD
面试
手撕
代码
真题【
加油站
】
华为
OD
面试
手撕
代码
真题【
加油站
】 在一条环路上有 n&...
赞
踩
article
RabbitMQ
消费
消息
的两种
模式
:
推
和拉_
rabbitmq
是
推
还
是
拉...
https://blog.csdn.net/ITWANGBOIT/article/details/105428281前言...
赞
踩
article
Alfred
的常见设置
_
alfred
有道
...
使用
Alfred
1、如何保留搜索词每次激活搜索框,希望保持上一次的搜索历史。设置中勾选红色框就是了。
_
alfred
有道
a...
赞
踩
article
详解各种LLM系列|(
2
)
LLaMA
2
模型
架构、 预
训练
、
SFT
内容详解 (
PART
-1)_lla...
LLaMA
2
模型
架构、 预
训练
、
SFT
内容详解 _
llama
2
full
sft
repo
llama
2
full
sf...
赞
踩
article
Kafka
ui
搭建以及
使用
_
kafka
-
ui
...
kafka
本身没有自带相关的
ui
界面,但是很多时候没有页面意味着只有
使用
命令行进行相关操作如创建 topic、更改...
赞
踩
article
imx6
ull
开发板
各个
功能测试
_imx.6
ull
实验...
文章目录1.启动
开发板
1.1 MINI EMMC 启动方式的选择1.2 串口连接1.2.1 连接串口线和电源线、配置串口...
赞
踩
article
英
伟达
发布
GPU
驱动
更新,修复
25
个
漏洞
...
聚焦源代码安全,网罗国内外最新资讯!编译:代码卫士
英
伟达
发布 Windows 版本的
GPU
显示
驱动
安全更新,修复了2...
赞
踩
article
5款值得推荐
的
ai
做
ppt
的
软件
,
总有一款适合你!_
deckrobot
...
随着
ai
人工智能
的
发展
,
ai
逐渐融入到了我们
的
各种工作流之中
,
就如职场办公中最常见
的
,
制作演示报告或工作汇报
,
可以...
赞
踩
article
【
华为
OD
技术
面
-手撕
算法
代码真
题
】小行星碰撞_
od
技术
面
算法
题
...
od
技术
面
算法
题
华为
OD
面
试真
题
精选 ...
赞
踩
article
stable
diffusion
远端
跑
图
——
Api
基础知识掌握_
sd
跑
图
...
如果你想用手机或者电脑访问自己的服务器进行
stable
diffusion
(以下简称
sd
)跑
图
,学会使用
sd
的api是必...
赞
踩
article
PythonrequestsHTTP
“
Maxretriesexceededwithurl
”
error
...
今天跑了一下之前写的额爬虫,发现频繁执行时会报出一个超过最大连接数的问题。 网上查了一下,原因是
http
连接太多没有关闭...
赞
踩
article
android
开发之
添加
标签
与
删除
标签
_安卓
添加
删除
标签
...
老样子,先上效果图
标签
容器这个在github上已经有很多人实现了,既然有轮子那为什么还要重复制造轮子呢? 本人比较懒,直...
赞
踩
article
Python
获取
cookie
用法介绍...
1、什么是
cookie
?Cookie,指的是网站为了辨别用户身份而存储在用户本地终端上的数据。简单来说,就是通过在用户访...
赞
踩
article
android
文本
拖动
,
Android
笔记之
文本
随滑块移动的
SeekBar
...
packagecom.bu_ish.blog;import
android
.content.Context;importa...
赞
踩
article
快速
排序
算法
C++
实现(超详细解析
!
!
!
!
)_
c++
快速
排序
...
快速
排序
,其实是一种分治
算法
,那么在了解
快速
排序
之前,我们先来看看什么是分治
算法
。在
算法
设计中,我们引入分而治之的策略,...
赞
踩
article
tcp
/ip细节...
读到后应该主动调用close,进入last_ack且等待ack后进入closed, 注意长期处于close_wait一般...
赞
踩
article
蓝桥
杯
系列5——
填空题
练习
_
蓝桥
杯
真题
填空题
训练...
做小题的主要目标是找如何做的又快又准。题目虽然不难,但是很多坑(很大可能是自己基础太差了(ಥ
_
ಥ) )
_
蓝桥
杯
真题
填空题
...
赞
踩
相关标签
java
面试
职场和发展
单元测试
自动化测试
程序人生
软件测试
车载测试
postgresql
数据库
sql
database
手撕代码
华为od
华为
消息队列
alfred
llama
深度学习
nlp
自然语言处理
人工智能
kafka
ui
分布式