搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
Guff_9hys
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
关于CentOS8停止维护后,新安装CentOS无法使用yum、wget等命令的问题解决_centos 8无法 使用依赖库 可以换成什么
2
全面解读MongoDB高可用、高性能与高可扩展架构
3
火花点火发动机的燃烧 外文翻译_what is flame propagation汽车
4
Vue Test Utils前端单元测试
5
微信账户体系科普:什么是UnionId、OpenId与wxopenid?_openid unionid
6
【制作100个unity游戏之27】使用unity复刻经典游戏《植物大战僵尸》,制作属于自己的植物大战僵尸随机版和杂交版1(附带项目源码)_unity 植物大战僵尸
7
数据库系统概论(第五版)期末复习_数据库系统概论第五版期末题库
8
测试开发(社招):新浪_测试开发社招
9
【Java数据结构】详解LinkedList与链表(三)
10
522. 最长特殊序列 II(Rust)
当前位置:
article
> 正文
UCAS - AI学院 - 自然语言处理专项课 - 第9讲 - 课程笔记_情景语义学 场景变量
作者:Guff_9hys | 2024-06-24 02:23:19
赞
踩
情景语义学 场景变量
UCAS - AI学院 -
自然语言处理
专项课 - 第9讲 - 课程笔记
语义分析
概述
语义理论简介
格语法
语义网络
词义消歧
语义角色标注
分布式语义表示
语义分析
概述
语义计算的任务:解释句子或篇章各部分的含义
困难
大量的歧义(指代、同义/多义、辖域、隐喻)
不同人的理解
理论方法、模型尚不成熟
挑战
语义的基本单元
语义表示的方法和标准
语言产生和演化的神经基础是什么
人脑的语言认知机理
语义理论简介
词的指称作为意义
指代事物——对应意义
问题:抽象、复杂的事物无法处理
心理图像、大脑图像或思想作为意义
说话者的意图作为意义
言语行为——期望反应
独立于逻辑意义之外
意图的定义、划分和表示十分困难
过程语义
接收该句后采取的动作
人机对话
词汇分解学派
句子语义基于其含有的词和词组
词的意义基于一组有限特征——语义基元
语义基元 + 操作符——句子语义
难以把握
条件真理模型
谓词逻辑为基础
语义即其所对应的命题或谓词在全体模型中的真伪
时间、场景有关的语言现象不能很好描述
一词多义不好解释
情景语义学
句子语义与逻辑意义和使用的场景有关
引入场景变量
模态逻辑
通过一套公理系统刻画现实世界和自然语言中的常见现象
难以涵盖特殊事实
格语法
用施事 、 受事 、 工具 、 受益等概念表示句法语义关系
这些语义关系经过变换后在表层结构中称为主语或宾语
格:深层格,体词(名词、代词)和谓词(动词、形容词)之间的及物性关系——语义关系
这种格一旦确定就不会改变
三条基本规则
S → M + P S \to M + P
S
→
M
+
P
:句子可改写成情态和命题两个部分
P → V + C 1 + ⋯ + C n P \to V + C_1 + \dots + C_n
P
→
V
+
C
1
+
⋯
+
C
n
:命题都可改写成一个动词
V V
V
和若干格
C → K + N P C \to K + NP
C
→
K
+
N
P
:格由格标和名词短语构成
格表
施事格:动作发生者
工具格:动作或状态牵涉到的无生命力量或客体
承受格:动作或状态影响的生物
使成格:动作或状态形成的客体或生物
方位格:所处空间方位
客体格:动作或状态影响的事物
受益格:动作为之服务的有生命对象
源点格:来源或起始位置
终点格:终点或终止位置
伴随格:共同完成动作的伴随者
……
用格语法分析语义:格框架约束分析
格框架表示:主要概念(动词) + 辅助概念(各种深层格)
分析基础:词典(动词需要的格、名词的语义信息)
分析步骤
判断主要动词,找出对应格框架
识别必备格
识别可选格
判断句子的情态
与句法分析结合
句法分析:判断名词、NP、PP
查找动词格框架与NP、PP的格关系
格语法描写汉语的局限性
汉语中的无动句、流水句、连动句、紧缩、动补、省略等结构无法描述
无法对句子进一步拆分分析
语义网络
语义网络:通过实体、概念或动作、状态及语义关系组成有向图表达知识、描述语义
图的节点表示实体或概念,边表示实体或概念之间的联系
边的类型:IS-A、PART-OF、IS、HAVE、BEFORE……
实体、概念或属性通常采用不同形状节点表示
事件的语义网络表示:施事、受事、时间等关系,由事件节点连结
事件的语义关系:分类、聚焦、推论、时间位置
问题
词的内涵和外延
网络的完备性
粒度划分
词义消歧
基本方法
基于规则的方法
统计机器学习方法(有监督 / 无监督)
不同词义一般发生在不同的上下文
基于词典信息的方法
有监督的词义消歧方法
建立分类器,利用划分多义词的上下文的类别以区分多义词的词义
互信息消歧方法
双语平齐的平行语料库,一个多义的A语单词在不同上下文中对应多种不同的B语翻译
语义指示器:决定A语言的语义的条件
词义消歧——语义指示器的分类问题
对多义词的译文
T 1 , … , T m T_1, \dots, T_m
T
1
,
…
,
T
m
,指示器取值
V 1 , … , V n V_1, \dots, V_n
V
1
,
…
,
V
n
,是一个Flip-Flop算法
随机将
T i T_i
T
i
划分为两个集合
P = { P 1 , P 2 } P = \{P_1, P_2\}
P
=
{
P
1
,
P
2
}
找到一个
V j V_j
V
j
的划分
Q = { Q 1 , Q 2 } Q = \{Q_1, Q_2\}
Q
=
{
Q
1
,
Q
2
}
,使得
Q i Q_i
Q
i
和
P i P_i
P
i
的互信息最大
找到一个改进的划分
P ′ P^\prime
P
′
,使得
P ′ P^\prime
P
′
和
Q Q
Q
的互信息最大
重复后面两个步骤
指示器取值确定后:
对出现的歧义词,指示器值为
V i V_i
V
i
若
V i V_i
V
i
在
Q 1 Q_1
Q
1
中,语义确定为语义1,否则为语义2
基于贝叶斯分类器的方法——第二章
基于最大熵的方法——第二章
基于词典的方法
语义定义消歧:词典中词条本身的定义作为判断其语义的条件
义类辞典(thesaurus)消歧:多义词不同义项使用时往往具有不同的上下文语义类
双语词典消歧:针对A语言x和y的搭配关系,在B语言中计算不同x的对应义项与y的搭配关系
Yarowkskyi消歧:两个基本限制
每篇文章只有一个意义(存在问题)
每个搭配只有一个意义(取最可能搭配)
无监督的词义消歧方法
对一个词的多个义项
s i s_i
s
i
,计算上下文中出现
v j v_j
v
j
的概率
p ( v j ∣ s i ) p(v_j | s_i)
p
(
v
j
∣
s
i
)
p ( v j ∣ s i ) p(v_j | s_i)
p
(
v
j
∣
s
i
)
的估计在无标注语料上进行,EM算法估计
问题:很多同义词的同一个意义常出现的上下文往往有很大差异
语义角色标注
任务目标:自动语义角色标注,以句子为分析单位,以句子谓词为核心,分析句子中的其他成分与谓词之间的关系
一般在句法分析基础上进行
主要用途:信息抽取、自动文摘、机器翻译
两类语义角色
与具体谓词直接相关,ARG0通常为施事者,ARG1通常表示动作的影响
起修饰作用的辅助性角色,ARGM开头,表示时间、地点和一般修饰
主要框架
PropBank
NomBank(聚焦到名词短语身上)
标注方法
句子——(句法分析器)——句法分析结果——(候选论元剪除)(尽量减少候选项的数目)——(论元识别)(论元的二分类问题)——(论元标注)(多分类问题)——(后处理)(删除重复论元)——SRL结果
基于短语结构句法分析的SRL方法
候选论元剪枝
将谓词作为当前节点,依次考察其兄弟,若非并列关系,则视作候选项;若兄弟为PP,其子节点亦作为候选项
将其父设为当前节点,重复上一步
论元识别和标注
分类问题
有效特征
谓词本身
沿树到达谓词的路径
其他特征P65
分类:贝叶斯、最大熵、SVM、感知机
基于依存关系的SRL方法
一个论元被表示为连续的几个词和一个语义角色标签(中心词 + 语义角色)
谓词与论元的关系可以视为谓词与中心词的关系
候选论元剪枝
谓词作为当前节点,所有孩子作为候选项
其父设为当前节点,重复上述过程
论元识别和标注
常用特征
谓词
谓词词义
其他特征P70+P71
基于语块分析的SRL方法
序列标注问题
BIO方式定义序列标注的标签集,将不同的语块赋予不同的标签
不需要剪除候选论元(局部语义分析),论元识别和标注同时进行
主要问题
句法分析器性能的严重依赖
领域适应能力差
分布式
语义表示
基于图像学习词汇语义表示
特征描述子(SIFT)直接提取图像关键点特征
利用CNN提取图像特征
基于语言学习词汇语义表示
利用升学特征
基于多模态信息学习词汇语义表示
same weight
different weight
针对多模态信息融合的分布式表示学习
利用关联词对作为弱监督信号
学习单模态向量表示
补全没有图像表示的词汇的图像表示
利用门机制作为不同模态的权重
用关联词对作为监督信号,互相接近,利用最大间隔作为目标函数
问题:一些信息并不在文本中出现(颜色、气味)
忽视了模态之间的相关性
级联方式不能很好融合模态信息
没考虑到不同类型词汇对模态的依赖性——具象词、抽象词
多路通道融合编码
模态关联 + 单词关联(不同模态依赖程度) + 门机制
融合词汇内部结构的中文句子表示模型
不同类型字对词汇含义影响不同
原子词汇表示和组合词汇表示对最终此汇含义影响不同
针对多模态词汇表示的可解释性研究
表针相似性分析方法和大脑的成分语义表征解释
不同模态特征相似性学习
不同维度特征做对比
维度与特征之间的相关性分析
不同模态得到的词汇表示编码了不同类型的属性(视觉——感知特征,词汇——抽象特征)
词汇语义表示模型在实体词和抽象词上的表示不同(实体词——感知特征,抽象词——抽象特征)
借鉴人类注意力分配机制的句子语义表示
惊异度Surprisal:人在某一个词上注意力的多少
注意力模型是否与人阅读时的眼动数据一致?Yes!
研究对比不同类型分布式句子表示在人脑语义解码上的性能表现
fMRI图像跟踪
句子中不同词贡献语义不同
句子语义与其结构紧密相关
相似度解码:fMRI与文本表示的统一相似度度量
回归解码:二者的联系
句子表示:非结构化(朴素池化 / 复杂池化) / 结构化(无监督 / 监督)
训练过程:训练——测试(相似性训练)——排序(效果评价)
非结构化模型中,最大池化表现最差,最大池化 + 平均池化结合效果很好
监督结构化模型表现显著优
不同回归方法有着不一样的表现
人脑分布集中在语言区和视觉区
如何从神经影像数据中重构相关的语义信息
不同fMRI与不同类型词汇的对应关系
三种刺激
图像 + 单词
句子
词云(中心词 + 相关词)
三种类型词:动词、名词、形容词
图像+单词分布最稳定,与VGG搭配最好;句子和词云与ELMo搭配最好
不同类型的词应采用不同的表示方法
不同模态的刺激激活不同的脑区
利用计算方法寻找语义和语法表征的脑区
解纠缠的特征表示模型
解纠缠模型构建(句法、语义)
进行相似性编码分析
语义特征更加鲁棒(无顺序结构的约束)
句法和语义很难区分得开
NLP——探索大脑语言的认知机理的可能
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/Guff_9hys/article/detail/751379
推荐阅读
article
taro
跳转
客服
页面,
taro
跳转微信
客服
,
Taro
.openCustomerServiceCha...
react,
taro
跳转
客服
,微信
客服
_
taro
.opencustomerservicechat
taro
.opencus...
赞
踩
article
Flink
计数器
Accumulator
...
通常,不需要直接定义
Accumulator
接口的实现,因为
Flink
已经为提供了一些内置的 Accumulato...
赞
踩
article
归并
排序
递归
实现
+
非
递归
实现
(C语言版)_
归并
排序
非
递归
c
语言...
本篇文章我将主要向大家介绍
归并
排序
的
递归
实现
和
非
递归
实现
。文章目录1.
归并
的思想2.
归并
排序
的
递归
实现
3.
归并
排序
...
赞
踩
article
美国
对外实行
制裁
,
致多个
地区
GitHub
账号
使用
受限!...
下午在逛 Hacker News 的时候
,
看到了这么一则帖子:My
GitHub
account has been re...
赞
踩
article
vue3
的优质
UI
库
_
vue3
后台
ui
库
...
vue3
.0的优质
UI
库
_
vue3
后台
ui
库
vue3
后台
ui
库
...
赞
踩
article
Flink
资源
静态调度...
本内容是根据 FLink 1.18.0-sacla_2.12 版本源码梳理而来。本文主要讲述任务提交时,为 Task 分...
赞
踩
article
HMC
的
升级
方法...
http://blog.51cto.com/manganese/1252677 转载于:https://www.cn...
赞
踩
article
如何
自制
一个
Spring
Boot
Starter
并推送到
远端
公服...
借助于 JitPack这个 “
远端
公服”来为我们托管
自制
的
Spring
Boot
Starter
。如何
自制
一个
Spri...
赞
踩
article
【
Spark
】
数据
倾斜
_
spark
streaming
会
出现
数据
倾斜
吗...
一、含义、危害计算
数据
时,
数据
分散度不够,导致大量
数据
集中到一台或几台机器上计算。局部计算远低于平均计算速度,整个过程过...
赞
踩
article
[AIGC] 如何使用
Dreambooth
将任何东西放入
Stable
Diffusion
(Col...
Dreambooth
由 Google 研究团队于 2022 年发布,是一种通过将自定义主题注入模型来微调扩散模型(如稳定...
赞
踩
article
LeetCode
算法
:
移动
零
c++
_
移动
0
c++
代码...
LeetCode
算法
:
移动
零
c++
_
移动
0
c++
代码
移动
0
c++
代码 ...
赞
踩
article
思科
模拟器
实验7:
OSPF
配置
命令
...
本章我们学习了简单的ospf
命令
,供大家参考与学习。_ospf
配置
命令
ospf
配置
命令
...
赞
踩
article
自然语言
处理
学习笔记-
lecture1
-绪论_
自然语言
的
基本特征
序列
性 。...
自然语言
处理
绪论,包括方向、发展历史、学术机构等等_
自然语言
的
基本特征
序列
性 。
自然语言
的
基本特征
序列
性 。 ...
赞
踩
article
动态
路由
OSPF
配置
——思科模拟器学习_
三层
交换机
ospf
配置
...
你喜欢的动态
路由
OSPF
配置
_
三层
交换机
ospf
配置
三层
交换机
ospf
配置
...
赞
踩
article
Linux
权限
提
升
总结_
linux
提
权
限(1)_
linux
提
权
风险...
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。深知大多数...
赞
踩
article
vxe
-
table
表格
过滤某一列的
关键字
查询
,不需要调后端接口
_
vxe
-
table
的筛选怎么增加查...
先上效果图:方法:在
vxe
-
table
-column标签里面用一个卡槽写一个input 标签
[详细]
-->
赞
踩
article
【
ROS2
机器人
入门到实战】
机器人
仿真
介绍
_
ros2
仿真
...
大家好,我是小鱼,本节课我们主要对
机器人
仿真
进行
介绍
,同时对
ROS2
支持的常用
仿真
平台进行
介绍
。
_
ros2
仿真
ros2
仿...
赞
踩
article
Python
怎么
循环
计数
:深入解析与
实践
_
python
循环
计数
...
在
Python
编程中,
循环
计数
是一项基础且重要的技能。无论是处理列表、遍历文件,还是执行重复任务,
循环
计数
都发挥着不可或...
赞
踩
article
Redis
数据
迁移
的几种方式实践_
redis
数据
迁移
...
Redis
数据
迁移
的几种方式实践_
redis
数据
迁移
redis
数据
迁移
背景 新上了一...
赞
踩
article
react
前后
端
同构
渲染
_
react
前后
端
交互
的
逻辑描述...
前后
端
同构
渲染
:当客户
端
请求一个包含React组件页面
的
时候,服务
端
首先响应输出这个页面,客户
端
和服务
端
有了第一次交互。...
赞
踩
相关标签
taro
flink
算法
大数据
数据结构
排序算法
c语言
ui
vue.js
前端
big data
java
spring boot
后端
AIGC
stable diffusion
leetcode
c++
移动零
双指针
网络
自然语言处理
学习
人工智能