搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
盐析白兔
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
求1到10000的水仙花数(c语言)_求10万以内的水仙花数
2
AI大模型探索之路-实战篇8:多轮对话与Function Calling技术应用_ai大模型探索之路-实战篇8:多轮对话与function calling技术应用
3
【验证码哪家强?六大验证平台评测】
4
Python Cookbook(第3版)pdf
5
图像融合论文:CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion
6
漏洞管理与防御策略_技术漏洞管理策略
7
清华教授用时一月亲自整理,Python超详细的基础笔记_python清华出版社知识点总结
8
算法讲解之分治算法
9
快速入门使用Redis缓存_redis缓存怎么用
10
详细说说机器学习在医疗领域的应用_机器学习在医疗领域应用
当前位置:
article
> 正文
UCAS - AI学院 - 自然语言处理专项课 - 第10讲 - 课程笔记_xinshuai dong ucas
作者:盐析白兔 | 2024-06-24 02:12:50
赞
踩
xinshuai dong ucas
UCAS - AI学院 - 自然语言处理专项课 - 第10讲 - 课程笔记
篇章分析
概述
篇章表示理论
篇章关系分析
篇章分析应用
篇章分析
概述
NLP处理单位
字——编码、输入法
词、短语——形态分析、汉语分词、词性标注、词义消歧、NER
句子——句法分析、语块分析、语义角色标注
篇章——机器翻译、篇章推理、问答系统、自动摘要、情感分类
现有有关篇章的分析任务都是基于句子的,因此性能很差
篇章表示理论
词汇链:一组由类似含义的相同词汇连接起来的句子
事件链:一组由动词即相关实体连接起来的句子——三元组
抽取实体词汇链
抽取词汇链上最近的谓词——论元,构成事件链
判断相邻事件之间的关系
话题链:一组以名词回指、代词回指、零型回指形式的话题连接起来的句子
回指:一个词或短语在语篇中用于指代同一语篇中的另一词或短语的概念
关联词可以用于描述逻辑关系
修辞结构理论RST
语篇由各个具有重要功能的部分构成,较小的部分按照一定的关系模式组成更大的部分,直至成篇
一段文字要被确认为语篇,各部分要有机地结合,形成整体性和连贯性——内在功能——中心目的
语篇构成:两个基本部分组成一个较大的部分,不但组成,直到称为语篇——层次化结构
语篇结构
类型结构:语篇的题材或类型特征,相对固定
句法结构
关系结构:同一性,不因结构层级改变而不同——主要结构
不对称性在关系结构中占主导地位——核心-辅助关系
各种关系:P15
汉英篇章树库 CDTB vs. PDTB
汉语隐式关系更多
其他理论:P20
篇章关系分析
基本任务:篇章——一组关系
显式关系或者隐式关系
两个篇章论元机器之间的关系
三大任务
关联词识别
Arg抽取
Arg1和Arg2之间的篇章功能类型判断
有时arg称为基本篇章单元
基本分析流程
锚词识别——列出候选(标签、词典),识别
论元抽取——抽取锚词对应的论元对
论元关系分类——预测两个抡元之间的关系
论元标注——最终确定并标注论元关系
锚词识别
显式关系:关联词表
隐式关系:标点符号
句中MOS
句末EOS
识别特征P27
论元抽取
观察
Arg1和Arg2通常在一个句子里,或则邻近两句
一个论元由一个或几个连续的句子组成
显式的Arg2与关联锚词在同一个句子中
大多数情况下,Arg1和Arg2的跨度范围是邻近的,之间没有其他子句
扩展种子论元对
确定句子范围
显式:由Arg1位置决定
隐式:由锚点位置决定(MOS / EOS)
生成种子论元对
显式
SS(同句论元对),那么Arg2可能在左侧,也可能在右侧,需要一个分类器
PS(异句论元对),当前有连接词的子句与前面一个子句构成论元对
隐式:标点左右两个句子
扩展种子
方向:向左 / 向右
逐子句考察
选择最长的边界
通过分类器确定扩展范围
关系类型识别:分类
论元标注:分类
确定Arg1和Arg2孰前孰后
错误分析
组合关联词识别错误
关联词在剧中的情形不好判断
篇章分析应用
机器翻译
RS-tree-to-String 统计翻译模型
由论元关系考察是否调整句子顺序(不同语言的关系呈现不同)
融合篇章结构的神经机器翻译
位置编码
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/盐析白兔/article/detail/751369
推荐阅读
article
微信小
程序
自定义
tabBar
_微信小
程序
自定义
tabbar
组件...
微信小
程序
自定义
tabBar
_微信小
程序
自定义
tabbar
组件微信小
程序
自定义
tabbar
组件 ...
赞
踩
article
流体
力学
(
水力学
)满分
实验报告
——
流体
静力学
_
流体
静力学
实验报告
...
流体
力学
(
水力学
)满分实验——
流体
静力学
_
流体
静力学
实验报告
流体
静力学
实验报告
...
赞
踩
article
apk被
play
protect
blocked
的解决方案(ADB+
Appium
+webdriver...
解决apk被
play
protect
blocked
的解决方案(ADB+
Appium
+
webdriverio
)_bloc...
赞
踩
article
基于
vue
的
图书
管理系统
(源码+开题)_
基于
vue
框架
的
图书
管理系统
...
本研究
的
意义在于,通过
基于
Vue.js
的
图书
管理系统
,实现了
图书
管理
的
自动化和智能化,极大提升了
图书
管理
的
效率和准确性。...
赞
踩
article
机器学习-基础
算法
最小
二乘
回归
...
线性
回归
——
最小
二乘
回归
统计
回归
方法之一,通过
最小
化误差的平方进行最佳匹配。如图 设一元线性函数为y=a0+a1x ...
赞
踩
article
基于
Keras
的
手写数字识别(附源码)_
深度
学习
实战:
基于
keras
的
手写数字识别(非常详细、
代码
开...
这样,你可以为每个机器
学习
模型创建一个独立
的
虚拟环境,并在其中安装所需
的
Python版本和库版本,从而确保每个模型都能在...
赞
踩
article
PHP
实现
登录
和
注册
(
附源码)_
登录
注册
php
源码...
在桌面找到该软件后双击打开它,就可以看到如下页面,然后我们需要在该集成包中下载一些软件下载之后就回到主页去看,本次的案例...
赞
踩
article
在
英特尔
®酷睿™
Ultra
处理器
上优化和部署
YOLOv8
模型
_搭载
英特尔
ultra
处理器
的
电脑怎么安...
英特尔
®酷睿™
Ultra
处理器
内置了CPU、GPU和NPU,相比之前,无论是能耗比、显卡性能还是AI性能,都有显著提升;...
赞
踩
article
NLP-TF2.0-
C3W1L6
-
Padding
_
nlp
padding
...
Coursera课堂笔记Natural Language Processing in TensorFlowC3W1L3-...
赞
踩
article
Proteus8
仿真:51
单片机
LCD1602
显示_
proteus8lcd1602
...
【代码】
Proteus8
仿真:51
单片机
LCD1602
显示。工程文件含HD44780文档,本次实验由
LCD1602
显示时...
赞
踩
article
GitCode
-
开
源代码托管
平台
...
GitCode
-
开
源代码托管
平台
GitCode
是一个
开
源的代码托管
平台
,它允许
开
发者创建、分享和协作
开
发各种类型的...
赞
踩
article
删库
遭
GitHub
封号
,
开发者
欲夺回发行权:“我只是犯
了
个
编程错误”_
mock
作者
删库
跑路...
删库
一时爽
,
后悔没商量!2022 年伊始
,
开源届炸开
了
锅
,
这边还在费尽心思尝试各种检测与修复方法减少 Log4j 2 漏...
赞
踩
article
毕业设计:基于
java
的web
校园
二手
平台
系统
设计与实现_
校园
二手
物品
交易
系统
的
参考文献
...
基于Java的Web
校园
二手
平台
系统
设计与实现的性能评估是对
系统
在特定工作负载下的响应速度和资源利用率进行评估和分析,旨...
赞
踩
article
Node
.
js
毕业设计基于web
前端开发
的校园
二手
物品
交易网站(
Express
+附源码)_
二手
自由市...
其次,该平台可以为在校师生提供一个安全、可靠的交易环境,降低交易风险。最后,通过本项目的开发,可以锻炼学生的编程能力,提...
赞
踩
article
Gi
t
代码检查error解决 ‘
charmap
‘
codec
can
‘
t
encode
chara...
这个错误通常是由于输出的内容包含一些非ASCII字符,而默认字符集不支持这些字符的编码,导致抛出Unicode编码错误。...
赞
踩
article
【
Python
】成功
解决
UnboundLocalError
:
local
variable
‘a‘ ...
unbound
local
error 【
Python
】成功...
赞
踩
article
provider
:
命名
管道提供程序,
error
:
40
- 无法打开到
SQL
Server
的连接 (M...
1、启用TCP/IP2、添加1433出站和入站规则更多参考:
://www.cnblogs.com/zgqys...
赞
踩
article
与量化相关的
pytoch
准备工作_深度
学习
中地
hook
函数
需要
remove
吗...
2.torch.nn.Module.register_forward_
hook
(
hook
):对于模型中的每个层,可以使用...
赞
踩
article
关于什么是
前端
的
同构
_
前端
同构
...
同构
(isomorph)一词,这个概念本来是来源于数学,具体自行查阅,下面是以介绍在JS中
的
同构
概念。在
前端
,
同构
Jav...
赞
踩
article
Linux
内核
提权漏洞_
xorg
-x11-
server
< 1.20.3 -
local
priv...
内核
版本5.11.4、5.10.21、5.4.103、4.19.179、4.14.224、4.9.260 和 4.4.2...
赞
踩
相关标签
微信小程序
小程序
经验分享
appium
play protect
blocked
webdriverio
vue.js
前端
javascript
人工智能
数据结构与算法
keras
深度学习
php
html5
css
nginx
YOLO
OpenVINO
英特尔开发套件
51单片机
单片机
嵌入式硬件