搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
盐析白兔
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
openwrt的openclash提示【更新失败,请确认设备闪存空间足够后再试】_版本内核更新失败,请确认设备闪存空间足够后再试!
2
二:ShardingJDBC核心概念与快速实战_sharding jdbc key-generator
3
flask中使用原生sql语句_flask 原生sql
4
出奇制胜:绕过Cloudflare验证的神秘方法_cloudflare验证过不去
5
Python简介_python扩展是什么
6
大数据-Hadoop-云服务器的搭建_hadoop云盘搭建
7
Springboot + Mybatis Plus + ShardingSphere 5.1.0 实现多分片键自定义配置分表_shardingsphere5.1.0的分片算法
8
带你从源代码详细分析View的绘制过程_源码view绘制过程
9
【数据开发】DW数仓分层设计架构与同步策略(ODS、DWD、DWS等字段含义)_dws数据仓库
10
用ChatTTS 朗读《我的阿勒泰》里面的文章《我所能带给你们的事物》_chattts 小说
当前位置:
article
> 正文
UCAS - AI学院 - 自然语言处理专项课 - 第10讲 - 课程笔记_xinshuai dong ucas
作者:盐析白兔 | 2024-06-24 02:12:50
赞
踩
xinshuai dong ucas
UCAS - AI学院 - 自然语言处理专项课 - 第10讲 - 课程笔记
篇章分析
概述
篇章表示理论
篇章关系分析
篇章分析应用
篇章分析
概述
NLP处理单位
字——编码、输入法
词、短语——形态分析、汉语分词、词性标注、词义消歧、NER
句子——句法分析、语块分析、语义角色标注
篇章——机器翻译、篇章推理、问答系统、自动摘要、情感分类
现有有关篇章的分析任务都是基于句子的,因此性能很差
篇章表示理论
词汇链:一组由类似含义的相同词汇连接起来的句子
事件链:一组由动词即相关实体连接起来的句子——三元组
抽取实体词汇链
抽取词汇链上最近的谓词——论元,构成事件链
判断相邻事件之间的关系
话题链:一组以名词回指、代词回指、零型回指形式的话题连接起来的句子
回指:一个词或短语在语篇中用于指代同一语篇中的另一词或短语的概念
关联词可以用于描述逻辑关系
修辞结构理论RST
语篇由各个具有重要功能的部分构成,较小的部分按照一定的关系模式组成更大的部分,直至成篇
一段文字要被确认为语篇,各部分要有机地结合,形成整体性和连贯性——内在功能——中心目的
语篇构成:两个基本部分组成一个较大的部分,不但组成,直到称为语篇——层次化结构
语篇结构
类型结构:语篇的题材或类型特征,相对固定
句法结构
关系结构:同一性,不因结构层级改变而不同——主要结构
不对称性在关系结构中占主导地位——核心-辅助关系
各种关系:P15
汉英篇章树库 CDTB vs. PDTB
汉语隐式关系更多
其他理论:P20
篇章关系分析
基本任务:篇章——一组关系
显式关系或者隐式关系
两个篇章论元机器之间的关系
三大任务
关联词识别
Arg抽取
Arg1和Arg2之间的篇章功能类型判断
有时arg称为基本篇章单元
基本分析流程
锚词识别——列出候选(标签、词典),识别
论元抽取——抽取锚词对应的论元对
论元关系分类——预测两个抡元之间的关系
论元标注——最终确定并标注论元关系
锚词识别
显式关系:关联词表
隐式关系:标点符号
句中MOS
句末EOS
识别特征P27
论元抽取
观察
Arg1和Arg2通常在一个句子里,或则邻近两句
一个论元由一个或几个连续的句子组成
显式的Arg2与关联锚词在同一个句子中
大多数情况下,Arg1和Arg2的跨度范围是邻近的,之间没有其他子句
扩展种子论元对
确定句子范围
显式:由Arg1位置决定
隐式:由锚点位置决定(MOS / EOS)
生成种子论元对
显式
SS(同句论元对),那么Arg2可能在左侧,也可能在右侧,需要一个分类器
PS(异句论元对),当前有连接词的子句与前面一个子句构成论元对
隐式:标点左右两个句子
扩展种子
方向:向左 / 向右
逐子句考察
选择最长的边界
通过分类器确定扩展范围
关系类型识别:分类
论元标注:分类
确定Arg1和Arg2孰前孰后
错误分析
组合关联词识别错误
关联词在剧中的情形不好判断
篇章分析应用
机器翻译
RS-tree-to-String 统计翻译模型
由论元关系考察是否调整句子顺序(不同语言的关系呈现不同)
融合篇章结构的神经机器翻译
位置编码
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/盐析白兔/article/detail/751369
推荐阅读
article
2024年
安卓
最全
安卓
期末
大
作业
Android
studio
(1)
,
十
大
高频
面试
问题_
安卓
studi...
今天关于
面试
的分享就到这里
,
还是那句话
,
有些东西你不仅要懂
,
而且要能够很好地表达出来
,
能够让
面试
官认可你的理解
,
例如Ha...
赞
踩
article
Linux
系统安全
基础浅识...
系统安全
的初步认识
Linux
系统安全
基础浅识
Linux
系统安全
&nbs...
赞
踩
article
IBM
P
系列
小型机
HMC
默认
I
P
地址
...
IBM
小型机
通过
HMC
管理和维护特别的方便和便捷,但是很多情况下,我们不知道后端
HMC
的管理
I
P
地址
。现将
小型机
上
HMC
...
赞
踩
article
【
Elasticsearch
】
Elasticsearch
filter
和
query
的
不同_接口
过滤器
...
查询上下文中,查询操作不仅仅会进行查询,还会计算分值,用于确定相关度;在
过滤器
上下文中,查询操作仅判断是否满足查询条件过...
赞
踩
article
Elastic
Search
根据
匹配
分和
热
度
分
排序
_
es
根据
匹配
度
排序
...
排序
匹配
分*0.8+
热
度
分*0.2。
匹配
分、
热
度
分归一化。_
es
根据
匹配
度
排序
es
根据
匹配
度
排序
...
赞
踩
article
pytorch
实现
---
手写
数字
识别
_
人工智能
手写
数字
识别
是怎么
实现
的...
使用
pytorch
实现
手写
数字
识别
,十分简单的小项目,环境搭建好,一跑就通。_
人工智能
手写
数字
识别
是怎么
实现
的
人工智能
手...
赞
踩
article
Windows
C++
应用软件
开发
从入门到精通详解_
windows
程序
开发
...
本文详细介绍一下
Windows
平台下用
C++
开发
应用软件
的诸多内容,以供大家借鉴或参考。_
windows
程序
开发
win...
赞
踩
article
Redis
持久化之
RDB
_
redis
-
server
.
exe
!rdbsavelzfstringobje...
本篇着重记录下
Redis
下的持久化
RDB
(
Redis
Database)。一、原理: 我们通俗的说法就是快照,即在某个时...
赞
踩
article
泰坦尼克号
python
数据
分析
统计服_Python-
数据
可视化
案例
分析
之
泰坦尼克号
(二)......
在第一节“Python-
数据
清洗与
分析
案例之
泰坦尼克号
(一)”网址:https://www.lixdx.cn/archi...
赞
踩
article
python
venv
部署_
python
venv
部署...
virtualenvPython2 和 Python3 均支持的方式安装pip install virtualenv创建...
赞
踩
article
区块
链
商用案例:
网间
结算
联盟
链
建设实战
_
结算
链
...
上
链
方式依据不同数据场景进行选择,有哈希上
链
(将原数据计算出哈希值后进行上
链
,适用于大文件场景)、数据格式化上
链
(数据按...
赞
踩
article
Py
torch
笔记3-
2
:
“
张量
操作
(
补充)”_
torch
张量
自动补齐...
文章目录前言二、使用步骤1.引入库
2
.读入数据总结前言提示
:
# 一、pandas是什么?示例
:
pandas 是基于Num...
赞
踩
article
来
了
阿里终于
知道
专科
如何
进
大厂
_
专科
学历
能
进
大厂
吗...
前二天后台收到几个读者留言,有一位说自己工作两年,不
知道
从什么开始学,公司用的是SSM框架,只是会用。还有一位读者说自己...
赞
踩
article
论文阅读:
DreamBooth
:
Fine
Tuning
Text
-to-
Image
Diffusi...
一个新的个性化文生图模型方法:
DreamBooth
。给定几张参考图片,然后微调预训练的文生图模型,使得模型具备生成这些图...
赞
踩
article
2024年
Python
最新使用
Python
和
Twilio
通过短信通知主持
视频
办公时间
。
,2024年最...
别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走
。
我先来介绍一下这些东西怎么用,文末抱走...
赞
踩
article
Linux
学习笔记6
文件
操作
——
文件
描述符
_
ftruncate
: bad
file
descrip...
基于
文件
描述符
的
文件
操作
进程一启动,内核就打开了三个
描述符
,0(标准输入 STDIN),1(标准输出STDOUT), 2...
赞
踩
article
代码随想录训练营第
10
天|
LeetCode
:232.
用
栈
实现
队列
、225.
用
队列
实现
栈
...
第
10
天代码随想录训练营第
10
天|
LeetCode
:232.
用
栈
实现
队列
、225.
用
队列
实现
栈
...
赞
踩
article
JESD204B
参数理解_
204b
线
速率
计算公式
...
JESD204B
中各个参数的意义_
204b
线
速率
计算公式
204b
线
速率
计算公式
...
赞
踩
article
MySQL
导致磁盘高并发
解决方案
_
mysql
fsync
高...
默认参数为1,即每次提交
MySQL
将进行一次
fsync
之类的磁盘同步指令来将binlog_cache中的数据强制写入磁盘...
赞
踩
article
描述性
数据
分析
与图形
可视化
:
Python
实践_用
python
对大量
数据
描述性
统计且画图...
数据
分析
是当今社会中最重要的技能之一,因为
数据
在各行各业都扮演着至关重要的角色,并且随着越来越多的信息被收集和存储,
数据
...
赞
踩
相关标签
android
面试
学习
linux
系统安全
运维
后端
elasticsearch
filter
query
算法
归一化
函数
排序
人工智能
神经网络
深度学习
Windows
C++
Visual Studio
应用程序开发
C++语言特性
Windows系统特性
编程与调试技术
redis