赞
踩
参考《论反讽的几种形式》
反讽的基本特征是:字面意义与深层意义 不一致,即 言在此而意在彼,如它以反讽性褒扬予以责备,或者以反讽性责备予以褒扬,这一基本特征存在于反讽的各种变体形式之中。反讽称为一种思维、感情和表达的模式。
反讽的形式可分为:言语反讽,情景反讽和戏剧反讽。
言语反讽(较明显)—— 局部性矛盾
在言语反讽中,说的是一回事,指的却是另外一回事。在言语反讽中不可避免地存在着表面意义和隐藏意义,语言外壳与真实意指之间的对照与矛盾就显得相当强烈和鲜明。进一步地,其大致包含四种情况:
情景反讽(隐蔽性)—— 整体性矛盾
戏剧反讽(
×
\times
×)
戏剧反讽来源于戏剧。它发挥作用在于观众(读者)的全知全能与剧中人的无知之间 的张力。在戏剧中,台下的观众知道事情的本末来由,但台上的人物却被蒙在鼓里,任由事情发展。反讽作品的故事是在两个层面上展开的,一个是叙述者或剧中人看到的表象,另一个是读者体味到的事实。通过表象与事实间的对立张力,产生强烈的艺术效果。二者的反差越大,反讽越鲜明。
反讽修辞的具体形式多种多样,依据反讽成因可将其分为三类,分别为:前后情感矛盾式反讽、情景反讽与其他反讽,其中第一类反讽占69.9%。基于上述分类,目前的研究可以分为基于内容(上下文无关)和基于上下文(上下文相关)两方面的反讽研究。
基于内容的反讽识别,又称为上下文无关的发讽识别,即不考虑识别目标句的上下文信息,仅仅从目标句本身出发判定其是否为反讽表达。
隐式情感包括:事实性隐式情感 和 修辞性隐式情感。反讽是一种修辞性隐式情感。
假设:目标句是否反讽与上下文无关。
上下文无关的反讽识别任务可分为 “词对矛盾”模型和 “半句对矛盾”模型。
1. “词对矛盾”模型
简介:针对句中的矛盾词对使用词对注意力机制,通过计算句中任意两个词的注意力分数得到注意力分数矩阵。在此基础上,可得到包含任意两个词的矛盾程度信息的句子表示。 最后,在监督信号的作用下迫使模型特别留意句子中的矛盾词。
为了能够关注到前后不一致(矛盾)的词对,模型可以记录词对注意力分数,并绘制注意力分数热力图提升模型的可解释性。计算注意力分数的两种方法:
(1)max pooling (2)二次 attention
上述注意力分数与词对向量结合,生成句子表示。然后进入分类层进行分类。
2. “半句对矛盾”模型
简介:将一句话分成两个半句,针对句子前半句与后半句的矛盾性, 利用孪生神经网络模型对“半句对”建模, 模型通过检测 两个半句 的一致性推断是否为反讽。还可以在孪生神经网络的基础上加入注意力机制,从而使模型突出两个半句中的关键词。可以看出, 在某种程度上 “半句对矛盾” 模型是对“词对予盾”模型的一种改进, 即由单一词级别扩展到了多个词(半句)级别。
孪生神经网络
孪生神经网络可看作一种“连体”的神经网络,即两个结构类似的子网络共享权重。主要思想:将一对样本映射到同一个目标空间(主要是通过共享权重实现),然后利用常用的距离函数(如:欧氏距离,余弦距离等)进行相似性对比。
网络结构如下图所示:
孪生网络是一种重要的图像或文本相似性判定模型。模型的输入:一对文本,输出:类别(1或0)。常用于样本种类多且每个类别的样本数量都很少的情况。
在孪生网络的基础上增加 self-attention 机制,可以使得孪生网络的左右两个子网络可以有侧重的关注某些重点词,使得两个半句的向量表示更加紧凑。
对抗学习 研究团队:哈尔滨工业大学 徐睿峰
CNN+注意力机制(对抗样本,领域迁移的对抗学习)
假设:反讽修辞本身是一种与上下文相关的表达方式。上下文,广义上包括叙述人的语调、表情、肢体动作,当时的心里状态,文本在长文中的环境,文本的转发、回复、评论情况等。
原则上,使用上下文信息可以极大提升自动化反讽识别的准确率上限。
常考虑的上下文信息包括:
基本思路:
社交文本(Twitter)存在的问题及常见处理方式:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。