赞
踩
文本分类任务概述
序列结构文本分类框架
神经词袋模型
循环神经网络
将文本序列看作时间序列,不断更新,最后得到整个序列的表示,这种表示中包含的是序列的顺序信息
问题:RNN属于“biased model”,一个句子中越往后的词重要性越高,这有可能影响最后的分类结构,因为对句子分类影响最大的词可能处在句子的任何位置。
循环+卷积神经网络
注意力神经网络
LSTM/CNN-GRU(篇章级-混合模型)
HAN(篇章级-Attention模型)
基于预训练模型(Bert):通过预训练模型形成句表示,然后将该句表示作为分类的输入
图结构文本分类方法
图卷积神经网络文本分类
根据任务对原文本加入附加信息并构建原文本与附加信息的关系图(将附加信息的结构信息融入文本),然后利用图卷积的方法提取文本有效的特征表示
步骤:
框架
例子1:对文本进行图卷积分类
例子2:短文本分类模型
问题:短文本信息含量少,用一般神经网络提取特征效果有限
解决:引入附加信息增强短文本信息然后采用图卷积方法提取有效特征
Graph构建
文本Graph结点特征表示
存在问题:结点异质,表示不同,如何构建结点表示?
方法1:将所有异质结点特征连接,形成同质特征结点然后采用普通图卷积方法——无法区分不同信息之间的差异
方法二:采用双重注意力机制(类型级+结点级)的异质图卷积方法
对于每个与V相邻的结点不但考虑了其类型的权重,还考虑了同一类型中各结点的权重
文本分类评价指标
孪生网络
交互聚合
基于预训练语言模型
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。