当前位置:   article > 正文

详解文本分类之多通道CNN的理论与实践_多通道文本分类

多通道文本分类

导读

最近在梳理文本分类的各个神经网络算法,特地一个来总结下。接下来将要一个文章一个文章的讲解各个算法的理论与实践。目录暂定为:

  1. 多通道卷积神经网络(multi_channel_CNN)

  2. 深度卷积神经网络(deep_CNN)

  3. 基于字符的卷积神经网络(Char_CNN)

  4. 循环与卷积神经网络并用网络(LSTM_CNN)

  5. 树状循环神经网络(Tree-LSTM

  6. Transformer(目前常用于NMT)

  7. etc..

之后的以后再补充。今天我们先讲第一个,多通道卷积神经网络。

 

先前知识补充

先说点基础的,我们最刚开始的分类其实就是embedding层之后直接经过线性层进行降维,将其映射到分类上,图为:

然后因为参数太多,计算太慢,所以产生了pooling池化层,取指定维度的一个参数代表整个维度,从而大大降低了计算量,而且效果还不错。图为:

之后又有人想到没有充分的利用到句子的上下词语的关系,所以就讲图像算法的CNN运用到了NLP上,这个就相当于NLP里的n-gram(unigram,bigram,trigram...)一样,寻找相邻词语组合形成的特征。图为:

有了上面的基础,我们引出multi_channel_CNN就容易多了。

 

multi_channel_CNN

多通道,就是CNN中的一次性卷积要处理的多少组数据。比如图像中,如果是只有灰度值的图像就只有一个通道,如果是彩色图片的话,就会RGB三个图像(也就是三个通道)。那么NLP中怎么利用这个多通道特征呢?有人就想了NLP中不就一个句子长度 * embed维度组成的一个二维输入吗?是这样的,刚开始我们用的都是单通道的。

但是有人就提出了这样的想法:

初始化两个不同的embedding,将句子用两个embedding表示出来,这样就可以有两个通道了。

时间确实是这样的,但是我们常用的是一个是随机初始化的embedding,另一个是使用预训练embedding(w2v or GloVe ...)。图为:

 

实践

这个其实和图像是想的差不多了。(pytorch)

class Multi_Channel_CNN 初始化:

  1. def __init__(self, opts, vocab, label_vocab):
  2. super(Multi_Channel_CNN, self).__init__()
  3. random.seed(opts.seed)
  4. torch.manual_seed(opts.seed)
  5. torch.cuda.manual_seed(opts.seed)
  6. self.embed_dim = opts.embed_size
  7. self.word_num = vocab.m_size
  8. self.pre_embed_path = opts.pre_embed_path
  9. self.string2id = vocab.string2id
  10. self.embed_uniform_init = opts.embed_uniform_init
  11. self.stride = opts.stride
  12. self.kernel_size = opts.kernel_size
  13. self.kernel_num = opts.kernel_num
  14. self.label_num = label_vocab.m_size
  15. self.embed_dropout = opts.embed_dropout
  16. self.fc_dropout = opts.fc_dropout
  17. self.embeddings = nn.Embedding(self.word_num, self.embed_dim)
  18. self.embeddings_static = nn.Embedding(self.word_num, self.embed_dim)
  19. if opts.pre_embed_path != '':
  20. embedding = Embedding.load_predtrained_emb_zero(self.pre_embed_path, self.string2id)
  21. self.embeddings_static.weight.data.copy_(embedding)
  22. else:
  23. nn.init.uniform_(self.embeddings_static.weight.data, -self.embed_uniform_init, self.embed_uniform_init)
  24. nn.init.uniform_(self.embeddings.weight.data, -self.embed_uniform_init, self.embed_uniform_init)
  25. # 2 convs
  26. self.convs = nn.ModuleList(
  27. [nn.Conv2d(2, self.embed_dim, (K, self.embed_dim), stride=self.stride, padding=(K // 2, 0)) for K in self.kernel_size])
  28. in_fea = len(self.kernel_size)*self.kernel_num
  29. self.linear1 = nn.Linear(in_fea, in_fea // 2)
  30. self.linear2 = nn.Linear(in_fea // 2, self.label_num)
  31. self.embed_dropout = nn.Dropout(self.embed_dropout)
  32. self.fc_dropout = nn.Dropout(self.fc_dropout)

这个部分主要将输入的通道数1改为2即可。

 

数据流通部分:

  1. def forward(self, input):
  2. static_embed = self.embeddings_static(input) # torch.Size([64, 39, 100])
  3. embed = self.embeddings(input) # torch.Size([64, 39, 100])
  4. x = torch.stack([static_embed, embed], 1) # torch.Size([64, 2, 39, 100])
  5. out = self.embed_dropout(x)
  6. l = []
  7. for conv in self.convs:
  8. l.append(F.relu(conv(out)).squeeze(3)) # torch.Size([64, 100, 39])
  9. out = l
  10. l = []
  11. for i in out:
  12. l.append(F.max_pool1d(i, kernel_size=i.size(2)).squeeze(2)) # torch.Size([64, 100])
  13. out = torch.cat(l, 1) # torch.Size([64, 300])
  14. out = self.fc_dropout(out)
  15. out = self.linear1(out)
  16. out = self.linear2(F.relu(out))
  17. return out

这里主要就是一个stack函数的应用,将两个embedding放到一个新的维度里。

 

数据对比

可以明显看出多通道优点还是很突出的。

 

github地址:

https://github.com/zenRRan/Sentiment-Analysis/blob/master/models/multi_channel_CNN.py

欢迎fork,有问题大家尽管指出!

 

PS:上述图片均来自于导师张梅山,唐都钰的《Deep Learning in Natural Language Processing》的情感分析篇。


更多精彩内容,请关注 深度学习自然语言处理 公众号,就是下方啦!跟随小博主,每天进步一丢丢!哈哈!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/242621?site
推荐阅读
相关标签
  

闽ICP备14008679号