当前位置:   article > 正文

【论文笔记】Chinese Named Entity Recognition Based on CNN-BiLSTM-CRF_cnn-bilstm-crf论文

cnn-bilstm-crf论文

主要思想

this paper proposes to use CNN to extract glyph- level features of Chinese characters 。卷积神经网络(CNN)从每个汉字中提取具有形态特征的字形嵌入,将其与具有语义特征信息的字嵌入连接起来,送入BiLSTM-CRF网络

利用汉字的字符级和根级表示的BiLSTM-CRF神经网络,在 MSRA数据集上实现最先进的性能90.95% F1。证明了基于字符的标注策略在没有中文分词结果的情况下也能达到相似的效果,这意味着汉字可以代替单词成为识别命名实体的最小单位。

汉字由图形组成,具有丰富的语义。对于一个中文学习者来说,通过这些图形组件来理解一个汉字的意思是很常见的。因此,我们提出了一种新的基于字符的CNN-BiLSTM-CRF模型,该模型利用字符符号增强汉字的表示。符号嵌入由CNN直接从字符的位图中提取,考虑了字符中的所有图形组件,而不限于偏旁部首。然后将符号嵌入和字符嵌入连接起来,得到语义特征信息,并输入到BiLSTM-CRF网络中。实验结果表明,在不依赖于人工设计特征和领域知识的情况下,该模型的F-scores达到91.09%。

 

 

cnn的输入是 Bitmap 字体

 

 

笔者认为此论文思想非常简单,甚至有点奇特,将中文字符映射为bitmap格式的图片,然后使用cnn来学习结构特征。但是cnn真的学习到了结构特征么?论文没有给出证明,应该用bitmap做一个cnn的汉字识别模型,来训练好cnn结构,提取出来的应该效果好些。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/961307
推荐阅读
相关标签
  

闽ICP备14008679号