赞
踩
paper地址:2D Attentional Irregular Scene Text Recognizer.
继 Transformer-based-OCR 后又一篇基于语言、翻译模型架构的不规则文字识别的paper,主要贡献如下:
网络结构:
这是一个多层双向的transformer block,关于transformer block的具体信息,参见上篇曲形文字识别的博文:Transformer-based OCR;其中还是有几点值得说一下:
其中
上面为G直接decode,下面为经过一个BERT模块再decode,inference时取下面的结果为最终结果。
公共数据集上的表现:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。