赞
踩
MatchPyramid来自Liang Pang等在2016发表的一篇文章Text Matching as Image Recognition,大意为利用图像识别的方式进行文本匹配。
对于文本匹配,基本思路如下述公式:
其中T为文本,函数
θ
θ
θ代表将文本转换为对应的表示,函数
F
F
F则代表两个文本表示之间的交互关系。
由侧重点不同可分为表示方法与交互方法,即注重
θ
θ
θ或者
F
F
F,而MatchPyramid应属于后一种。
构建文本与文本的相似度矩阵,采用CNN对矩阵进行特征抽取,最后用softmax获得分类概率,评价方法为交叉熵,如下:
由于CNN针对的是网格型数据,而文本显然属于序列数据,那么就有必要对数据进行转换,论文中提出了三种构建相似度矩阵的方法:
0-1类型,每个序列对应的词相同为1,不同为0
cosine距离,使用预训练的Glove将词转为向量,之后计算序列对应的词的cosine距离
点积,同上,但是将cosine距离改为点积
作者在文中提到,距离矩阵使用点积的效果相对较好。
后续利用两层的CNN对相似度矩阵进行特征抽取,这里要注意的是由于上一层的相似度矩阵shape不一致,在第一层CNN后面进行maxpool的时候,要使用动态pool,有没有其他的小trick就不可得知了。
最后用两层的全连接对CNN的结果进行转换,使用softmax函数得到最终分类概率。
作者使用论文中的模型,在kaggle的quora数据集中得到一个相当不错的分数,最终小组成绩达到了第四名。
附实现地址:https://github.com/faneshion/MatchZoo
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。