赞
踩
这里主要的内容来自庞亮博士的一篇综述性论文,后面会放出论文的参考地址。
深度文本匹配模型可以分为三类:
基于单语义文档表达的深度学习模型
基于单语义文档表达的深度学习模型主要思路是,首先将单个文本先表达成一个稠密向量(分布式表达),然后直接计算两个向量间的相似度作为文本间的匹配度。
基于多语义文档表达的深度学习模型
基于多语义的文档表达的深度学习模型认为单一粒度的向量来表示一段文本不够精细,需要多语义的建立表达,更早地让两段文本进行交互, 然后挖掘文本交互后的模式特征, 综合得到文本间的匹配度。
直接建模匹配模式的深度学习模型
而直接建模匹配模式的深度学习模型则认为匹配问题需要更精细的建模匹配的模式
这里说白了就是我们模型需要克服和解决的一些困难,解决实际问题的时候我们往往需要面对的也是这些问题。
传统文本匹配依赖于大量的人工特征,泛化能力比较差,深度文本匹配可以自动提取特征,层次结构也更加好。
卷积神经网络的卷积核的结构能够建模局部化信息,并有平移不变性的特性,堆叠起来的卷积层可以很方便地模拟语言层次化的特性。而循环神经网络更偏向于序列化建模,类似人类阅读文本的方式每次将历史的信息压缩到一个向量,并作用于后面的计算,符合建模文本的序列性。
两个基本问题:如果做文档的语义表示和如何计算语义表示的相似性
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。