赞
踩
Learning Deep Structured Semantic Models for Web Search using Clickthrough Data
Po-Sen Huang, Xiaodong He, Jianfeng Gao, Li Deng, Alex Acero, Larry Heck
University of Illinois at Urbana-Champaign, Microsoft Research
https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/cikm2013_DSSM_fullversion.pdf
隐含语意模型,比如LSA,旨在将query在语意层面映射到相关的文档,基于关键词的匹配通常效果不好。
这篇文章致力于开发一系列新的深层结构隐含语意模型,将query和文档映射到共享低维空间,其中给定query,文档的相关性已经计算好了,他们的相关性是利用距离来衡量的。
深层结构语意模型训练方式是判别性的,这是因为,其中利用点击数据针对给定query,计算点击文档的最大化条件似然度。为了将该模型用于大规模web搜索应用,作者们利用了词哈希,该操作可以有效扩展语意模型,使其能够处理大量词汇。
新模型在web文档排序的真实数据集上进行了测试,结果表明,其效果显著优于其他隐含语意模型。
现有深层模型细节描述如下
本文所提出的DSSM模型图示如下
DSSM详细描述如下
词嵌入方法简介如下
词哈希大小及冲突大小示例如下
学习过程简介如下
模型结构及训练相关的细节简介如下
数据集及预处理方法简介如下
下面是模型评估指标
几种方法的效果对比如下
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。