当前位置:   article > 正文

CIKM2013|深层结构语意模型DSSM在web搜索中的应用

2013年cikm会议dssm

Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

Po-Sen Huang, Xiaodong He, Jianfeng Gao, Li Deng, Alex Acero, Larry Heck

University of Illinois at Urbana-Champaign, Microsoft Research

https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/cikm2013_DSSM_fullversion.pdf

隐含语意模型,比如LSA,旨在将query在语意层面映射到相关的文档,基于关键词的匹配通常效果不好。

这篇文章致力于开发一系列新的深层结构隐含语意模型,将query和文档映射到共享低维空间,其中给定query,文档的相关性已经计算好了,他们的相关性是利用距离来衡量的。

深层结构语意模型训练方式是判别性的,这是因为,其中利用点击数据针对给定query,计算点击文档的最大化条件似然度。为了将该模型用于大规模web搜索应用,作者们利用了词哈希,该操作可以有效扩展语意模型,使其能够处理大量词汇。

新模型在web文档排序的真实数据集上进行了测试,结果表明,其效果显著优于其他隐含语意模型。

现有深层模型细节描述如下

本文所提出的DSSM模型图示如下

DSSM详细描述如下

 

词嵌入方法简介如下

词哈希大小及冲突大小示例如下

学习过程简介如下

模型结构及训练相关的细节简介如下

数据集及预处理方法简介如下

下面是模型评估指标

几种方法的效果对比如下

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/353984
推荐阅读
相关标签
  

闽ICP备14008679号