最近工作上需要做句子语义去重相关的工作,本质上这是属于NLP中text matching(文本匹配)相关的内容。因此我花了一些时间整理了一些关于这个方向的资料,整理如下(也许会持续更新):
- BiMPM: https://weibo.com/1402400261/F40cs8tIX?type=comment#_rnd1563284472799
- 文本匹配的综述: https://blog.csdn.net/xiayto/article/details/81247461
- 知乎:如何判断两个文本说的是同一件事情? https://www.zhihu.com/question/56751077
- https://engineering.quora.com/Semantic-Question-Matching-with-Deep-Learning
- https://www.kaggle.com/quora/question-pairs-dataset(quroa 在kaggle上举办的title 语义去重的比赛)
- 蚂蚁金服文本语义相似度比赛:
官方地址: https://dc.cloud.alipay.com/index?click_from=MAIL&_bdType=acafbbbiahdahhadhiih#/topic/intro?id=3
选手代码解析:https://blog.csdn.net/u014732537/article/details/81038260
- 知乎,papers of text matching:
https://zhuanlan.zhihu.com/p/27441587
https://zhuanlan.zhihu.com/p/27443681
- matchzoo: 用于 text match 的 统一集成框架,github地址:https://github.com/NTMC-Community/MatchZoo
- awesome-neural-models-for-semantic-match(一系列的文本语义匹配paper & code):https://github.com/NTMC-Community/awesome-neural-models-for-semantic-match