赞
踩
回顾: 基于检索的问答系统
复杂度 O(n), n是知识库的大小. 所以必须降低复杂度
对句子进行过滤
假设有4个文档
词典是[我们, 今天, 运动, 昨天, 上, 课, 什么]
倒排表:
如果用户输入了"运动", 则可以直接返回[doc 1, doc 2]作为候选集合
如果用户输入了"我们 课", 则可以返回[doc 1, doc 2] ∪ \cup ∪ [doc 3, doc 4]
然后再用排序方法对候选文档进行排序
过滤的方法可以进一步改成, 选择至少包含两个关键词的文档
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
赞
踩
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。