赞
踩
1).要对被搜索字段的文本进行全部扫描,效率太低.比如商品描述,如果内容上千字的话,需要从头到尾全盘扫描.
2).不能分词检索.只能匹配连续的内容.比如:搜索关键词:中国移动联通,那么不能匹配:中国移动,中国联通等.
全文搜索:
类似于通过字典的检索字表查字的过程.
计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。
倒排索引(inverted index)
根据属性值来确定记录该属性值的各记录的位置.
由于不是根据记录来确定属性值,而是由属性值来确定记录的位置,因而成为倒排索引.
1.Lucene就是一个jar包,里面包含了封装好的各种建立倒排索引,以及进行搜索的代码,包括各种算法.开发的时候,引入lucene jar,然后基于lucene的api进行开发就可以了.
使用lucene,我可以将已有的数据建立索引,lucene会在本地磁盘上,给我们组织索引的数据结构.另外,我们也可以用lucene提供的一些功能和api来针对磁盘上的索引数据,进行搜索.
2…当被搜索数据量很大的时候,一台机器放不下,信息在不同的服务器上,一般的搜索需要分别和多个服务器进行通信.(无法满足高性能)
信息保存在不同的服务器上,如果某个服务器宕机,那么会造成信息丢失.(无法满足高可用)
3由此,基于Lucene的ElasticSearch诞生了,可以满足
1).实时搜
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。