赞
踩
1.为什么要使用 ES?
虽然 lucene 是性能最先进的、功能完善的搜索引擎,但是它只能有一个库,而且使用它需
要集成到 java 项目才能使用,配置还特别复杂,而 ES 语法简单、是基于 Resultful api 风格的,
它在 lucene 所有功能基础上还能集成多台服务器进行搜索,也就是集群;
2.ES 和 lucene 的区别是什么?
lucene 是现存功能最强大、最先进搜索库,直接基于 lucene 开发, api 非常复杂大量的 java
代码、需要深入了解原理
对比处:
只有一个索引库、
传统的遍历搜索方式
采用 B+树索引;
Es 是基于 lucene 的,隐藏了 lucene 复杂部分的一个分布式全文检索框架
对比处:
一个 es 的集群包含多个索引库、
分布式搜索
Es 是采用倒排式索引
es 没有事物概念,删除不能恢复
es 开源免费
正排索引: id ---> value
倒排索引: value ---> id
3.你还了解哪些全文检索工具?
Lucene, Solr, HadoopContrib, Katta
4.Bulk 一次最大处理多少数据量?
bulk 会把将要处理的数据载入内存中,所以数据量是有限制的
最佳的数据量不是一个确定的数值,它取决于你的硬件,你的文档大小以及复杂性,你的索
更多关注 Java 大后端公众号
引以及搜索的负载。
一般建议是 1000-5000 个文档,如果你的文档很大,可以适当减少队列,大小建议是 5-15MB,
默
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。