当前位置:   article > 正文

springboot——集成elasticsearch进行搜索并高亮关键词_elasticsearch querybuilders 内容高亮

elasticsearch querybuilders 内容高亮

目录

1.elasticsearch概述

3.springboot集成elasticsearch

4.实现搜索并高亮关键词


1.elasticsearch概述

(1)是什么:

Elasticsearch 是位于 Elastic Stack 核心的分布式搜索和分析引擎。

Lucene 可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。但Lucene 只是一个基于java下的库,需要使用 Java 并要将其集成到你的应用中才可进行使用。而Elasticsearch 则是基于Lucene 下实现的开源搜索引擎。

Elasticsearch 基于分布式进行实时文件存储,每个字段都被索引并可被搜索,并可进行实时分析。同事由于基于分布式,可以扩展到上百台服务器,处理PB级结构化或非结构化数据。

(2)核心概念:

elasticsearch可归类于NoSQL的一种,其主要包含index(索引)、type(类型,elasticsearch 7.x后已被舍弃)、Document(文档)、Fields(字段)。

类比于MySQL如下:

其实现的核心在于倒排索引: 指的是将文档内容中的单词作为索引,将包含该词的文档 ID 作为记录。

一般的sql中都是正排索引,即以表中的唯一标识id作为索引,通过主键索引找到文档其他内容(具体请参考mysql存储结构)。

而elasticsearch通过关键字作为索引反向找到文档ID,可以高效的实现全文检索。

如我们有以下两条记录:

idcontentwriter
1这是一条测试数据,测试elasticsearchseven
2这是第二条、测试数据,试一下elasticsearch搜索seven

以上两条数据,在mysql中id为主键,当我们以elasticsearch以关键词搜索去搜查所有和elasticsearch有关的content时,在没有为content建索引的情况下,无法走主键索引,mysql会进行全表检索,效率一般。

而elasticsearch中会为content建立倒排索引,根据content找到对应的id,返回搜索结果,效率快鱼mysql。并且,整个搜索过程中我们不需要做任何文本的模糊匹配。

(3)应用场景:

ElasticSearch作为一个便于使用的分布式全文搜索引擎,常被用于各种搜索场景中:

  • 维基百科,百度等搜索引擎,对关键词和内容概要进行匹对,并对搜索的关键词进行高亮。
  • 电商平台,对关键词和商品名称、标题进行匹配,并对对搜索的关键词进行高亮。
  • 论坛,对关键词和帖子内容及评论等快速匹配,并对搜索关键词进行高亮。

总之言之, ElasticSearch是一个优秀的检索工具,可以对各类内容进行快速检索,并返回结果:

(检索关键词并进行高亮)

一般情况我们会在数据存入数据库前,把需要检索的字段作为ElasticSearch的索引和需要返回的数据存入ElasticSearch(比如电商平台达到商品标题),然后在搜索时使用ElasticSearch进行全文检索,快速返回相关结果。

3.springboot集成elasticsearch

下面对springboot集成elasticsearch进行演示:

pom依赖文件:

  1. <properties>
  2. <java.version>1.8</java.version>
  3. <elasticsearch.version>7.6.1</elasticsearch.version>
  4. </properties>
  5. <dependencies>
  6. <!-- fastjson -->
  7. <dependency>
  8. <groupId>com.alibaba</groupId>
  9. <artifactId>fastjson</artifactId>
  10. <version>1.2.70</version>
  11. </dependency>
  12. <!-- ElasticSearch -->
  13. <dependency>
  14. <groupId>org.springframework.boot</groupId>
  15. <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
  16. </dependency>
  17. <!-- web -->
  18. <dependency>
  19. <groupId>org.springframework.boot</groupId>
  20. <artifactId>spring-boot-starter-web</artifactId>
  21. </dependency>
  22. <!-- lombok 需要安装插件 -->
  23. <dependency>
  24. <groupId>org.projectlombok</groupId>
  25. <artifactId>lombok</artifactId>
  26. <optional>true</optional>
  27. </dependency>
  28. <!-- test -->
  29. <dependency>
  30. <groupId>org.springframework.boot</groupId>
  31. <artifactId>spring-boot-starter-test</artifactId>
  32. <scope>test</scope>
  33. </dependency>
  34. </dependencies>

此处需要注意的是springboot自带的ElasticSearch版本为6.8.5 ,如果你使用的是其他版本的ElasticSearch请注意指定版本号。

config配置文件,对ElasticSearch进行连接:

  1. @Configuration
  2. public class ElasticSearchConfig {
  3. @Bean
  4. public RestHighLevelClient restHighLevelClient(){
  5. RestHighLevelClient client = new RestHighLevelClient(
  6. RestClient.builder(
  7. new HttpHost("127.0.0.1",9200,"http")
  8. )
  9. );
  10. return client;
  11. }
  12. }

至此,我们皆可以通过 RestHighLevelClient 对ElasticSearch进行使用

4.实现搜索并高亮关键词

下面对 ElasticSearch进行使用,进行查询并高亮关键词。

首先我们建立索引:user,并存入以下数据:

然后,我们在业务类编写查询方法:

  1. //查询
  2. public List<User> searchUserByKeyword(String keyword,int pageNo,int pageSize) throws IOException {
  3. if (pageNo<=1){
  4. pageNo=1;
  5. }
  6. //条件查询
  7. SearchRequest searchRequest = new SearchRequest("user");
  8. SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
  9. //分页
  10. searchSourceBuilder.from(pageNo);
  11. searchSourceBuilder.size(pageSize);
  12. //匹配关键词(类似于模糊查询)
  13. //MatchQueryBuilder queryBuilder = QueryBuilders.matchQuery("sign",keyword);
  14. //组合查询
  15. BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();
  16. //and查询,所有条件都要符合; or查询可以使用queryBuilder.should
  17. queryBuilder.must(QueryBuilders.matchQuery("sign",keyword));
  18. queryBuilder.must(QueryBuilders.matchQuery("statue","use"));
  19. //精确匹配
  20. //TermQueryBuilder queryBuilder = QueryBuilders.termQuery("sign",keyword);
  21. searchSourceBuilder.query(queryBuilder);
  22. //设置高亮
  23. //highlightBuilder.requireFieldMatch(false); //只需要高亮第一个
  24. searchSourceBuilder.highlighter(new HighlightBuilder().field("sign"));
  25. //执行
  26. searchRequest.source(searchSourceBuilder);
  27. SearchResponse response = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT);
  28. //解析结果
  29. List<User> list = new ArrayList<>();
  30. for (SearchHit hit: response.getHits().getHits()){
  31. //解析高亮字段
  32. Map<String, HighlightField> highlightFields = hit.getHighlightFields();
  33. HighlightField sign = highlightFields.get("sign");
  34. //获取原字段
  35. Map<String, Object> oldUser = hit.getSourceAsMap();
  36. //将高亮替换原字段内容
  37. StringBuilder stringBuilder = new StringBuilder();
  38. if (sign!=null){
  39. Text[] texts = sign.fragments();
  40. for (Text t:texts){
  41. stringBuilder.append(t);
  42. }
  43. log.info("替换:"+stringBuilder);
  44. oldUser.put("sign",stringBuilder.toString());
  45. }
  46. User user = JSONObject.parseObject(hit.getSourceAsString(),User.class);
  47. user.setSign(oldUser.get("sign").toString());
  48. list.add(user);
  49. }
  50. return list;
  51. }

ElasticSearch的match配置是拆字匹配,即关键词为“测试”,那么会查询出所有目标字段中包含“测”和“试”任一字符的结果;若为“java”则不会对字母进行拆分,会保持整个单词完整。

上述代码需要注意的是,高亮的字段必须是查询的字段,才可以对查询的关键词进行高亮处理,否则高亮字段会为空。

编写controller进行测试:

  1. @RestController
  2. public class SearchController {
  3. @Resource
  4. private SearchService searchService;
  5. @GetMapping("/test")
  6. public List<User> test(@RequestParam("keyword")String keyword) throws IOException {
  7. return searchService.searchUserByKeyword(keyword,0,5);
  8. }
  9. }

结果:

成功查询所有sign包含java关键词且statue为use的用户,并对java关键词进行高亮(em标签,需要使用html进行解析)。

拓展:

(1)ElasticSearch还可以对搜索结果进行排序:

searchSourceBuilder.sort("age");

上述代码即根据age字段对搜索结果进行排序。

(2)过滤查询条件:

  1. BoolQueryBuilder queryBuilder = QueryBuilders.boolQuery();
  2. //过滤statue!=use的数据
  3. queryBuilder.filter(QueryBuilders.matchPhraseQuery("statue","use"));
  4. //过滤age不大于20的数据
  5. queryBuilder.filter(QueryBuilders.rangeQuery("age").gt(20));

具体还有很多查询条件,具体可参考ElasticSearch官网文档。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/172863
推荐阅读
相关标签
  

闽ICP备14008679号