当前位置:   article > 正文

Elasticsearch——RestHighLevelClient_elasticsearch-rest-high-level-client

elasticsearch-rest-high-level-client

介绍

java rest client有两个实现类,分别是RestClient和RestHighLevelClient。前者是一个低级客户端,通过Http与elasticsearch集群进行通信,可以做到 负载均衡、故障转移、持久化链接、自动发现集群节点等功能,同时支持所有elasticsearch版本,但是需要自己对请求和相应做编解码(自己写JSON);后者是一个高级客户端,对增删改差进行了封装,不需要处理编解码,类似之前的TransportClient,但是兼容性较差,对客户端和集群版本要求较高。
因为RestClient没有提供增删改差方法,只能自己写json并选择Http请求的方法进行实现,一般使用较少,只有RestHighLevelClient无法满足的情况下才会使用。这里主要介绍RestHighLevelClient。

RestHighLevelClient

RestHighLevelClient restHighLevelClient = new RestHighLevelClient(restClient);
RestHighLevelClient仅仅是对RestClinet的一个封装。支持异步请求。

search api

请求

构造查询主要用到两个类:SearchRequest和SearchSourceBuilder。

  1. SearchRequest searchRequest = new SearchRequest(); //穿件SeachRequest,Without arguments this runs against all indices.
  2. SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();// 大多数的搜索参数被添加到 SearchSourceBuilder 。它为每个进入请求体的每个东西都提供 setter 方法。
  3. searchSourceBuilder.query(QueryBuilders.matchAllQuery()); // 添加一个 match_all 查询到 searchSourceBuilder 。
  4. searchRequest.source(searchSourceBuilder); //将searchSourceBuilder添加到searchRequest

这里构造了一个查询请求,内容为一个match_all查询。
SearchRequest为最终的查询请求封装,而查询的大部分细节由SearchSourceBuilder指定。
首先来看一下常用的几个SearchRequest方法

  1. SearchRequest searchRequest = new SearchRequest("posts"); // 限制请求到某个索引上
  2. searchRequest.indices("gets"); //设定索引
  3. searchRequest.types("doc"); // 限制请求的类别
Es-java包中请求体封装类,其属性的settergetter方法,都没有相应的set和get标记,直接使用属性名作为方法名,然后通过入参和返回值区分哪个是setter哪个是getter。之前版本中用的标准settergetter在(至少在5.X)客户端中已经不见了。

还有很多其他的配置参数,这里不再罗列。

然后是搜索细节——SearchSourceBuilder
SearchSourceBuilder可以配置大多数的搜索细节,以下为几个实例,详细参考文档:

  1. SearchSourceBuilder sourceBuilder = new SearchSourceBuilder(); //使用默认选项创建 SearchSourceBuilder 。
  2. sourceBuilder.query(QueryBuilders.termQuery("user", "kimchy"));//设置查询对象。可以使任何类型的 QueryBuilder
  3. sourceBuilder.from(0); //设置from选项,确定要开始搜索的结果索引。 默认为0
  4. sourceBuilder.size(5); //设置大小选项,确定要返回的搜索匹配数。 默认为10
  5. sourceBuilder.timeout(new TimeValue(60, TimeUnit.SECONDS)); //设置一个可选的超时时间,用于控制搜索允许的时间。

sourceBuilder.query:设置查询对象。所有Query DSL支持的搜索类型都有对应的QueryBuilder。创建QueryBuilder有两种方式:直接new和QueryBuilders工厂方法,我习惯后者(实际没差别)。常见的QueryBuilder列几个:

  1. // 创建一个字段“user”与文本“kimchy”相匹配的的全文匹配查询。
  2. MatchQueryBuilder matchQueryBuilder = new MatchQueryBuilder("user", "kimchy");
  3. // 创建一个字段date的范围查询。
  4. RangeQueryBuilder rangeQueryBuilder = QueryBuilders.rangeQuery("date").lte(time);

每个QueryBuilder都根据各自的查询提供了对应的方法,同时支持链式创建并初始化。
QueryBuilder支持像curl一样进行查询嵌套,比如一个bool的must里套一个bool,should里放一个bool一个range。
无论怎么嵌套,最终得到的QueryBuilder结构就像传统的search json一样。最后把这个QueryBuilder添加到SearchSourceBuilder中:

searchSourceBuilder.query(queryBuilder);

每个SearchSourceBuilder只能设定一个QueryBuilder,即一个Query DSL中只有一个query元素。

在传统Query DSL中,还有一些在结构上与query并列的,比如sort,在java中表示如下:

  1. FieldSortBuilder sortBuilder = SortBuilders.fieldSort(sortField).order(sortOrder);
  2. searchSourceBuilder.sort(sortBuilder);

可以控制一次返回文档的个数、返回文档的字段:

  1. searchSourceBuilder.size(num);
  2. searchSourceBuilder.fetchSource(includeFields, excludeFields);
  1. //实现高亮
  2. SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
  3. HighlightBuilder highlightBuilder = new HighlightBuilder(); //创建一个HighlightBuilder
  4. HighlightBuilder.Field highlightTitle =new HighlightBuilder.Field("title"); //指定高亮字段1
  5. highlightBuilder.field(highlightTitle); //指定高亮字段2
  6. highlightBuilder.preTags(preTags); //修改高亮前缀(默认http标签)
  7. highlightBuilder.postTags(postTags); //修改高亮后缀(默认http标签)
  8. searchSourceBuilder.highlighter(highlightBuilder);

然后可以从结果中获取高亮显示的文本字段。

实现聚合:

  1. SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
  2. TermsAggregationBuilder aggregation = AggregationBuilders.terms("by_company").field("company.keyword");
  3. aggregation.subAggregation(AggregationBuilders.avg("average_age").field("age"));
  4. searchSourceBuilder.aggregation(aggregation);

详细方法参考聚合api。

响应

SearchResponse searchResponse = client.search(searchRequest);

通过SearchResponse获得所有的相应数据。

无论请求还是相应,想要构造或者解析都需要按照DSL的格式,一层一层去做。

可以遍历返回的文档:

  1. SearchHits hits = searchResponse.getHits(); //获得hits数组
  2. long totalHits = hits.getTotalHits(); //获取检索的文档总数(不是这次返回的数量)
  3. for (SearchHit hit : hits) {
  4. String index = hit.getIndex(); //获取文档的index
  5. String type = hit.getType(); //获取文档的type
  6. String id = hit.getId(); //获取文档的id
  7. Map<String, Object> sourceMap = hit.getSource(); //获取文档内容,封装为map
  8. String sourceString = hit.getSourceAsString(); //获取文档内容,转换为json字符串。
  9. }
  1. SearchHit[] searchHits = hits.getHits();
  2. for (SearchHit hit : searchHits) {
  3. // do something with the SearchHit
  4. }
  1. Map<String, HighlightField> highlightFields = hit.getHighlightFields();
  2. HighlightField highlight = highlightFields.get("title"); //获取该title领域 的突出显示
  3. Text[] fragments = highlight.fragments(); //获取包含突出显示的字段内容的一个或多个片段
  4. String fragmentString = fragments[0].string();
  1. Aggregations aggregations = searchResponse.getAggregations();
  2. Terms byCompanyAggregation = aggregations.get("by_company"); //Get the by_company terms aggregation
  3. Bucket elasticBucket = byCompanyAggregation.getBucketByKey("Elastic"); //
  4. Avg averageAge = elasticBucket.getAggregations().get("average_age"); //Get the average_age sub-aggregation from that bucket
  5. double avg = averageAge.getValue();

 

  1. final Scroll scroll = new Scroll(TimeValue.timeValueMinutes(1L)); // 创建游标对象
  2. SearchRequest searchRequest = new SearchRequest("posts");
  3. searchRequest.scroll(scroll); // 为查询设置游标,注意是在SearchRequest中配置
  4. SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
  5. searchSourceBuilder.query(matchQuery("title", "Elasticsearch"));
  6. searchRequest.source(searchSourceBuilder);
  7. SearchResponse searchResponse = client.search(searchRequest); //通过发送初始化 SearchRequest 来初始化搜索上下文
  8. String scrollId = searchResponse.getScrollId(); // 获取scrollId
  9. SearchHit[] searchHits = searchResponse.getHits().getHits();
  10. while (searchHits != null && searchHits.length > 0) {
  11. //在一个循环中通过调用 Search Scroll api 检索所有搜索命中结果,知道没有文档返回为止。
  12. //创建一个新的SearchScrollRequest,持有最近一次返回的滚动标识符和滚动间隔
  13. SearchScrollRequest scrollRequest = new SearchScrollRequest(scrollId);
  14. scrollRequest.scroll(scroll); //重新设置游标ID
  15. searchResponse = client.searchScroll(scrollRequest); //游标查询,这里使用searchScroll,与第一次查询不同
  16. scrollId = searchResponse.getScrollId(); //获取新的游标ID
  17. searchHits = searchResponse.getHits().getHits();
  18. //处理返回的搜索结果
  19. }
  20. ClearScrollRequest clearScrollRequest = new ClearScrollRequest(); //一旦查询全部完成,清除游标
  21. clearScrollRequest.addScrollId(scrollId);
  22. ClearScrollResponse clearScrollResponse = client.clearScroll(clearScrollRequest);
  23. boolean succeeded = clearScrollResponse.isSucceeded();

 

delete api

在RestHighLevelClient中,删除只支持按照index/type/id进行精确删除,不支持delete by query的操作。普通的TransportClient支持delete by query。

  1. DeleteRequest request = new DeleteRequest(indexName, type, id); //创建DeleteRequest对象
  2. DeleteResponse response = client.delete(request); //执行删除操作
  1. request.routing("routing"); // 路由值
  2. request.parent("parent"); //Parent 值
  3. request.timeout(TimeValue.timeValueMinutes(2)); // TimeValue 类型的等待主分片可用的超时时间
  4. request.timeout("2m"); // 字符串类型的等待主分片可用的超时时间
  5. request.setRefreshPolicy(WriteRequest.RefreshPolicy.WAIT_UNTIL);// Refresh policy as a WriteRequest.RefreshPolicy instance
  6. request.setRefreshPolicy("wait_for"); // Refresh policy as a String
  7. request.version(2); // Version
  8. request.versionType(VersionType.EXTERNAL); // Version type
  9. String index = deleteResponse.getIndex(); // index
  10. String type = deleteResponse.getType(); // type
  11. String id = deleteResponse.getId(); // id
  12. long version = deleteResponse.getVersion(); .// version
  13. IndexRequest request = new IndexRequest(
  14. "posts", //Index
  15. "doc", //Type
  16. "1"); //Document id
  17. String jsonString = "{" +
  18. "\"user\":\"kimchy\"," +
  19. "\"postDate\":\"2013-01-30\"," +
  20. "\"message\":\"trying out Elasticsearch\"" +
  21. "}";
  22. request.source(jsonString, XContentType.JSON); /以字符串提供的 Document source
  23. 这里使用IndexRequest做index请求。包括index\type\id信息,然后创建了index文档,这里采用字符串方式。
  24. 文档可以使用多种方式提供,包括字符串、Map、XContentBuilder、Object数组、BytesReference、键值对数组等方式:
  25. Map<String, Object> jsonMap = new HashMap<>();
  26. jsonMap.put("user", "kimchy");
  27. jsonMap.put("postDate", new Date());
  28. jsonMap.put("message", "trying out Elasticsearch");
  29. IndexRequest indexRequest = new IndexRequest("posts", "doc", "1").source(jsonMap); //Map 作为文档源,它可以自动转换为 JSON 格式。
  30. XContentBuilder builder = XContentFactory.jsonBuilder();
  31. builder.startObject();
  32. {
  33. builder.field("user", "kimchy");
  34. builder.field("postDate", new Date());
  35. builder.field("message", "trying out Elasticsearch");
  36. }
  37. builder.endObject();
  38. IndexRequest indexRequest = new IndexRequest("posts", "doc", "1").source(builder); //XContentBuilder 对象作为文档源,由 Elasticsearch 内置的帮助器生成 JSON 内容
  39. IndexRequest indexRequest = new IndexRequest("posts", "doc", "1")
  40. .source("user", "kimchy",
  41. "postDate", new Date(),
  42. "message", "trying out Elasticsearch"); //以键值对对象作为文档来源,它自动转换为 JSON 格式

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/68543
推荐阅读
相关标签
  

闽ICP备14008679号