当前位置:   article > 正文

Elasticsearch查询10000条限制解决方案_elasticsearch查询超过10000

elasticsearch查询超过10000

目录

问题描述

问题原因

解决方案


问题描述

Elasticsearch官方默认最多只能查询10000条数据,查询20000条数据开始就会报错:

Resultwindowis too large, from+ size must be less than or equal to: [10000] but was [20000]. See the scroll api for a more efficient way to request large data sets. This limit can be setby changing the [index.max_result_window] index level setting.

问题原因

max_result_window 是 Elasticsearch 中一个重要的搜索参数,它控制了单个搜索请求返回的最大结果数。具体来说,它定义了从搜索结果中的哪个位置开始返回结果,以及要返回多少个结果。

默认情况下,Elasticsearch 的 max_result_window 参数设置为 10000。这意味着,如果您执行一个搜索请求,请求的结果超过了 10000 条记录,那么只会返回前 10000 条记录,并且 Elasticsearch 会在响应中包含一个 hits.total 字段,该字段表示总共匹配了多少条记录。

如果您需要检索更多的结果,可以通过增加 from 和 size 参数来获取更多的结果,但是 from + size 不能超过 max_result_window 的值。如果您的搜索结果超过了 max_result_window 的值,那么 Elasticsearch 将会返回一个错误,提示您使用 scroll API 或者增加 max_result_window 的值来处理这个问题。

解决方案

方案一(max_result_window

1.修改索引的 index.max_result_window

  1. PUT /<index 或者 _all>/_settings
  2. {
  3. "index.max_result_window": 100000
  4. }

或者在配置文件elasticsearch.yml中增加下列配置,并重启elasticsearch。

index.max_result_window: 100000

或者在创建索引时添加最大上限设置

  1. {
  2.   "settings": {
  3.     "index": {
  4.       "max_result_window": 20000
  5.     }
  6.   }
  7. }

需要注意的是,将 max_result_window 参数设置得太大可能会影响 Elasticsearch 的性能。因此,建议在使用 max_result_window 参数时,根据实际情况和性能要求来选择合适的值

2.代码中解除限制

在查询时候把 track_total_hits 设置为 true。

track_total_hits 设置为false禁用跟踪匹配查询的总点击次数

设置为true就会返回真实的命中条数。

  1. NativeSearchQuery query = nativeSearchQueryBuilder.withTrackTotalHits(true).build();
  2. //public NativeSearchQueryBuilder withTrackTotalHits(Boolean trackTotalHits) {
  3. // this.trackTotalHits = trackTotalHits;
  4. // return this;
  5. //}

 3.在使用工具访问时添加track_total_hits设置

  1. GET /<index 或者 _all>/_search
  2. {
  3.   "query": {
  4.     "match_all": {}
  5.   },
  6.   "track_total_hits": true
  7. }

方案二(scroll)

scroll 的方式,官方的建议不用于实时的请求,一般用于数据导出,每一个 scroll_id 不仅会占用大量的资源,而且会生成历史快照,对于数据的变更不会反映到快照上。

方案三(search_after)

search_after 分页的方式是根据上一页的最后一条数据来确定下一页的位置,同时在分页请求的过程中,如果有索引数据的增删改查,这些变更也会实时的反映到游标上。但是需要注意,因为每一页的数据依赖于上一页最后一条数据,所以无法跳页请求。

为了找到每一页最后一条数据,每个文档必须有一个全局唯一值,官方推荐使用 _uid 作为全局唯一值,其实使用业务层的 id 也可以。
 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/402157
推荐阅读
相关标签
  

闽ICP备14008679号