当前位置:   article > 正文

Elasticsearch: collapse 去重

Elasticsearch: collapse 去重

官方文档传送门

1、 collapse

collapse 可以将搜索结果按照指定的 field 去重。如果在一次 DSL query 中,collapsesort 同时存在时,DSL 的执行顺序是 select -> collapse -> sort

2、 使用场景

根据关键词搜索 spu_id, 但文档是 SKU,根据 SKU 的名称关键词搜索 spu_id。一个 SPU 通常都有多个 SKU,如果不对 spu_id 进行去重,那么 spu_id 将会有很多的重复。

DSL demo

{
    "query": {
        "match": {
            "desc": "搜索"
        }
    },
    "from": 0,
    "size": 4,
    "collapse": {
        "field": "spu_id"
    },
    "_source": {
        "includes": [
            "spu_id"
        ]
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

response

{
    "took": 0,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {
            "value": 18,
            "relation": "eq"
        },
        "max_score": null,
        "hits": [
            {
                "_index": "xxx",
                "_type": "_doc",
                "_id": "xxx",
                "_score": 19.782768,
                "_routing": "xxx",
                "_source": {
                    "spu_id": xxx
                },
                "fields": {
                    "spu_id": [
                        "xxx"
                    ]
                }
            },
            {
                "_index": "xxx",
                "_type": "_doc",
                "_id": "xxx",
                "_score": 18.0652,
                "_routing": "xxx",
                "_source": {
                    "spu_id": xxx
                },
                "fields": {
                    "spu_id": [
                        "xxx"
                    ]
                }
            }
        ]
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
3、 collapse 的优缺点

优点:性能明显

缺点

分页查询时不知道去重后的 spu_id 的总数;
不能和 scroll 组合进行分页查询;

elasticsearch
elasticsearch

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/在线问答5/article/detail/899439
推荐阅读
相关标签
  

闽ICP备14008679号