黑客灵魂

这个屌丝很懒，什么也没留下！

热门标签

docker安装es+mac安装Kibana工具+es查询语法笔记_macos doker安装es

作者：黑客灵魂 | 2024-07-06 12:06:09

踩

macos doker安装es

一、docker安装es

1、下载镜像

docker pull elasticsearch:7.9.0
1

下载完后，查看镜像

docker images
1

在这里插入图片描述

2、启动镜像

docker network create esnet
1

docker run  -d  --name es  -p 9200:9200 -p 9300:9300  --network esnet -e "discovery.type=single-node" e71b9e9d21b6
1

查看日志

docker logs e71b9e9d21b6
1

3、访问9200端口。

在这里插入图片描述
看到这个页面代表es安装成功，es安装完毕！

4、在docker可视化工具中查看镜像日志和进程信息。

在这里插入图片描述

5、安装IK分词器。

1、从github下载安装。
注意版本要与ES版本一致。

进入容器。

docker exec -it adaaf2ddfa7b bash
1

安装对应版本的ik分词器。
在这里插入图片描述

[root@adaaf2ddfa7b bin]# ./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.9.0/elasticsearch-analysis-ik-7.9.0.zip
1

重启es镜像即可。

 docker restart adaaf2ddfa7b
1

在kibana中测试一下IK分词器。

POST _analyze
{
  "analyzer": "ik_max_word",
  "text": ["张三丰","数据库","手机壳"]
}

POST _analyze
{
  "analyzer": "standard",
  "text": ["张三丰","数据库","手机壳"]
}


POST _analyze
{
  "analyzer": "keyword",
  "text": ["张三丰","数据库","手机壳"]
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

ik_max_word智能分词效果
在这里插入图片描述
standard效果 会拆分成一个个字

keyword效果

二、mac中安装Kibana

1、下载跟es版本一样的kibana。

官方地址：https://www.elastic.co/cn/downloads/past-releases/kibana-7-9-0

如其他的版本，只需更改链接中的数值。

在这里插入图片描述
下载完后解压文件。

在这里插入图片描述

2、修改配置文件，添加es的地址。

配置文件路径在config下，kibana.xml。
在这里插入图片描述

添加以下配置：
在这里插入图片描述

3、运行bin目录下的kibana即可。

bin/kibana
1

在这里插入图片描述

4、访问kibana。

localhost:5601，出现以下页面代表安装成功。
在这里插入图片描述
看到这个页面基本上就是安装成功啦！不得不吐槽，界面越来越丑了，哈哈。

5、测试一下。

可以在dev tools里调用es啦。
在这里插入图片描述

直接发送PUT请求，创建一个索引并插入一个文档，测试成功。
在这里插入图片描述

三、es学习笔记。

1、概述。

ES使用java语言并基于lucene编写的搜索引擎框架，提供了分布式的全文搜索功能，提供了基于restful风格的web接口，只需要发送一个web请求，根据请求方式不同，携带不同的参数执行。

Lucene本身就是一个搜索框架的底层。ES主要是突出他的横向扩展能力，分布式的。
1、Slor在查询死数据的时候更快一些，但是如果数据是实时变化的是咯人效率下降，ES没有影响。
2、solr搭建集群需要 zookeeper，而es本身就支持集群的搭建不需要第三方的额外介入。
3、slor社区、文档丰富，出现的早，ES较少。
4、ES对云计算和大数据支持的更好。

ES的数据结构
一个 Elasticsearch 集群可以包含多个索引，相应的每个索引可以包含多个类型。这些不同的类型存储着多个文档，每个文档又有多个属性。
ES会对数据进行分片，1亿条数据，比如分成两个分片，各5000万条数据。
如前所述，一个索引类似于传统关系数据库中的一个数据库，是一个存储关系型文档的地方。
索引 (index) 的复数词为 indices 或 indexes 。
索引（动词）：
索引一个文档就是存储一个文档到一个索引（名词）中以便被检索和查询。这非常类似于 SQL 语句中的 INSERT 关键词，除了文档已存在时，新文档会替换旧文档情况之外。
倒排索引：

将一段词语进行分词，并且将分出的词语统一放到一个分词库中，在搜索时根据关键字去分词库中检索，找到匹配的内容。

关系型数据库通过增加一个索引比如一个 B树（B-tree）索引到指定的列上，以便提升数据检索速度。Elasticsearch 和 Lucene 使用了一个叫做倒排索引的结构来达到相同的目的。
默认的，一个文档中的每一个属性都是被索引的（有一个倒排索引）和可搜索的。一个没有倒排索引的属性是不能被搜索到的。
一个类型下可以有多个文档，相当于db中多行数据；一个列多个属性，相当于db中表中行的列字段。
可以理解成如下的对应关系：

数据库-----索引
数据表-----类型
一条记录-----一个文档
字段------属性

在ES中可以创建多个索引，每个索引默认被分成5片存储。每个分片都会存在至少一个备份分片，备份分片默认不会帮助检索数据，当Es检索压力过大时，备份分片才会帮忙检索数据，备份的分片必须放在不同的服务器中。

一个索引下可以有多个类型版本：

ES5.X 一个索引对应多个类型
ES6.X 一个索引对应1个类型
ES7.X 索引下没有类型类型被移除了

2、操作ES的restful语法

GET：

http://ip:port/index 查询索引信息
http://ip:port/index/type/doc_id 查询指定的文档信息

POST：

http://ip:port/index/type/_search 查询文档，可以在请求体中添加json字符串来代表查询条件
http://ip:port/index/type/doc_id/_update 修改文档，在请求体中添加json字符串来代表修改的信息

PUT：

http://ip:port/index 创建一个索引，需要在请求体中指定索引的信息
http://ip:port/index/type/_mappings 代表创建索引时，指定索引文档存储属性的信息

DELETE ：

http://ip:port/index 删库跑路
http://ip:port/index/type/doc_id 删除指定的文档

3、创建索引和索引的常用操作。

#创建一个索引

PUT /nts_db_index
{
  ""settings"": {
    ""number_of_shards"": 5, 
    ""number_of_replicas"": 1
  }
}
#分片数 默认是5
#备份数量模式1
GET /nts_db_index
1
2
3
4
5
6
7
8
9
10
11
12

# 会直接创建一个索引
PUT /tmp_db_index/au_user_type/1
{
    ""first_name"" : ""wb"",
    ""last_name"" :  ""zhang"",
    ""age"" :        25,
    ""about"" :      ""I love to go rock climbing"",
    ""interests"": [ ""sports"", ""music"" ]
}
PUT /tmp_db_index/au_user_type/2
{
    ""first_name"" :  ""Jane"",
    ""last_name"" :   ""Smith"",
    ""age"" :         32,
    ""about"" :       ""I like to collect rock albums"",
    ""interests"":  [ ""music"" ]
}

PUT /tmp_db_index/au_user_type/3
{
    ""first_name"" :  ""Douglas"",
    ""last_name"" :   ""Fir"",
    ""age"" :         35,
    ""about"":        ""I like to build cabinets"",
    ""interests"":  [ ""forestry"" ]
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

#查询索引信息 分片数 被分数 别名 属性类型等
GET /tmp_db_index
#查询 全部
GET /tmp_db_index/au_user_type/_search 
#根据id=1查询
GET /tmp_db_index/au_user_type/1
#删除索引
DELETE /tmp_db_index"		
1
2
3
4
5
6
7
8

{
  ""nts_db_index"" : {
    ""aliases"" : { }, 别名
    ""mappings"" : { }, 数据的结构
    ""settings"" : {
      ""index"" : {
        ""creation_date"" : ""1613207857440"",
        ""number_of_shards"" : ""5"", 分片数
        ""number_of_replicas"" : ""1"", 备份数
        ""uuid"" : ""w_bLH--GQI6EcrJL3THDzw"",
        ""version"" : {
          ""created"" : ""6050499""
        },
        ""provided_name"" : ""nts_db_index""
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

kibana的索引查询页面

在这里插入图片描述

4、属性类型

string类型

text：一般用于全文检索将当前属性进行分词
keyword：当前属性不会被分词

数值类型

long
integer
short
byte
double
float
half_float 精度比float小一半
scaled_float 根据一个long和scaled来表示一个浮点型 long-345 scaled-100 -->3.45

时间类型

date类型针对具体格式的时间 yyyy-mm-dd hh-ms-ss long毫秒数

布尔类型

true
false

二进制类型

binary类型暂时只支持Base6 encoding string

范围类型

long_range 存储一个范围无需指定具体内容指定 gt lt gte lte
integer_range 以下均同上
double_range
float_range
dat_range
ip_range

位置类型

经纬度 geo_point

ip类型

ipv4
ipv6

5、创建索引指定属性的数据结构

PUT /book
{
  ""settings"": {
    ""number_of_shards"": 5,
    ""number_of_replicas"": 1
  },
  ""mappings"": {
    ""noval"":{
      ""properties"":{
        ""name"":{
          ""type"":""text"",
          ""analyzer"":""ik_max_word"",
          ""index"":true,
          ""store"":false
        },
        ""auther"":{
          ""type"":""keyword""
        },
        ""count"":{
          ""type"":""long""
        },
        ""on-time"":{
          ""type"":""date"",
          ""format"":""yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis""
        },
        ""desc"":{
          ""type"":""text"",
          ""analyzer"":""ik_max_word""
        }
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

注释：

#创建索引，指定数据类型
PUT /book
{
  ""settings"": {
    #分片数
    ""number_of_shards"": 5,
    #备份数
    ""number_of_replicas"": 1
  },
    #指定数据类型
 ""mappings"": {
    #类型 Type
   ""novel"":{
    #文档存储的field
     ""properties"":{
       #field属性名
       ""name"":{
         #类型
         ""type"":""text"",
         #指定分词器
         ""analyzer"":""ik_max_word"",
         #指定当前的field可以被作为查询的条件
         ""index"":true,
         #是否需要额外存储
         ""store"":false
       },
       ""author"":{
         ""type"":""keyword""
       },
       ""count"":{
         ""type"":""long""
       },
       ""on-sale"":{
         ""type"":""date"",
           #指定时间类型的格式化方式
         ""format"": ""yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis""
       },
        ""descr"":{
          ""type"":""text"",
          ""analyzer"":""ik_max_word""
       }
     }
   }
 }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45

6、文档的操作

添加文档自动生成id

POST /book/noval
{
  ""name"":""我和我的祖国"",
  ""auther"":""张文"",
  ""count"":100000,
  ""on-time"" : ""2021-02-14 14:20:06"",
  ""desc"":""我和我的祖国，一刻也不能分割，无论我走到哪里，都留下一首赞歌！""
}
1
2
3
4
5
6
7
8

添加文档手动指定id

POST /book/noval/1
{
  ""name"":""我和我的家乡"",
  ""auther"":""杜卓"",
  ""count"":2222222,
  ""on-time"" : ""2021-2-14 14:22:55"",
  ""desc"":""我和我的家乡大枣庄，真漂亮啊真漂亮，我爱吃辣子鸡和莲蓬啊！""
}
1
2
3
4
5
6
7
8

修改文档覆盖式修改

POST /book/noval/1
{
  ""name"":""我和我的家乡"",
  ""auther"":""杜卓1"",
  ""count"":22220000,
  ""on-time"" : ""2021-2-14 14:22:55"",
  ""desc"":""我和我的家乡大枣庄，真漂亮啊真漂亮，我爱吃辣子鸡和莲蓬啊！""
}
1
2
3
4
5
6
7
8

修改文档基于doc的方式

POST /book/noval/1/_update
{
  ""doc"": {
    ""count"":6666666
  }
}
1
2
3
4
5
6

根据id删除文档

DELETE /book/noval/DEU1n3cBhRoCqt_4gtk7 	
1

查询操作，GET 或者 POST（带条件的）都可以

7、ES查询语法

查询相当于mysql的limit 分页
from size （默认 0 20）

GET /sms-logs-index/sms-logs-type/_search
{
  ""from"": 0,
  ""size"": 4
}
1
2
3
4
5

7.1 term查询

代表的是完全匹配，搜索之前不会对搜索关键字进行分词，对你的关键字去分词库中匹配内容

# term查询
GET /sms-logs-index/sms-logs-type/_search
{
  ""from"": 0,
  ""size"": 4,
  ""query"": {
    ""term"": {
      ""province"": {
        ""value"": ""上海""
      }
    }
  }
}
# 如果用"上"匹配则匹配不上
# 相当于 where province = "上海"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

7.2 terms查询

与term查询一样都不对查询的关键字进行分词直接去分词库里面匹配找到相应的文档内容
terms是针对一个字段包含多个值的时候使用

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""terms"": {
      ""province"": [
        ""上海"",
        ""北京""
      ]
    }
  }
}
# 相当于where province = "上海" or province = "北京" 

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""term"": {
      ""smsContent"": [
        ""孩子""
      ]
    }
  }
}
# terms也可以  不仅仅是关键字 普通的文本分词以后也可以
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

7.3 match查询

match查询属于高层查询，会根据查询的字段类型不同采取不同的查询方式
查询的是日期或数值类型，会基于查询字符串内容转为日期或者数值对待。
如果查询的内容不是一个不能被分词的内容（keyword），match查询不会对指定的内容进行分词。
如果查询的内容是一个不能被分词的内容（text），match查询会对指定的内容进行分词，去分词库中匹配指定的内容。

match查询底层就是多个term查询封装到了一起。

7.3.1 match_all 查询

查询全部内容，不指定任何查询条件默认只查询出来10条可以加size限制"

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""match_all"": {}
  }
}
1
2
3
4
5
6

7.3.2 match 查询

指定一个属性作为筛选的条件

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""match"": {
      ""smsContent"": ""一个没有实力的男人""
    }
  }
# ik分词后：一个,一,个,没有,实力,男人
1
2
3
4
5
6
7
8

7.3.3 布尔 match 查询

and 或者 or

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""match"": {
      ""smsContent"": {
      ""query"": ""孩子 中年"",
      ""operator"": ""and""
      }
    }
  }
}
# and 内容既包含孩子也包含中年
# or 内容包含孩子或者中年
1
2
3
4
5
6
7
8
9
10
11
12
13

7.3.4 multi_match查询

针对多个属性进行检索，多个field对应一个内容
match是一个属性

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""multi_match"": {
      ""query"": ""北京"",
      ""fields"": [""province"",""corpName""]
    }
  }
}
1
2
3
4
5
6
7
8
9

7.4、其他查询

7.4.1 id查询

查询id是8的文档

GET /sms-logs-index/sms-logs-type/8	
1

7.4.2 ids查询

根据多个id查询类似in

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""ids"": {
      ""values"": [""1"",""2"",""8""]
    }
  }
}
1
2
3
4
5
6
7
8

7.4.2 前缀查询prefix

可以通过一个关键字去指定一个属性的前缀，去匹配文档，类似sql中的 like ‘海尔%’

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""prefix"": {
      ""corpName"": {
        ""value"": ""海尔""
      }
    }
  }
}

1
2
3
4
5
6
7
8
9
10
11

对比下match查询

#以海尔开头的，而match则匹配不上 
GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""match"": {
      ""corpName"": ""海尔""
    }
  }
}
1
2
3
4
5
6
7
8
9

7.4.3 fuzzy查询模糊查询

根据输入字符的大概去匹配错别字
不太稳定
数据量大的话不支持可以加参数，保证前面几个字符是不能出错的

GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""fuzzy"": {
      ""corpName"": {
        ""value"": ""海尔电气""
      }
    }
  }
}
GET /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""fuzzy"": {
      ""corpName"": {
        ""value"": ""格力汽扯"",
        ""prefix_length"": 3
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

7.4.4 wildcard查询通配符占位符

和like一个套路，使用通配符*和占位符?

POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""wildcard"": {
      ""corpName"": {
        ""value"": ""*力*""
      }
    }
  }
}
POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""wildcard"": {
      ""corpName"": {
        ""value"": ""海尔????""
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

7.4.5 range查询只针对数值类型范围查询

对某一个fiId进行大于或小于的范围指定

POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""range"": {
      ""replyTotal"": {
        ""gte"": 3,
        ""lte"": 15
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11

gte ≥
lte ≤
gt ＞
lt ＜

7.4.6 regexp查询正则匹配

通过编写的正则表达式来匹配文档

POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""regexp"": {
      ""mobile"": ""138[0-9]{8}""
    }
  }
}
1
2
3
4
5
6
7
8

7.4.7 深分页 scroll

效率高放到内存中但使用场景为不是实时的数据
ES对from+size是有限制的，数量不超过1w
from+size原理
1、将查询关键字分词
2、将词汇去分词库中检索，得到多个文档id
3、去各个分片中拉取指定的数据，耗时较长
4、将数据根据score分数排序
5、根据from的值将数据舍弃一部分
6、返回数据
scroll原理
1、将查询关键字分词
2、将词汇去分词库中检索得到多个文档id
3、将文档id放到ES的一个上下文中
4、将指定的size去es中检索指定的数据拿完文档的id，会从上下文中移除
5、如果找下一页内容，直接去es的上下文中找
不适合做实时的数据查询

# 指定生存时间为1分钟
# 默认是id排序 也可指定
POST /sms-logs-index/sms-logs-type/_search?scroll=1m
{
  ""query"": {
    ""match_all"": {}
  },
  ""size"": 3
}

1
2
3
4
5
6
7
8
9
10

#加排序
POST /sms-logs-index/sms-logs-type/_search?scroll=1m
{
  ""query"": {
    ""match_all"": {}
  },
  ""size"": 3,
  ""sort"": [
    {
      ""fee"": {
        ""order"": ""desc""
      }
    }
  ]
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

# 查询下一页数据
POST /_search/scroll
{
  ""scroll_id"":
  ""DnF1ZXJ5VGhlbkZldGNoAwAAAAAAAAX4Fk4yWlZWaFNTUmR1bzB4V1VfU1ZQcFEAAAAAAAAF-RZOMlpWVmhTU1JkdW8weFdVX1NWUHBRAAAAAAAABfoWTjJaVlZoU1NSZHVvMHhXVV9TVlBwUQ=="",
  ""scroll"":""1m""
}
1
2
3
4
5
6
7

7.4.8 复合查询 bool

bool查询复合过滤器，将多个查询条件组合在一起

must 所有的条件组合在一起 and
must_not 将条件全部不能匹配 not
should 所有的条件组合一起 or

#bool 省份是北京或者上海 公司不是阿里开头的 内容包含孩子和中年的数据
POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""bool"": {
      ""should"": [
        {
          ""term"": {
            ""province"": {
              ""value"": ""北京""
            }
          }
        },{
          ""term"": {
            ""province"": {
              ""value"": ""上海""
            }
          }
        }
      ], 
      ""must_not"": [
        {
          ""wildcard"": {
          ""corpName"": {
          ""value"": ""阿里*""
          }
          }
        }
      ],
      ""must"": [
        {
          ""match"": {
            ""smsContent"": ""孩子""
          }
        },
        {""match"": {
          ""smsContent"": ""中年""
        }}
      ]
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42

7.4.9 bootsting查询 score 分数排序

可以帮助我们去影响查询后的score 从而影响排序
score分数：
1、搜索的关键字在文档中出现的频率越高，分数越高
2、文档内容越短分数越高
3、搜索的关键字分词以后匹配到的内容越多分数越高

positive 只有匹配上positive的内容才会返回到结果集中
negative 如果匹配上positive和negative，会降低文档的score
negative_boost 指定系数必须小于1

#boosting 
POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""boosting"": {
      ""positive"": {
        ""match"": {
          ""smsContent"": ""有实力的男人""
        }
      },
      ""negative"": {
        ""match"": {
          ""smsContent"": ""中年人""
        }
      },
      ""negative_boost"": 0.5
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

7.4.10 filter查询数据做缓存

query查询是根据查询条件去计算文档匹配到的分数，并且根据分数进行排序，不会做缓存
filter查询是根据条件去查询文档，不计算分数，而且会对经常被过滤的数据进行缓存，查出来的数据分数都是0

POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""bool"": {
      ""filter"": [
        {
          ""term"": {
          ""province"": ""北京""
          }
        },
        {
        ""range"": {
          ""fee"": {
            ""gte"": 30,
            ""lte"": 80
          }
        }
      }
      ]
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

7.4.11 高亮查询将查询关键字添加样式

高亮展示的数据，本身就是文档中的一个field，单独将field以高亮的形式返回
highlight属性和query同级

pre_tag 指定前缀标签如 <font color =““red””>
post_tag 指定后缀标签
fragment_zise 指定高亮数据展示多少个字符回来

POST /sms-logs-index/sms-logs-type/_search
{
  ""query"": {
    ""match"": {
      ""smsContent"": ""蕴气式""
    }
  },
  ""highlight"": {
    ""fields"": {
       ""smsContent"": {}
    },
    ""pre_tags"": ""<font color ='red'>"",
    ""post_tags"": ""</font>"",
    ""fragment_size"" :10
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

在这里插入图片描述

7.4.12 聚合查询

和MySQL的聚合查询类似，ES的聚合查询更加强大，提供的统计方式多种多样

restful语法：

POST /index/type/_search
{
    ""aggs"":{
        ""(名字 随意哦)agg"":{
            ""agg_type"":{
                ""属性""：""值""
            }
        }
    }
}
1
2
3
4
5
6
7
8
9
10

去重计数
省份去重 province_distinct

POST /sms-logs-index/sms-logs-type/_search
{
  ""aggs"": {
    ""province_distinct"": {
      ""cardinality"": {
        ""field"": ""province""
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10

7.4.13 范围统计

统计一个范围内出现的文档个数。
比如一个field的值在0-100,100-200等出现的个数分别统计
针对数值类型、时间类型、ip类型，对应的语法：range、date_dange、ip_range

数值类型 range

POST /sms-logs-index/sms-logs-type/_search
{
  ""aggs"": {
    ""agg"": {
      ""range"": {
        ""field"": ""fee"",
        ""ranges"": [
          {
            ""to"": 30
          },
          {
            ""from"": 30,
            ""to"": 50
          },{
            ""from"": 50
          }
        ]
      }
    }
  }
}
from是带等号的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

时间类型 查询 date_range

POST /sms-logs-index/sms-logs-type/_search
{
  ""aggs"": {
    ""agg"": {
      ""date_range"": {
        ""field"": ""createDate"",
        ""format"": ""yyyy"", 
        ""ranges"": [
          {
            ""from"": ""2020"",
            ""to"": ""2022""
          }
        ]
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

ip类型 ip_range

POST /sms-logs-index/sms-logs-type/_search
{
  ""aggs"": {
    ""agg"": {
      ""ip_range"": {
        ""field"": ""ipAddr"",
        ""ranges"": [
          {
            ""to"": ""127.0.0.4""
          },
          {
            ""from"": ""127.0.0.4"",
            ""to"": ""127.0.0.8""
          },{
            ""from"": ""127.0.0.8""
          }
        ]
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

7.4.14 统计聚合查询求某一列的聚合函数

求指定field的最大值最小值平均数平方和等

POST /sms-logs-index/sms-logs-type/_search
{
  ""aggs"": {
    ""agg"": {
      ""extended_stats"": {
        ""field"": ""fee""
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10

结果：

{
  ""count"" : 13,
  ""min"" : 18.0,
  ""max"" : 90.0,
  ""avg"" : 54.0,
  ""sum"" : 702.0,
  ""sum_of_squares"" : 44460.0,
  ""variance"" : 504.0,
  ""std_deviation"" : 22.44994432064365,
  ""std_deviation_bounds"" : {
    ""upper"" : 98.8998886412873,
    ""lower"" : 9.100111358712702
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14

7.4.15 地图经纬度搜索

经纬度 geo_point

#创建地图索引
PUT /map
{
  ""settings"": {
    ""number_of_shards"": 5, 
    ""number_of_replicas"": 1
  },
  ""mappings"": {
    ""bj_map"":{
      ""properties"":{
        ""name"":{
          ""type"":""text""
          },
          ""location"":{
            ""type"":""geo_point""
          }
        }
      }
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

#地图索引插入数据
PUT /map/bj_map/1
{
  ""name"":""北京科技职业学院"",
  ""location"":{
    ""lon"": 116.257172,
    ""lat"": 40.123649
  }
}
PUT /map/bj_map/2
{
  ""name"":""广洋公寓"",
  ""location"":{
    ""lon"": 116.267578,
    ""lat"": 40.132317
  }
}"	"PUT /map/bj_map/3
{
  ""name"":""飞腾家园"",
  ""location"":{
    ""lon"": 116.382617,
    ""lat"": 39.808707
  }
}
PUT /map/bj_map/4
{
  ""name"":""模式口西里"",
  ""location"":{
    ""lon"": 116.156704,
    ""lat"": 39.940053
  }
}
PUT /map/bj_map/5
{
  ""name"":""老山东里"",
  ""location"":{
    ""lon"": 116.231905,
    ""lat"": 39.91603
  }
}"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

地图检索方式

geo_distance 直线距离检索方式
geo_bounding_box 以两个点确定一个矩形获取矩形内的位置
geo_polygon 以多个点确认一个多边形获取多边形内的全部位置

geo_distance

POST /map/bj_map/_search
{
  ""query"": {
  ""geo_distance"":{
    ""location"":{ #指定位置
      ""lon"" : 116.372097,
      ""lat"" : 39.818302
     },
     ""distance"": 2000,    #半径
     ""distance_type"":""arc""   #圆形
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13

结果：

# 新宫 直径2000米内的
{
  ""took"" : 6,
  ""timed_out"" : false,
  ""_shards"" : {
    ""total"" : 5,
    ""successful"" : 5,
    ""skipped"" : 0,
    ""failed"" : 0
  },
  ""hits"" : {
    ""total"" : 1,
    ""max_score"" : 1.0,
    ""hits"" : [
      {
        ""_index"" : ""map"",
        ""_type"" : ""bj_map"",
        ""_id"" : ""3"",
        ""_score"" : 1.0,
        ""_source"" : {
          ""name"" : ""飞腾家园"",
          ""location"" : {
            ""lon"" : 116.382617,
            ""lat"" : 39.808707"
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

geo_bounding_box

# 两个点确认一个矩形 指定左上角的坐标和右下角的坐标
POST /map/bj_map/_search
{
  ""query"": {
  ""geo_bounding_box"":{
    ""location"":{
      ""top_left"":{
        ""lon"" : 116.193999,
        ""lat"" : 39.99746
      },
      ""bottom_right"":{
       ""lon"" : 116.421666,
      ""lat"" : 39.518215
      }
     }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

结果：

{
	{
		""_index"" : ""map"",
        ""_type"" : ""bj_map"",
        ""_id"" : ""5"",
        ""_score"" : 1.0,
        ""_source"" : {
          ""name"" : ""老山东里"",
          ""location"" : {
            ""lon"" : 116.231905,
            ""lat"" : 39.91603
        }
      },
      {
        ""_index"" : ""map"",
        ""_type"" : ""bj_map"",
        ""_id"" : ""3"",
        ""_score"" : 1.0,
        ""_source"" : {
          ""name"" : ""飞腾家园"",
          ""location"" : {
            ""lon"" : 116.382617,
            ""lat"" : 39.808707
       }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

geo_polygon

POST /map/bj_map/_search
{
  ""query"": {
    ""geo_polygon"":{
      ""location"":{
       ""points"":[
         {
           ""lon"" : 116.218778,
           ""lat"" : 39.930794
         },
         {
           ""lon"" : 116.259525,
            ""lat"" : 9.930628
         },
         {
           ""lon"" : 116.197003,
           ""lat"" : 39.913696
         },
         {
           ""lon"" : 116.242134,
           ""lat"" : 39.913253
         }
        ]
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

结果：

{
        ""_index"" : ""map"",
        ""_type"" : ""bj_map"",
        ""_id"" : ""5"",
        ""_score"" : 1.0,
        ""_source"" : {
          ""name"" : ""老山东里"",
          ""location"" : {
            ""lon"" : 116.231905,
            ""lat"" : 39.91603
          }
}
1
2
3
4
5
6
7
8
9
10
11
12

7.4.16 delete-by-query 删除查询到的结果

根据term/match等查询方式去删除大量的文档
建议备份大量数据不推荐
底层还是按照id一个一个删除

 POST /sms-logs-index/sms-logs-type/_delete_by_query
{
  ""query"": {
    ""range"": {
      ""replyTotal"": {
        ""gte"": 3,
        ""lte"": 6
      }
    }
  }
}
1
2
3
4
5
6
7
8
9
10
11

删除结果：

{
  ""took"" : 26,
  ""timed_out"" : false,
  ""total"" : 2,
  ""deleted"" : 2,
  ""batches"" : 1,
  ""version_conflicts"" : 0,
  ""noops"" : 0,
  ""retries"" : {
    ""bulk"" : 0,
    ""search"" : 0
  },
  ""throttled_millis"" : 0,
  ""requests_per_second"" : -1.0,
  ""throttled_until_millis"" : 0,
  ""failures"" : [ ]
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】

docker安装es+mac安装Kibana工具+es查询语法笔记_macos doker安装es

一、docker安装es

1、下载镜像

2、启动镜像

3、访问9200端口。

4、在docker可视化工具中查看镜像日志和进程信息。

5、安装IK分词器。

二、mac中安装Kibana

1、下载跟es版本一样的kibana。

2、修改配置文件，添加es的地址。

3、运行bin目录下的kibana即可。

4、访问kibana。

5、测试一下。

三、es学习笔记。

1、概述。

2、操作ES的restful语法

3、创建索引和索引的常用操作。

4、属性类型

5、创建索引 指定属性的数据结构

6、文档的操作

7、ES查询语法

7.1 term查询

7.2 terms查询

7.3 match查询

7.3.1 match_all 查询

7.3.2 match 查询

7.3.3 布尔 match 查询

7.3.4 multi_match查询

7.4、其他查询

7.4.1 id查询

7.4.2 ids查询

7.4.2 前缀查询prefix

7.4.3 fuzzy查询 模糊查询

7.4.4 wildcard查询 通配符 占位符

7.4.5 range查询 只针对数值类型范围查询

7.4.6 regexp查询 正则匹配

7.4.7 深分页 scroll

7.4.8 复合查询 bool

7.4.9 bootsting查询 score 分数排序

7.4.10 filter查询 数据做缓存

7.4.11 高亮查询 将查询关键字添加样式

7.4.12 聚合查询

7.4.13 范围统计

7.4.14 统计聚合查询 求某一列的聚合函数

7.4.15 地图经纬度搜索

7.4.16 delete-by-query 删除查询到的结果

5、创建索引指定属性的数据结构

7.4.3 fuzzy查询模糊查询

7.4.4 wildcard查询通配符占位符

7.4.5 range查询只针对数值类型范围查询

7.4.6 regexp查询正则匹配

7.4.10 filter查询数据做缓存

7.4.11 高亮查询将查询关键字添加样式

7.4.14 统计聚合查询求某一列的聚合函数