赞
踩
在上一篇,分享了使用kibana如何对索引进行增删改查等操作,事实上在日常开发与运维中,操作索引毕竟是比较谨慎的事情,但是对于索引中文档的增删查改却是随处可见的,es对文档的操作不仅频繁,而且涉及到的点比较多,本文将分享对文档的基本的操作;
首先创建一个索引
PUT test_doc
执行上面的语句发现报错了,因为es中的文档数据需要唯一性标识,因此需要添加一个id,修改下执行语句
- PUT test_doc/_doc/1001
- {
- "id":1001,
- "name":"jerry",
- "age":12
- }
再次执行后就可以了
使用post同样可以达到目的,参考下面的语句
- POST test_doc/_doc
- {
- "id":1002,
- "name":"mike",
- "age":15
- }
与put不同的是,post不需要强制在请求URL中添加id值,而是自动为当前这条数据生成一个_id;
查询单个数据
GET test_doc/_doc/1001
GET test_doc/_search
根据主键值id进行修改
- PUT test_doc/_doc/1001
- {
- "id":1001,
- "name":"jerry",
- "age":12
- }
可以看到在这种情况下,新增了一个字段仍然可以修改成功
根据主键id值进行删除
DELETE test_doc/_doc/1001
删除后再次查询,数据被删掉了
文档搜索是es最强大的功能之一,也是架构设计之初选择es的一个重要原因,es对于文档的搜索提供了丰富的API,下面通过一些实际的操作演示来感受下es文档搜索的强大之处;
创建一个索引 test_query,并给这个索引下批量插入一些数据
- PUT test_query
-
- PUT test_query/_bulk
- {"index": {"_index": "test_query","_id": "1001"}}
- {"id": "1001","name":"zhang san","age":30}
- {"index": {"_index": "test_query","_id": "1002"}}
- {"id": "1002","name":"li si","age": 40}
- {"index": {"_index": "test_query","_id": "1003"}}
- {"id": "1003", "name": "wang wu","age" : 50}
- {"index": {"_index": "test_query","_id": "1004"}}
- {"id": "1004","name": "zhangsan", "age" : 30}
- {"index": {"_index": "test_query","_id": "1005"}}
- {"id": "1005","name": "lisi","age":40}
- {"index": {"_index": "test_query","_id": "1006"}}
- {"id": "1006", "name ": "wangwu","age" : 50}
GET 索引名称/_search
比如name字段中包含 zhangsan 的文档
- GET test_query/_search
- {
- "query": {
- "match": {
- "name": "zhangsan"
- }
- }
- }
要注意的是,这种方式查询的结果,表示name 中只要包含了zhangsan这个完整的关键词的文档都会查询出来,因为默认情况下,如果我们未对索引中的字段进行属性映射文件的设置的话,es会对字段进行分词处理;
比如我们再增加下面这条数据
- POST test_query/_doc
- {
- "id":"1007",
- "name":"zhang wu",
- "age":37
- }
再次使用 zhang 这个关键词进行name字段查询时,可以看到下面的效果,简而言之:使用match查询时会带有分词效果;
精准匹配name等于zhangsan这个词的文档,term的效果就像mysql语法中的 where name="XXX"
- GET test_query/_search
- {
- "query": {
- "term": {
- "name": {
- "value": "zhangsan"
- }
- }
- }
- }
某些情况下,不需要查询结果中返回所有的字段,就可以通过添加"_source"进行限制
- GET test_query/_search
- {
- "_source": ["name","age"],
-
- "query": {
- "match": {
- "name": "zhang"
- }
- }
- }
组合查询的关键语法是需要在查询条件中使用bool关键字
这个需求类似于mysql 中的or的语法,在es中使用should可以满足类似的需求
- GET test_query/_search
- {
- "query": {
- "bool": {
- "should": [
- [
- {
- "match":{
- "name":"zhang"
- }
- },
- {
- "match":{
- "age":40
- }
- }
- ]
- ]
- }
- }
- }

组合使用should和must
- GET test_query/_search
- {
- "query": {
- "bool": {
- "must": [
- [
- {
- "match":{
- "name":"zhang"
- }
- }
- ]
- ],
-
- "should": [
- {
- "range": {
- "age": {
- "gte": 30
- }
- }
- }
- ]
- }
- }
- }

查询name中含有 zhang或li的文档,并按照age排序
- GET test_query/_search
- {
-
- "query": {
- "match": {
- "name": "zhang"
- }
- },
- "sort":[
- {
- "age" : {
- "order":"desc"
- }
- }
- ]
- }

语法
GET 索引名称/_search
{
"query": {
"match_all": {}
},
"from": 0, //从第几条开始查询
"size": 2 //每次查询多少数据
}
看下面的查询结果
- GET test_query/_search
- {
- "query": {
- "match_all": {}
- },
- "from": 0,
- "size": 2
- }
实际业务中,经常会涉及到对查询的结果根据某个或者某些字段进行聚合,类似于mysql中的group by语法;
需求1:根据age将查询结果进行分组聚合
注意点:这里 "size"设置为0表示查询结果中不展示其他非聚合结果的信息;
- GET test_query/_search
- {
-
- "aggs": {
- "aggAge": {
- "terms": {
- "field": "age"
- }
- }
- },
-
- "size": 0
- }
需求2:查询年龄大于等于40岁的,并将结果按照age分组聚合
- GET test_query/_search
- {
-
- "query": {
- "range": {
- "age": {
- "gte": 40
- }
- }
- },
-
- "aggs": {
- "aggAge": {
- "terms": {
- "field": "age"
- }
- }
- },
-
- "size": 0
- }

查询结果如下
需求3:根据age分组聚合,再对聚合后的结果按照age求平均值
- GET test_query/_search
- {
- "aggs": {
- "ageAgg": {
- "terms": {
- "field": "age"
- },
-
- "aggs": {
- "avgAgg": {
- "avg": {
- "field": "age"
- }
- }
- }
-
- }
- },
- "size": 0
- }

查询结果如下
需求4:获取结果集中的前N个数据
- GET test_query/_search
- {
- "aggs": {
- "top3": {
- "top_hits": {
- "size": 3
- }
- }
- },
- "size": 0
- }
查询结果如下
需求5:获取结果集中按照age字段排序后求取前N个数据
- GET test_query/_search
- {
- "aggs": {
- "top3": {
- "top_hits": {
- "sort": [
- {
- "age" : {
- "order":"desc"
- }
- }
- ],
- "size": 3
- }
- }
- },
- "size": 0
- }

查询结果如下
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。