不正经

这个屌丝很懒，什么也没留下！

热门标签

elasticSearch搜索引擎安装使用，SprignBoot整合Spring Data Elasticsearch，百度云 Elasticsearch安装包_elasticsearch搜索引擎构建入门与实战百度云盘

作者：不正经 | 2024-04-03 10:59:33

踩

elasticsearch搜索引擎构建入门与实战百度云盘

* 启动可视化页面：

           E:\Elasticsearch\elasticsearch\elasticsearch-head-master> 执行 grunt server 或者 npm run start

* 启动Elasticsearch
           E:\Elasticsearch\elasticsearch\elasticsearch-6.2.4\bin elasticsearch.bat

* 启动logstash 同步数据库需要配置

   E:\Elasticsearch\elasticsearch\logstash-7.8.1\bin>logstash -f ../mysqletc/mysql.conf


* http://127.0.0.1:9200/ 启动确认
* http://127.0.0.1:9100/ 页面
* 9300 后台调用端口

1.Elasticsearch介绍和安装

在这里插入图片描述
本文章所有安装包百度云链接：

链接: https://pan.baidu.com/s/18Fy-IpiGvopHi_vg5KmTZQ 提取码: 5gx5

1.1.简介

在这里插入图片描述

1.1.1.Elastic

Elastic官网：https://www.elastic.co/cn/

Elastic有一条完整的产品线：Elasticsearch、Kibana、Logstash等，前面说的三个就是大家常说的ELK技术栈。
在这里插入图片描述

1.1.2.Elasticsearch

Elasticsearch官网：https://www.elastic.co/cn/products/elasticsearch
在这里插入图片描述

如上所述，Elasticsearch具备以下特点：

分布式，无需人工搭建集群（solr就需要人为配置，使用Zookeeper作为注册中心）
Restful风格，一切API都遵循Rest原则，容易上手
近实时搜索，数据更新在Elasticsearch中几乎是完全同步的。

1.1.3.版本

目前Elasticsearch最新的版本是6.2.4，我们就使用这个版本

需要JDK1.8及以上

1.2.安装和配置

###1.2.1 下载

在这里插入图片描述

下载地址：https://www.elastic.co/downloads/past-releases
在这里插入图片描述

在这里插入图片描述

1.2.2 安装

elasticsearch无需安装，解压即用。

在这里插入图片描述

1.3.运行

进入elasticsearch/bin目录，可以看到下面的执行文件：

在这里插入图片描述

双击运行

在这里插入图片描述

可以看到绑定了两个端口:

9300：java程序访问的端口
9200：浏览器、postman访问接口

我们在浏览器中访问：http://127.0.0.1:9200

在这里插入图片描述

1.4.安装Head插件

1.4.1.什么是Head

ealsticsearch只是后端提供各种api，那么怎么直观的使用它呢？elasticsearch-head将是一款专门针对于elasticsearch的客户端工具

elasticsearch-head配置包，下载地址：https://github.com/mobz/elasticsearch-head

1.4.2.安装

es5以上版本安装head需要安装node和grunt
node直接打开压缩包直接安装下一步即可

第一步：从地址：https://nodejs.org/en/download/ 下载相应系统的msi，双击安装。

在这里插入图片描述

第二步：安装完成用cmd进入安装目录执行 node -v可查看版本号

在这里插入图片描述

第三步：执行 npm install -g grunt-cli 安装grunt ，【用管理员身份运行CMD】安装完成后执行grunt -version查看是否安装成功，会显示安装的版本号

如果提示grunt 不是内部命令请到执行

在这里插入图片描述

1.4.3.配置运行

第一步：进入es安装目录下的config目录，修改elasticsearch.yml文件.在文件的末尾加入以下代码


http.cors.enabled: true 
http.cors.allow-origin: "*"
node.master: true
node.data: true

然后去掉network.host: 192.168.0.1的注释并改为network.host: 0.0.0.0，去掉cluster.name；node.name；http.port的注释（也就是去掉#）

第二步：双击elasticsearch.bat重启elasticsearch.bat
重要成败在此如果出现闪退用cmd运行查看报错基本是因为JDK问题这个运行不能闪退闪退就会连接失败重新安装JDK就解决类似下边的错

ERROR: [2] bootstrap checks failed

第三步：在https://github.com/mobz/elasticsearch-head中下载head插件，选择下载zip

第四步：解压到指定文件夹下，D:\environment\elasticsearch-head-master 进入该文件夹，修改D:\environment\elasticsearch-head-master\Gruntfile.js 在对应的位置加上hostname:‘*’，

在这里插入图片描述

第五步：在D:\environment\elasticsearch-head-master 下执行npm install

如果失败：

解决方法：
执行 npm install phantomjs-prebuilt@2.1.16 --ignore-scripts

命令用来安装phantomjs-prebuilt@2.1.16，–ignore-scripts参数用于npm install在安装phantomjs-prebuilt@2.1.16时忽略package.json中设置的脚本，意思就是避免package.json中的脚本影响包的正常安装。

安装完成后执行grunt server 或者npm run start 运行head插件，如果不成功重新安装grunt。成功如下

集群健康值是绿色就是成功灰色就是失败见上文

1.4.4.成功

访问：http://127.0.0.1:9100/

集群健康值是绿色就是成功灰色就是失败见上文
在这里插入图片描述

1.5.安装ik分词器

ElasticSearch 默认采用分词器，单个字分词，效果很差

搜索【IK Analyzer 3.0】

ikAnalyzer 分词条件   细颗粒【多】：ik_max_word   粗颗粒分词【少】：ik_smart

http://www.oschina.net/news/2660

在这里插入图片描述

Lucene的IK分词器早在2012年已经没有维护了，现在我们要使用的是在其基础上维护升级的版本，并且开发为Elasticsearch的集成插件了，与Elasticsearch一起维护升级，版本也保持一致，最新版本：6.2.4

1.5.1. 下载

源码下载地址：https://github.com/medcl/elasticsearch-analysis-ik/tree/6.2.x

jar包下载地址：https://github.com/medcl/elasticsearch-analysis-ik/releases

在这里插入图片描述

1.5.1.安装

无需安装，解压即可使用

我们将其改名为ik，并复制到elasticsearch的解压目录，如下图所示

在这里插入图片描述

然后重启elasticsearch：

在这里插入图片描述

1.5.2.扩展词和停用词

扩展词和停用词文件：

在这里插入图片描述

###1.5.4 测试

在这里插入图片描述

2.SprignBoot整合Spring Data Elasticsearch

Elasticsearch提供的Java客户端有一些不太方便的地方：

很多地方需要拼接Json字符串，在java中拼接字符串有多恐怖你应该懂的
需要自己把对象序列化为json存储
查询到结果也需要自己反序列化为对象

因此，我们这里就不讲解原生的Elasticsearch客户端API了。

而是学习Spring提供的套件：Spring Data Elasticsearch

2.1.简介

Spring Data Elasticsearch是Spring Data项目下的一个子模块。

查看 Spring Data的官网：http://projects.spring.io/spring-data/

在这里插入图片描述

Spring Data 是的使命是给各种数据访问提供统一的编程接口，不管是关系型数据库（如MySQL），还是非关系数据库（如Redis），或者类似Elasticsearch这样的索引数据库。从而简化开发人员的代码，提高开发效率。

包含很多不同数据操作的模块：

在这里插入图片描述

Spring Data Elasticsearch的页面：https://projects.spring.io/spring-data-elasticsearch/

在这里插入图片描述

特征：

支持Spring的基于@Configuration的java配置方式，或者XML配置方式
提供了用于操作ES的便捷工具类**ElasticsearchTemplate**。包括实现文档到POJO之间的自动智能映射。
利用Spring的数据转换服务实现的功能丰富的对象映射
基于注解的元数据映射方式，而且可扩展以支持更多不同的数据格式
根据持久层接口自动生成对应实现方法，无需人工编写基本操作代码（类似mybatis，根据接口自动得到实现）。当然，也支持人工定制查询

2.2.创建Demo工程

我们新建一个demo，学习Elasticsearch

pom依赖：


<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
 
    <groupId>com.czxy</groupId>
    <artifactId>bos-es</artifactId>
    <version>0.0.1-SNAPSHOT</version>
    <packaging>jar</packaging>
 
    <name>bos-es</name>
    <description>Demo project for Spring Boot</description>
 
    <parent>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>2.0.4.RELEASE</version>
        <relativePath/> <!-- lookup parent from repository -->
    </parent>
 
    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
        <project.reporting.outputEncoding>UTF-8</project.reporting.outputEncoding>
        <java.version>1.8</java.version>
    </properties>
 
    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-test</artifactId>
            <scope>test</scope>
        </dependency>
    </dependencies>
 
    <build>
        <plugins>
            <plugin>
                <groupId>org.springframework.boot</groupId>
                <artifactId>spring-boot-maven-plugin</artifactId>
            </plugin>
        </plugins>
    </build>
 
 
</project>

application.properties文件配置官方给的：


spring.data.elasticsearch.cluster-name=my-application
spring.data.elasticsearch.cluster-nodes=http://127.0.0.1:9300

http协议是关键， 删除， 不删除会报错
在这里插入图片描述

2.3.索引操作

2.3.1.创建索引和映射

SpringBoot-data-elasticsearch提供了面向对象的方式操作elasticsearch

业务：创建一个商品对象，有这些属性：


     答：id，title，category，brand，price，图片地址
 
在SpringDataElasticSearch中，只需要操作对象，就可以操作elasticsearch中的数据

实体类

首先我们准备好实体类：


public class Item {
    private Long id;
    private String title; //标题
    private String category;// 分类
    private String brand; // 品牌
    private Double price; // 价格
    private String images; // 图片地址
}

映射—注解

Spring Data通过注解来声明字段的映射属性，有下面的三个注解：

@Document 作用在类，标记实体类为文档对象，一般有两个属性
- indexName：对应索引库名称
- type：对应在索引库中的类型
- shards：分片数量，默认5
- replicas：副本数量，默认1
@Id 作用在成员变量，标记一个字段作为id主键
@Field 作用在成员变量，标记为文档的字段，并指定字段映射属性：
- type：字段类型，是是枚举：FieldType，可以是text、long、short、date、integer、object等
  - text：存储数据时候，会自动分词，并生成索引
  - keyword：存储数据时候，不会分词建立索引
  - Numerical：数值类型，分两类
    - 基本数据类型：long、interger、short、byte、double、float、half_float
    - 浮点数的高精度类型：scaled_float
      - 需要指定一个精度因子，比如10或100。elasticsearch会把真实值乘以这个因子后存储，取出时再还原。
  - Date：日期类型
    - elasticsearch可以对日期格式化为字符串存储，但是建议我们存储为毫秒值，存储为long，节省空间。
- index：是否索引，布尔类型，默认是true
- store：是否存储，布尔类型，默认是false
- analyzer：分词器名称，这里的ik_max_word即使用ik分词器

示例：


@Document(indexName = "item",type = "docs", shards = 1, replicas = 0)
public class Item {
    @Id
    private Long id;
    
    @Field(type = FieldType.Text, analyzer = "ik_max_word")
    private String title; //标题
    
    @Field(type = FieldType.Keyword)
    private String category;// 分类
    
    @Field(type = FieldType.Keyword)
    private String brand; // 品牌
    
    @Field(type = FieldType.Double)
    private Double price; // 价格
    
    @Field(index = false, type = FieldType.Keyword)
    private String images; // 图片地址
}

创建索引

ElasticsearchTemplate中提供了创建索引的API：

在这里插入图片描述

可以根据类的信息自动生成，也可以手动指定indexName和Settings

映射

映射相关的API：

在这里插入图片描述

一样，可以根据类的字节码信息（注解配置）来生成映射，或者手动编写映射

我们这里采用类的字节码信息创建索引并映射：


@Test
public void createIndex() {
    // 创建索引，会根据Item类的@Document注解信息来创建
    esTemplate.createIndex(Item.class);
    // 配置映射，会根据Item类中的id、Field等字段来自动完成映射
    esTemplate.putMapping(Item.class);
}

索引信息：

在这里插入图片描述

2.3.2.删除索引

删除索引的API：

在这里插入图片描述

可以根据类名或索引名删除。

示例：


@Test
public void deleteIndex() {
    esTemplate.deleteIndex(Item.class);
    // 根据索引名字删除
    //esTemplate.deleteIndex("item1");
}

结果：OK

2.4.新增文档数据

2.4.1.Repository接口

Spring Data 的强大之处，就在于你不用写任何DAO处理，自动根据方法名或类的信息进行CRUD操作。只要你定义一个接口，然后继承Repository提供的一些子接口，就能具备各种基本的CRUD功能。

来看下Repository的继承关系：

在这里插入图片描述

我们看到有一个ElasticsearchCrudRepository接口：

在这里插入图片描述

所以，我们只需要定义接口，然后继承它就OK了。


public interface ItemRepository extends ElasticsearchRepository<Item,Long> {
}

接下来，我们测试新增数据：

2.4.2.新增一个对象


@Autowired
private ItemRepository itemRepository;
 
@Test
public void index() {
    Item item = new Item(1L, "小米手机7", " 手机",
                         "小米", 3499.00, "http://image.baidu.com/13123.jpg");
    itemRepository.save(item);
}

去页面查询看看：

在这里插入图片描述

2.4.3.批量新增

代码：


@Test
public void indexList() {
    List<Item> list = new ArrayList<>();
    list.add(new Item(2L, "坚果手机R1", " 手机", "锤子", 3699.00, "http://image.baidu.com/13123.jpg"));
    list.add(new Item(3L, "华为META10", " 手机", "华为", 4499.00, "http://image.baidu.com/13123.jpg"));
    // 接收对象集合，实现批量新增
    itemRepository.saveAll(list);
}

再次去页面查询：

在这里插入图片描述

2.4.4.修改

elasticsearch中本没有修改，它的是该是先删除在新增

修改和新增是同一个接口，区分的依据就是id。


@Test
public void index(){
    Item item = new Item(1L, "苹果XSMax", " 手机",
            "小米", 3499.00, "http://image.baidu.com/13123.jpg");
    itemRepository.save(item);
}

查看结果：

在这里插入图片描述

2.5.查询

2.5.1.基本查询

ElasticsearchRepository提供了一些基本的查询方法：

在这里插入图片描述

我们来试试查询所有：


@Test
    public void testQueryAll(){
        // 查找所有
        //Iterable<Item> list = this.itemRepository.findAll();
        // 对某字段排序查找所有 Sort.by("price").descending() 降序
        // Sort.by("price").ascending():升序
        Iterable<Item> list = this.itemRepository.findAll(Sort.by("price").ascending());
 
        for (Item item:list){
            System.out.println(item);
        }
    }

结果：

在这里插入图片描述

2.5.2.自定义方法

Spring Data 的另一个强大功能，是根据方法名称自动实现功能。

比如：你的方法名叫做：findByTitle，那么它就知道你是根据title查询，然后自动帮你完成，无需写实现类。

当然，方法名称要符合一定的约定：

Keyword	Sample
`And`	`findByNameAndPrice`
`Or`	`findByNameOrPrice`
`Is`	`findByName`
`Not`	`findByNameNot`
`Between`	`findByPriceBetween`
`LessThanEqual`	`findByPriceLessThan`
`GreaterThanEqual`	`findByPriceGreaterThan`
`Before`	`findByPriceBefore`
`After`	`findByPriceAfter`
`Like`	`findByNameLike`
`StartingWith`	`findByNameStartingWith`
`EndingWith`	`findByNameEndingWith`
`Contains/Containing`	`findByNameContaining`
`In`	`findByNameIn(Collection<String>names)`
`NotIn`	`findByNameNotIn(Collection<String>names)`
`Near`	`findByStoreNear`
`True`	`findByAvailableTrue`
`False`	`findByAvailableFalse`
`OrderBy`	`findByAvailableTrueOrderByNameDesc`

例如，我们来按照价格区间查询，定义这样的一个方法：


public interface ItemRepository extends ElasticsearchRepository<Item,Long> {
 
    /**
     * 根据价格区间查询
     * @param price1
     * @param price2
     * @return
     */
    List<Item> findByPriceBetween(double price1, double price2);
}

然后添加一些测试数据：


@Test
public void indexList() {
    List<Item> list = new ArrayList<>();
    list.add(new Item(1L, "小米手机7", "手机", "小米", 3299.00, "http://image.baidu.com/13123.jpg"));
    list.add(new Item(2L, "坚果手机R1", "手机", "锤子", 3699.00, "http://image.baidu.com/13123.jpg"));
    list.add(new Item(3L, "华为META10", "手机", "华为", 4499.00, "http://image.baidu.com/13123.jpg"));
    list.add(new Item(4L, "小米Mix2S", "手机", "小米", 4299.00, "http://image.baidu.com/13123.jpg"));
    list.add(new Item(5L, "荣耀V10", "手机", "华为", 2799.00, "http://image.baidu.com/13123.jpg"));
    // 接收对象集合，实现批量新增
    itemRepository.saveAll(list);
}

不需要写实现类，然后我们直接去运行：


@Test
public void queryByPriceBetween(){
    List<Item> list = this.itemRepository.findByPriceBetween(2000.00, 3500.00);
    for (Item item : list) {
        System.out.println("item = " + item);
    }
}

结果：
在这里插入图片描述

2.5.3.自定义查询

先来看最基本的match query：


@Test
public void search(){
    // 构建查询条件
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    // 添加基本分词查询
    queryBuilder.withQuery(QueryBuilders.matchQuery("title", "小米手机"));
    // 搜索，获取结果
    Page<Item> items = this.itemRepository.search(queryBuilder.build());
    // 总条数
    long total = items.getTotalElements();
    System.out.println("total = " + total);
    for (Item item : items) {
        System.out.println(item);
    }
}

NativeSearchQueryBuilder：Spring提供的一个查询条件构建器，帮助构建json格式的请求体
QueryBuilders.matchQuery(“title”, “小米手机”)：利用QueryBuilders来生成一个查询。QueryBuilders提供了大量的静态方法，用于生成各种不同类型的查询：

在这里插入图片描述

Page<item>：默认是分页查询，因此返回的是一个分页的结果对象，包含属性：
- totalElements：总条数
- totalPages：总页数
- Iterator：迭代器，本身实现了Iterator接口，因此可直接迭代得到当前页的数据
- 其它属性：

结果：

在这里插入图片描述

总的测试代码：


/**
     *
     * termQuery
     * wildcardQuery
     * fuzzyquery
     * booleanQuery
     * numericRangeQuery
     *
     */
    @Test
    public void testMathQuery(){
        // 创建对象
        NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
        // 在queryBuilder对象中自定义查询
        //matchQuery:底层就是使用的termQuery
        queryBuilder.withQuery(QueryBuilders.matchQuery("title","坚果"));
        //查询，search 默认就是分页查找
        Page<Item> page = this.itemRepository.search(queryBuilder.build());
        //获取数据
        long totalElements = page.getTotalElements();
        System.out.println("获取的总条数:"+totalElements);
 
        for(Item item:page){
            System.out.println(item);
        }
 
 
    }
 
 
    /**
     * termQuery:功能更强大，除了匹配字符串意外，还可以匹配int/long/double/float/....
     */
    @Test
    public void testTermQuery(){
        NativeSearchQueryBuilder builder = new NativeSearchQueryBuilder();
        builder.withQuery(QueryBuilders.termQuery("price",998.0));
        // 查找
        Page<Item> page = this.itemRepository.search(builder.build());
 
        for(Item item:page){
            System.out.println(item);
        }
    }
 
    @Test
    public void testBooleanQuery(){
        NativeSearchQueryBuilder builder = new NativeSearchQueryBuilder();
 
        builder.withQuery(
                QueryBuilders.boolQuery().must(QueryBuilders.matchQuery("title","华为"))
                                         .must(QueryBuilders.matchQuery("brand","华为"))
        );
 
        // 查找
        Page<Item> page = this.itemRepository.search(builder.build());
        for(Item item:page){
            System.out.println(item);
        }
    }
 
 
    @Test
    public void testFuzzyQuery(){
        NativeSearchQueryBuilder builder = new NativeSearchQueryBuilder();
        builder.withQuery(QueryBuilders.fuzzyQuery("title","faceoooo"));
        Page<Item> page = this.itemRepository.search(builder.build());
        for(Item item:page){
            System.out.println(item);
        }
 
    }

2.5.4.分页查询

利用NativeSearchQueryBuilder可以方便的实现分页：


@Test
public void searchByPage(){
    // 构建查询条件
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    // 添加基本分词查询
    queryBuilder.withQuery(QueryBuilders.termQuery("category", "手机"));
    // 分页：
    int page = 0;
    int size = 2;
    queryBuilder.withPageable(PageRequest.of(page,size));
 
    // 搜索，获取结果
    Page<Item> items = this.itemRepository.search(queryBuilder.build());
    // 总条数
    long total = items.getTotalElements();
    System.out.println("总条数 = " + total);
    // 总页数
    System.out.println("总页数 = " + items.getTotalPages());
    // 当前页
    System.out.println("当前页：" + items.getNumber());
    // 每页大小
    System.out.println("每页大小：" + items.getSize());
 
    for (Item item : items) {
        System.out.println(item);
    }
}

结果：

在这里插入图片描述

可以发现，Elasticsearch中的分页是从第0页开始。

2.5.5.排序

排序也通用通过NativeSearchQueryBuilder完成：


@Test
public void searchAndSort(){
    // 构建查询条件
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    // 添加基本分词查询
    queryBuilder.withQuery(QueryBuilders.termQuery("category", "手机"));
 
    // 排序
    queryBuilder.withSort(SortBuilders.fieldSort("price").order(SortOrder.ASC));
 
    // 搜索，获取结果
    Page<Item> items = this.itemRepository.search(queryBuilder.build());
    // 总条数
    long total = items.getTotalElements();
    System.out.println("总条数 = " + total);
 
    for (Item item : items) {
        System.out.println(item);
    }
}

结果：

在这里插入图片描述

2.6.聚合（NB！！solr无此功能）

聚合可以让我们极其方便的实现对数据的统计、分析。例如：

什么品牌的手机最受欢迎？
这些手机的平均价格、最高价格、最低价格？
这些手机每月的销售情况如何？

实现这些统计功能的比数据库的sql要方便的多，而且查询速度非常快，可以实现近实时搜索效果。

2.6.1 基本概念

Elasticsearch中的聚合，包含多种类型，最常用的两种，一个叫桶，一个叫度量：

桶（bucket）

桶的作用，是按照某种方式对数据进行分组，每一组数据在ES中称为一个桶，例如我们根据国籍对人划分，可以得到中国桶、英国桶，日本桶……或者我们按照年龄段对人进行划分：010,1020,2030,3040等。

Elasticsearch中提供的划分桶的方式有很多：

Date Histogram Aggregation：根据日期阶梯分组，例如给定阶梯为周，会自动每周分为一组
Histogram Aggregation：根据数值阶梯分组，与日期类似
Terms Aggregation：根据词条内容分组，词条内容完全匹配的为一组
Range Aggregation：数值和日期的范围分组，指定开始和结束，然后按段分组
……

综上所述，我们发现bucket aggregations 只负责对数据进行分组，并不进行计算，因此往往bucket中往往会嵌套另一种聚合：metrics aggregations即度量

度量（metrics）

分组完成以后，我们一般会对组中的数据进行聚合运算，例如求平均值、最大、最小、求和等，这些在ES中称为度量

比较常用的一些度量聚合方式：

Avg Aggregation：求平均值
Max Aggregation：求最大值
Min Aggregation：求最小值
Percentiles Aggregation：求百分比
Stats Aggregation：同时返回avg、max、min、sum、count等
Sum Aggregation：求和
Top hits Aggregation：求前几
Value Count Aggregation：求总数
……

注意：在ES中，需要进行聚合、排序、过滤的字段其处理方式比较特殊，因此不能被分词。这里我们将color和make这两个文字类型的字段设置为keyword类型，这个类型不会被分词，将来就可以参与聚合

2.6.2.聚合为桶

桶就是分组，比如这里我们按照品牌brand进行分组：


@Test
public void testAgg(){
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    // 不查询任何结果
    queryBuilder.withSourceFilter(new FetchSourceFilter(new String[]{""}, null));
    // 1、添加一个新的聚合，聚合类型为terms，聚合名称为brands，聚合字段为brand
    queryBuilder.addAggregation(
        AggregationBuilders.terms("brands").field("brand"));
    // 2、查询,需要把结果强转为AggregatedPage类型
    AggregatedPage<Item> aggPage = (AggregatedPage<Item>) this.itemRepository.search(queryBuilder.build());
    // 3、解析
    // 3.1、从结果中取出名为brands的那个聚合，
    // 因为是利用String类型字段来进行的term聚合，所以结果要强转为StringTerm类型
    StringTerms agg = (StringTerms) aggPage.getAggregation("brands");
    // 3.2、获取桶
    List<StringTerms.Bucket> buckets = agg.getBuckets();
    // 3.3、遍历
    for (StringTerms.Bucket bucket : buckets) {
        // 3.4、获取桶中的key，即品牌名称
        System.out.println(bucket.getKeyAsString());
        // 3.5、获取桶中的文档数量
        System.out.println(bucket.getDocCount());
    }
 
}

显示的结果：

在这里插入图片描述

关键API：

AggregationBuilders：聚合的构建工厂类。所有聚合都由这个类来构建，看看他的静态方法：


（1）统计某个字段的数量
  ValueCountBuilder vcb=  AggregationBuilders.count("count_uid").field("uid");
（2）去重统计某个字段的数量（有少量误差）
 CardinalityBuilder cb= AggregationBuilders.cardinality("distinct_count_uid").field("uid");
（3）聚合过滤
FilterAggregationBuilder fab= AggregationBuilders.filter("uid_filter").filter(QueryBuilders.queryStringQuery("uid:001"));
（4）按某个字段分组
TermsBuilder tb=  AggregationBuilders.terms("group_name").field("name");
（5）求和
SumBuilder  sumBuilder=	AggregationBuilders.sum("sum_price").field("price");
（6）求平均
AvgBuilder ab= AggregationBuilders.avg("avg_price").field("price");
（7）求最大值
MaxBuilder mb= AggregationBuilders.max("max_price").field("price"); 
（8）求最小值
MinBuilder min=	AggregationBuilders.min("min_price").field("price");
（9）按日期间隔分组
DateHistogramBuilder dhb= AggregationBuilders.dateHistogram("dh").field("date");
（10）获取聚合里面的结果
TopHitsBuilder thb=  AggregationBuilders.topHits("top_result");
（11）嵌套的聚合
NestedBuilder nb= AggregationBuilders.nested("negsted_path").path("quests");
（12）反转嵌套
AggregationBuilders.reverseNested("res_negsted").path("kps ");

AggregatedPage：聚合查询的结果类。它是Page<T>的子接口：

AggregatedPage在Page功能的基础上，拓展了与聚合相关的功能，它其实就是对聚合结果的一种封装。

在这里插入图片描述

而返回的结果都是Aggregation类型对象，不过根据字段类型不同，又有不同的子类表示

在这里插入图片描述

2.6.2.嵌套聚合，求平均值

代码：


@Test
public void testSubAgg(){
    NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
    // 不查询任何结果
    queryBuilder.withSourceFilter(new FetchSourceFilter(new String[]{""}, null));
    // 1、添加一个新的聚合，聚合类型为terms，聚合名称为brands，聚合字段为brand
    queryBuilder.addAggregation(
        AggregationBuilders.terms("brands").field("brand")
        .subAggregation(AggregationBuilders.avg("priceAvg").field("price")) // 在品牌聚合桶内进行嵌套聚合，求平均值
    );
    // 2、查询,需要把结果强转为AggregatedPage类型
    AggregatedPage<Item> aggPage = (AggregatedPage<Item>) this.itemRepository.search(queryBuilder.build());
    // 3、解析
    // 3.1、从结果中取出名为brands的那个聚合，
    // 因为是利用String类型字段来进行的term聚合，所以结果要强转为StringTerm类型
    StringTerms agg = (StringTerms) aggPage.getAggregation("brands");
    // 3.2、获取桶
    List<StringTerms.Bucket> buckets = agg.getBuckets();
    // 3.3、遍历
    for (StringTerms.Bucket bucket : buckets) {
        // 3.4、获取桶中的key，即品牌名称  3.5、获取桶中的文档数量
        System.out.println(bucket.getKeyAsString() + "，共" + bucket.getDocCount() + "台");
 
        // 3.6.获取子聚合结果：
        InternalAvg avg = (InternalAvg) bucket.getAggregations().asMap().get("priceAvg");
        System.out.println("平均售价：" + avg.getValue());
    }
 
}

结果：

在这里插入图片描述

2.7.基本概念

Elasticsearch也是基于Lucene的全文检索库，本质也是存储数据，很多概念与MySQL类似的。

对比关系：

索引库（indices）--------------------------------Databases 数据库


类型（type）-----------------------------Table 数据表
 
     文档（Document）----------------Row 行
 
	   字段（Field）-------------------Columns 列

详细说明：

概念	说明
索引库（indices)	indices是index的复数，代表许多的索引，
类型（type）	类型是模拟mysql中的table概念，一个索引库下可以有不同类型的索引，比如商品索引，订单索引，其数据格式不同。不过这会导致索引库混乱，因此未来版本中会移除这个概念
文档（document）	存入索引库原始的数据。比如每一条商品信息，就是一个文档
字段（field）	文档中的属性
映射配置（mappings）	字段的数据类型、属性、是否索引、是否存储等特性

是不是与Lucene中的概念类似。

另外，在Elasticsearch有一些集群相关的概念：

索引集（Indices，index的复数）：逻辑上的完整索引
分片（shard）：数据拆分后的各个部分
副本（replica）：每个分片的复制

要注意的是：Elasticsearch本身就是分布式的，因此即便你只有一个节点，Elasticsearch默认也会对你的数据进行分片和副本操作，当你向集群添加新数据时，数据也会在新加入的节点中进行平衡。

注意：

如果后台报错：

解决方法：

在 Elasticsearch中的 config/jvm.options 文件里把“-Dfile.encoding=UTF-8”改为“-Dfile.encoding=GBK”
然后重启 Elasticsearch 即可

另外：如何查看自己分词后的结果：


package com.wl.partner.controller;
 
import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.cre.dmp.osp.common.config.openapi.OpenApi;
import com.cre.dmp.osp.common.web.BaseController;
import com.wl.partner.dao.PartnerDao;
import com.wl.partner.entity.Dealer;
import com.wl.partner.entity.Partner;
import org.elasticsearch.action.admin.indices.analyze.AnalyzeAction;
import org.elasticsearch.action.admin.indices.analyze.AnalyzeRequestBuilder;
import org.elasticsearch.action.admin.indices.analyze.AnalyzeResponse;
import org.elasticsearch.index.query.QueryBuilders;
 
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.domain.Page;
import org.springframework.data.domain.PageRequest;
import org.springframework.data.elasticsearch.core.ElasticsearchTemplate;
import org.springframework.data.elasticsearch.core.query.NativeSearchQueryBuilder;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestMethod;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
 
import java.util.ArrayList;
import java.util.List;
 
/**
 * 启动可视化页面：    E:\Elasticsearch\elasticsearch\elasticsearch-head-master>npm run start
 * 启动Elasticsearch  E:\Elasticsearch\elasticsearch\elasticsearch-6.2.4\bin  elasticsearch.bat
 * http://127.0.0.1:9200/ 启动确认
 * http://127.0.0.1:9100/ 页面
 * 9300 后台调用端口
 *
 * 1.如何页面创建索引?
 * 2.如何页面删除索引
 * 3.如何查看分词之后得结果
 * 4.如何实时更新修改已建立索引的的数据（变更删除更细新增怎么办）
 */
@RestController
@RequestMapping("/testController")
public class TestController extends BaseController {
    @Autowired
    ElasticsearchTemplate elasticsearchTemplate;
    @Autowired
    private PartnerDao partnerDao;//合伙人
 
    @RequestMapping(value = "/createIndex", method = {RequestMethod.POST})
    public void createIndex() {
        // 创建索引，会根据Item类的@Document注解信息来创建
        elasticsearchTemplate.createIndex(Dealer.class);
        // 配置映射，会根据Item类中的id、Field等字段来自动完成映射
        elasticsearchTemplate.putMapping(Dealer.class);
    }
 
    @RequestMapping(value = "/deleteIndex", method = {RequestMethod.POST})
    public void deleteIndex() {
        elasticsearchTemplate.deleteIndex(Partner.class);
        // 根据索引名字删除
        //esTemplate.deleteIndex("item1");
    }
    @RequestMapping(value = "/createPartnerIndex", method = {RequestMethod.POST})
    public void createPartnerIndex() {
        // 创建索引，会根据Item类的@Document注解信息来创建
        elasticsearchTemplate.createIndex(Partner.class);
        // 配置映射，会根据Item类中的id、Field等字段来自动完成映射
       // elasticsearchTemplate.putMapping(Partner.class);
    }
 
    /**
     * http://localhost:7102/wl-ltx-partner-api/testController/testPartnerAll
     */
    @RequestMapping(value = "/testPartnerAll", method = {RequestMethod.POST})
    public void testPartnerAll(){
            // 构建查询条件
            NativeSearchQueryBuilder queryBuilder = new NativeSearchQueryBuilder();
            // 添加基本分词查询
            //queryBuilder.withQuery(QueryBuilders.termQuery("partnerName", "郑"));
             queryBuilder.withQuery(QueryBuilders.termQuery("partnerAddress", "漯河"));
            // 分页：
            int page = 0;
            int size = 2;
            queryBuilder.withPageable(PageRequest.of(page,size));
 
            // 搜索，获取结果
            Page<Partner> items = this.partnerDao.search(queryBuilder.build());
            // 总条数
            long total = items.getTotalElements();
            System.out.println("总条数 = " + total);
            // 总页数
            System.out.println("总页数 = " + items.getTotalPages());
            // 当前页
            System.out.println("当前页：" + items.getNumber());
            // 每页大小
            System.out.println("每页大小：" + items.getSize());
            for (Partner item : items) {
                System.out.println(item);
            }
 
    }
 
    /**
     *  查看分词之后得结果数据
     *  searchContent  分词内容
     *  ikAnalyzer 分词条件   细颗粒【多】：ik_max_word   粗颗粒分词【少】：ik_smart
     *   http://localhost:7102/wl-ltx-partner-api/testController/getIkAnalyzeSearchTerms
     *
     * {"searchContent":"中华人民共和国人民大会堂","ikAnalyzer":"ik_max_word" }
     *"{searchContent":"中华人民共和国人民大会堂","ikAnalyzer":"ik_smart" }
     * [partner_item] 参数 为http://127.0.0.1:9100/ 所建立的索引
     *
     * @return
     */
    @OpenApi
    @RequestMapping(value = "/getIkAnalyzeSearchTerms", method = {RequestMethod.POST})
    private List<String> getIkAnalyzeSearchTerms(@OpenApi  @RequestParam(value = "jsonDate", required = true) String jsonDateString) {
        JSONObject jsonObject = JSON.parseObject(jsonDateString);
        String searchContent = (String) jsonObject.get("searchContent");
        String ikAnalyzer = (String) jsonObject.get("ikAnalyzer");
        // 调用 IK 分词分词
        AnalyzeRequestBuilder ikRequest = new AnalyzeRequestBuilder(elasticsearchTemplate.getClient(),
                AnalyzeAction.INSTANCE, "partner_item", searchContent);
 
        //【partner_item 】自定义的http://127.0.0.1:9100/ 数据浏览中的自己索引名字
 
        ikRequest.setTokenizer(ikAnalyzer);
        List<AnalyzeResponse.AnalyzeToken> tokenList = ikRequest.execute().actionGet().getTokens();
 
        // 循环赋值
        List<String> searchTermList = new ArrayList<>();
        tokenList.forEach(ikToken -> {
            searchTermList.add(ikToken.getTerm());
        });
        return searchTermList;
    }
  }

细颗粒分词：ik_max_word

粗颗粒分词：ik_smart

错误二：

解决办法：

1、原因：防火墙拦截

2、解决方法：关闭防火墙。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/不正经/article/detail/355225

elasticSearch搜索引擎安装使用，SprignBoot整合Spring Data Elasticsearch，百度云 Elasticsearch安装包_elasticsearch搜索引擎构建入门与实战 百度云盘

1.Elasticsearch介绍和安装

1.1.简介

1.1.1.Elastic

1.1.2.Elasticsearch

1.1.3.版本

1.2.安装和配置

1.2.2 安装

1.3.运行

1.4.安装Head插件

1.4.1.什么是Head

1.4.2.安装

1.4.3.配置运行

1.4.4.成功

1.5.安装ik分词器

1.5.1. 下载

1.5.1.安装

1.5.2.扩展词和停用词

2.SprignBoot整合Spring Data Elasticsearch

2.1.简介

2.2.创建Demo工程

2.3.索引操作

2.3.1.创建索引和映射

2.3.2.删除索引

2.4.新增文档数据

2.4.1.Repository接口

2.4.2.新增一个对象

2.4.3.批量新增

2.4.4.修改

2.5.查询

2.5.1.基本查询

2.5.2.自定义方法

2.5.3.自定义查询

2.5.4.分页查询

2.5.5.排序

2.6.聚合（NB！！solr无此功能）

2.6.1 基本概念

2.6.2.聚合为桶

2.6.2.嵌套聚合，求平均值

2.7.基本概念

注意：

1、原因：防火墙拦截

2、解决方法：关闭防火墙。

elasticSearch搜索引擎安装使用，SprignBoot整合Spring Data Elasticsearch，百度云 Elasticsearch安装包_elasticsearch搜索引擎构建入门与实战百度云盘