当前位置:   article > 正文

Elasticsearch7.X集成jieba分词插件_jieba es

jieba es

前言

  • jieba分词是中文里面比较好的分词器,而当前Elasticsearch官方没有直接集成jieba分词,需要我们通过配置plugins的方式使用jieba分词器作为es的analyzer。

一、环境介绍 :

  • centOS7
  • elasticsearch 7.9.0
  • elasticsearch-jieba-plugin-7.4.2 (简单的修改,即可适配不同版本的ES)

二、下载针对es的jieba分词插件,当前jieba分词插件对es的支持情况如图

jieba分词插件github地址
对应版本图

  • 本次下载的是7.4.2
    在这里插入图片描述

三、打包&安装&使用

1、修改文件

  • jieba分词插件没有7.9.0版本的,本次下载的是7.4.2
  • 为了适配不同版本ES需要修改 jieba 分词插件版本

根目录下的:build.gradle
主要修改 version和依赖ES的版本,例如为7.9.0的ES打包,这里都改成7.9.0
src/main/resources目录下的:plugin-descriptor.properties
主要修改 version 和 elasticsearch.version 分别表示插件的版本和支持ES的版本,同样,如果是支持7.9.0的插件,都改为7.9.0就可以。

2、自动化打包构建jieba分词插件,需要提前下载gradle工具

# 找到下载文件,解压
unzip elasticsearch-jieba-plugin-7.4.2.zip
# 进入文件夹
cd elasticsearch-jieba-plugin-7.4.2
# gradle进行编译
gradle pz
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

3、拷贝生成的包至Elashticsearch安装路径下的plugins路径

#创建存放 jieba 插件路径
mkdir -p plugins/elasticsearch-jieba-plugin
  • 1
  • 2
  • 打包好的插件在目录: ./build/distributions
cp build/distributions/elasticsearch-jieba-plugin-7.9.0.zip ${elasticsearch_home}/plugins/elasticsearch-jieba-plugin
  • 1

4、解压缩文件并删除压缩包

unzip elasticsearch-jieba-plugin-7.9.0.zip
rm elasticsearch-jieba-plugin-7.9.0.zip
  • 1
  • 2

5、重新启动ES服务

nohup ./bin/elasticsearch >>elasticsearch.log &
  • 1
  • 可以看到es启动日志,已加载jieba插件
    es启动日志

6、用kibana测试jieba分词

  • 繁体
GET /_analyze
{
  "analyzer": "jieba_search",
  "text": "中華人民共和國"
}
  • 1
  • 2
  • 3
  • 4
  • 5

繁体分词

  • 中文
GET /_analyze
{
  "analyzer": "jieba_index",
  "text": "中华人民共和国"
}
  • 1
  • 2
  • 3
  • 4
  • 5

中文分词

四、 CentOS7安装gradle

五、 Kibana 7.9.0插件的安装

六、 ElasticSearch7.9.0集群搭建详细步骤

总结

版本不兼容的处理方法
适配不通ES版本

如果此篇文章有帮助到您, 希望打大佬们能关注点赞收藏评论支持一波,非常感谢大家!
如果有不对的地方请指正!!!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/612300
推荐阅读
  

闽ICP备14008679号