elasticsearch＋kafka日志收集和分析以及分布式配置(附)_kafka + elasticsearch 分布式日志

作者：weixin_40725706 | 2024-07-21 07:52:13

踩

kafka + elasticsearch 分布式日志

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">由于公司内部业务需求，需要将大量的请求日志做统计分析，所以用到了elasticsearch全文搜索引擎</span>

一、采用何种方式做日志收集

1、采用mysql数据同步的方式将数据批量写入elasticsearch，这种方式需要自己控制每次最后一次插入数据的状态，以便下次从上次标记的状态继续同步数据，

2、网上给出的方案为jdbc-river这种方式同步过程比较慢，而且对于百万级数据不是最好的选择，另外对于数据的实时收集影响mysql的性能

3、最后采用kafka+elasticsearch的方式做：

具体为：

1）每次请求以及产生的数据都通过数据管道kafka做数据传输，再通过脚本将管道中的数据写入elasticsearch,这里想说的是elasticsearch有个bulk可以批量的导入数据

下面附上elasticsearch的配置以及中文分词的ik的配置方式

本文ElasticSearch2.3.1最新版的安装,如果遇到未知错误请翻墙google，国内的相关文章都比较老

首先从官网官网：https://www.elastic.co/guide/en/sense/current/installing.html下载对应的版本

（首先确保已经有jdk环境，本人jdk版本为1.8.51）这里笔者想说明的是jdk1.8.91安装以后会提示java环境找不到或者是librjava.so找不到，所以最好选择1.7到1.8.51版本

按照官网的提示进行启动发现报错：

Exception in thread "main" java.lang.RuntimeException: don't run elasticsearch as root.
at org.elasticsearch.bootstrap.Bootstrap.initializeNatives(Bootstrap.java:93)
at org.elasti

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/860128