当前位置:   article > 正文

ELK+filebeat+kafka部署 (3)Kafka部署_filebeat kafka配置详解

filebeat kafka配置详解

目录

部署Kafka

1.部署jdk

上传软件包

解压jdk 

配置jdk环境变量

查看java 环境

 2.安装zookeeper

配置hosts 映射

解压安装包

创建快照日志存放目录

创建事务日志方法目录

生成配置文件

修改配置文件zoo.cfg

添加path环境变量

启动zookeeper

 添加开机自启

3.Kafka单节点 单Broker部署

上传解压软件到指定目录

修改配置文件

创建日志目录

添加path 环境变量

启动kafka

添加开机自启动

4. 设置filebeat

修改filebeatyml配置文件

修改hosts

重启filebeat

查看kafka上所有的topic 信息

启动一个消费者获取信息

5.配置logstash

添加hosts解析

修改logstash 配置文件

重启logstash

 6.在kibana上查看数据


部署kafka

为了防止收集日志信息太多或者服务器down机导致的信息丢失,我们这里引入kafka消息队列服务器也起到了日志缓冲的作用,我们这里搭建单节点的kafka,在实际环境下应该使用集群方式部署

1.部署jdk

zookeeper依赖 java 环境 ,所以我们需要安装 jdk官网建议 最低安装 jdk 1.8 版本

zookeeper下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/stable/apache-zookeeper-3.5.5-bin.tar.gz

上传软件包

解压jdk 

tar zxf jdk-8u171-linux-x64.tar.gz -C /usr/local/

配置jdk环境变量

vim /etc/profile
  1. JAVA_HOME=/usr/local/jdk1.8.0_171
  2. PATH=$JAVA_HOME/bin:$PATH
  3. CLASSPATH=$JAVA_HOME/jre/lib/ext:$JAVA_HOME/lib/tools.jar
  4. export PATH JAVA_HOME CLASSPATH
source /etc/profile  #使环境变量生效

查看java 环境

java -version

 2.安装zookeeper

配置hosts 映射

vim /etc/hosts
192.168.30.13 cong13

解压安装包

tar -zxf apache-zookeeper-3.5.5-bin.tar.gz -C /usr/local/

创建快照日志存放目录

mkdir -p /data/zk/data

创建事务日志方法目录

 mkdir -p /data/zk/datalog

生成配置文件

  1. cd /usr/local/apache-zookeeper-3.5.5-bin/conf/
  2. cp zoo_sample.cfg zoo.cfg #复制一份zoo_sample.cfg文件并命名为zoo.cfg

修改配置文件zoo.cfg

vim zoo.cfg 
  1. dataDir=/data/zk/data #修改这一行为我们创建的目录
  2. dataLogDir=/data/zk/datalog #添加这一行

添加path环境变量

  1. export ZOOKEEPER_HOME=/usr/local/apache-zookeeper-3.5.5-bin
  2. export PATH=$ZOOKEEPER_HOME/bin:$PATH
source /etc/profile

启动zookeeper

  1. [root@cong13 ~]# zkServer.sh start
  2. ZooKeeper JMX enabled by default
  3. Using config: /usr/local/apache-zookeeper-3.5.5-bin/bin/../conf/zoo.cfg
  4. Starting zookeeper ... STARTED

查看zookeeper的状态

 zkServer.sh status

 或者执行jps查看状态,其中QuorumPeerMain是zookeeper进程

 添加开机自启

方法1:添加/etc/rc.local文件

echo "source /etc/profile" >> /etc/rc.local
echo "cd /usr/local/apache-zookeeper-3.5.5-bin/bin && ./zkServer.sh start " >> /etc/rc.local
chmod +x /etc/rc.local

方法二:将zookeeper添加到开机自启服务

在/lib/systemd/system/文件夹下创建一个启动脚本zookeeper.service

 vim /lib/systemd/system/zookeeper.service
  1. [Unit]
  2. Description=Zookeeper service
  3. After=network.target
  4. [Service]
  5. Type=forking
  6. Environment="JAVA_HOME=/usr/local/jdk1.8.0_171"
  7. User=root
  8. Group=root
  9. ExecStart=/usr/local/apache-zookeeper-3.5.5-bin/bin/zkServer.sh start
  10. ExecStop=/usr/local/apache-zookeeper-3.5.5-bin/bin/zkServer.sh stop
  11. [Install]
  12. WantedBy=multi-user.target
  1. systemctl daemon-reload
  2. systemctl enable zookeeper

3.Kafka单节点 单Broker部署

官网地址:Apache Kafka

上传解压软件到指定目录

 tar zxf kafka_2.12-2.2.0.tgz -C /usr/local/

修改配置文件

vim /usr/local/kafka_2.12-2.2.0/config/server.properties
  1. # broker的全局唯一编号,不能重复
  2. broker.id=0
  3. # 监听
  4. listeners=PLAINTEXT://:9092 #开启此项
  5. # 日志目录
  6. log.dirs=/data/kafka/log #修改日志目录
  7. # 配置zookeeper的连接(如果不是本机,需要该为ip或主机名)
  8. zookeeper.connect=localhost:2181

创建日志目录

mkdir -p /data/kafka/log

添加path 环境变量

  1. export KAFKA_HOME=/usr/local/kafka_2.12-2.2.0
  2. export PATH=$KAFKA_HOME/bin:$PATH
source /etc/profile

启动kafka

后台启动kafka

kafka-server-start.sh  -daemon /usr/local/kafka_2.12-2.2.0/config/server.properties 

添加开机自启动

将kafka添加到开机自启服务

在/lib/systemd/system/文件夹下创建一个启动脚本kafka.service

  1. [Unit]
  2. Description=Apache Kafka server (broker)
  3. After=network.target zookeeper.service
  4. [Service]
  5. Type=simple
  6. Environment="PATH=/usr/local/jdk1.8.0_171/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin"
  7. User=root
  8. Group=root
  9. ExecStart=/usr/local/kafka_2.12-2.2.0/bin/kafka-server-start.sh /usr/local/kafka_2.12-2.2.0/config/server.properties
  10. ExecStop=/usr/local/kafka_2.12-2.2.0/bin/kafka-server-stop.sh
  11. Restart=on-failure
  12. [Install]
  13. WantedBy=multi-user.target
  1. systemctl daemon-reload
  2. systemctl enable kafka

测试:

kill 3607

 systemctl start kafka

4. 设置filebeat

修改filebeatyml配置文件

修改 filebeat 配置文件,把filebeat收集到的nginx日志保存到kafka消息队列中。把output.elasticsearch和output.logstash都给注释掉,添加kafka项

[root@cong12 ~]# vim /usr/local/filebeat/filebeat.yml 
  1. - type: log
  2. enabled: true #开启此配置
  3. paths:
  4. - /usr/local/nginx/logs/*.log #添加收集nginx服务日志
  5. #- /var/log/*.log #注释该行
  6. #-------------------------- Elasticsearch output ------------------------------
  7. #output.elasticsearch: # Elasticsearch这部分全部注释掉
  8. # Array of hosts to connect to.
  9. #hosts: ["localhost:9200"]
  10. #----------------------------- Logstash output --------------------------------
  11. #output.logstash: # logstash这部分全部注释掉
  12. # The Logstash hosts
  13. #hosts: ["192.168.30.11:5044"]
  14. #在Logstash后面添加如下行
  15. #----------------------------- KAFKA output --------------------------------
  16. output.kafka: #把日志发送给kafka
  17. enabled: true #开启kafka模块
  18. hosts: ["192.168.30.13:9092"] #填写kafka服务器地址
  19. topic: nginx_logs #填写kafka的topic(主题),自定义的

 把output.elasticsearch和output.logstash都给注释掉,然后在output.logstash结尾添加KAFKA output把日志数据发送给kafka。需要注意的是kafka中如果不存在这个topic,则会自动创建。如果有多个kafka服务器,可用逗号分隔

修改hosts

这里需要添加kafka的hosts解析,如不添加则会报错

[root@cong12 ~]# vim /etc/hosts
  1. 192.168.30.12 cong12
  2. 192.168.30.13 cong13

重启filebeat

  1. kill 919
  2. cd /usr/local/filebeat/ && ./filebeat -e -c filebeat.yml

注: 当启动时没有显示kafka,一、需要访问nginx的测试页,目的是产生日志记录,filebeat作为消息的生产者才可以将日志数据写到kafka

二、配置文件配置错误

查看kafka上所有的topic 信息

 在kafka服务器上查看filebeat保存的数据,topice为nginx_logs

kafka-topics.sh --list --zookeeper localhost:2181

启动一个消费者获取信息

 启动一个消费者去查看filebeat发送过来的消息,能看到消息说明我们的filebeat的output.kafka配置成功。接下来配置logstash去kafka消费数据

5.配置logstash

配置logstash去kafka拿取数据,进行数据格式化,然后把格式化的数据保存到Elasticsearch,通过kibana展示给用户。kibana是通过Elasticsearch进行日志搜索的

添加hosts解析

vim /etc/host
  1. 192.168.30.11 cong11
  2. 192.168.30.12 cong12
  3. 192.168.30.13 cong13

修改logstash 配置文件

vim /usr/local/logstash-7.3.0/config/http_logstash.conf 
  1. input{
  2. kafka {
  3. codec => plain{charset => "UTF-8"}
  4. bootstrap_servers => "192.168.30.13:9092"
  5. client_id => "httpd_logs" #这里设置client.id和group.id是为了做标识
  6. group_id => "httpd_logs"
  7. consumer_threads => 5 #设置消费kafka数据时开启的线程数,一个partition对应一个消费者消费,设置多了不影
  8. 响,在kafka中一个进程对应一个线程
  9. auto_offset_reset => "latest" #从最新的偏移量开始消费
  10. decorate_events => true #此属性会将当前topic,offset,group,partition等信息>也带到message中
  11. topics => "nginx_logs"
  12. }
  13. }
  14. output {
  15. stdout {
  16. codec => "rubydebug"
  17. }
  18. elasticsearch {
  19. hosts => [ "192.168.30.11:9200" ]
  20. index => "nginx-logs-%{+YYYY.MM.dd}"
  21. }
  22. }

可以使用相同的group_id方式运行多个Logstash实例,以跨物理机分布负载。主题中的消息将分发到具有相同的所有Logstash实例group_id

Kafka input参数详解:

Kafka input plugin | Logstash Reference [8.2] | Elastic

重启logstash

kill 941
nohup logstash  -f /usr/local/logstash-7.3.0/config/http_logstash.conf &

查看 nohup输出文件:

[root@cong11 ~]# tail -0f nohup.out

 刷新nginx页面,产生数据 

 6.在kibana上查看数据

可以在kibana上查看我们最新收集到的nginx服务日志。到这里我们的ELK+filebeat+kafka部署完成

 

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号