当前位置:   article > 正文

Zookeeper集群 + Kafka集群

Zookeeper集群 + Kafka集群

Zookeeper 概述

Zookeeper 定义
ZooKeeper是一个开源的分布式协调服务,用于构建可靠的分布式系统。它通过提供高度可靠的数据存储和同步机制,来协调不同节点之间的通信和协作。


Zookeeper 工作机制
Zookeeper从设计模式角度来理解:是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。也就是说 Zookeeper = 文件系统 + 通知机制。


Zookeeper 特点
(1)Zookeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。
(2)Zookeeper集群中只要有半数以上节点存活,Zookeeper集群就能正常服务。所以Zookeeper适合安装奇数台服务器。
(3)全局数据一致:每个Server保存一份相同的数据副本,Client无论连接到哪个Server,数据都是一致的。
(4)更新请求顺序执行,来自同一个Client的更新请求按其发送顺序依次执行,即先进先出。
(5)数据更新原子性,一次数据更新要么成功,要么失败。
(6)实时性,在一定时间范围内,Client能读到最新数据。


Zookeeper 数据结构
ZooKeeper数据模型的结构与Linux文件系统很类似,整体上可以看作是一棵树,每个节点称做一个ZNode。每一个ZNode默认能够存储1MB的数据,每个ZNode都可以通过其路径唯一标识。

部署zookeeper集群

  1. //准备 3 台服务器做 Zookeeper 集群
  2. 192.168.80.10
  3. 192.168.80.11
  4. 192.168.80.12

 安装jdk

  1. //安装 JDK
  2. yum install -y java-1.8.0-openjdk java-1.8.0-openjdk-devel
  3. java -version

安装 Zookeeper

  1. cd /opt
  2. tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz
  3. mv apache-zookeeper-3.5.7-bin /usr/local/zookeeper-3.5.7

修改配置文件

  1. cd /usr/local/zookeeper-3.5.7/conf/
  2. cp zoo_sample.cfg zoo.cfg
  3. vim zoo.cfg
  4. tickTime=2000 #通信心跳时间,Zookeeper服务器与客户端心跳时间,单位毫秒
  5. initLimit=10 #Leader和Follower初始连接时能容忍的最多心跳数(tickTime的数量),这里表示为10*2s
  6. syncLimit=5 #Leader和Follower之间同步通信的超时时间,这里表示如果超过5*2s,Leader认为Follwer死掉,并从服务器列表中删除Follwer
  7. dataDir=/usr/local/zookeeper-3.5.7/data ●修改,指定保存Zookeeper中的数据的目录,目录需要单独创建
  8. dataLogDir=/usr/local/zookeeper-3.5.7/logs ●添加,指定存放日志的目录,目录需要单独创建
  9. clientPort=2181 #客户端连接端口
  10. #添加集群信息
  11. server.1=192.168.73.30:3188:3288
  12. server.2=192.168.73.40:3188:3288
  13. server.3=192.168.73.140:3188:3288

启动zookeeper

  1. 三台服务器同样操作 按照 30 40 140 的启动顺序开始启动
  2. cd /usr/local/zookeeper/bin
  3. ./zkServer.sh start
  4. netstat -lntp | grep 2181

查看各服务器zookeeper状态

./zkServer.sh status

安装部署kafka集群

  1. cd /opt/
  2. tar zxvf kafka_2.13-2.8.2.tgz
  3. mv kafka_2.13-2.8.2 /usr/local/kafka

修改配置文件

  1. 192.168.73.30
  2. cd /usr/local/kafka/config/
  3. cp server.properties{,.bak}
  4. vim server.properties
  5. broker.id=021行,broker的全局唯一编号,每个broker不能重复,因此要在其他机器上配置 broker.id=1、broker.id=2
  6. listeners=PLAINTEXT://192.168.9.210:909231行,指定监听的IP和端口,如果修改每个broker的IP需区分开来,也可保持默认配置不用修改
  7. num.network.threads=3 #42行,broker 处理网络请求的线程数量,一般情况下不需要去修改
  8. num.io.threads=8 #45行,用来处理磁盘IO的线程数量,数值应该大于硬盘数
  9. socket.send.buffer.bytes=102400 #48行,发送套接字的缓冲区大小
  10. socket.receive.buffer.bytes=102400 #51行,接收套接字的缓冲区大小
  11. socket.request.max.bytes=104857600 #54行,请求套接字的缓冲区大小
  12. log.dirs=/usr/local/kafka/logs #60行,kafka运行日志存放的路径,也是数据存放的路径
  13. num.partitions=1 #65行,topic在当前broker上的默认分区个数,会被topic创建时的指定参数覆盖
  14. num.recovery.threads.per.data.dir=1 #69行,用来恢复和清理data下数据的线程数量
  15. log.retention.hours=168 #103行,segment文件(数据文件)保留的最长时间,单位为小时,默认为7天,超时将被删除
  16. log.segment.bytes=1073741824 #110行,一个segment文件最大的大小,默认为 1G,超出将新建一个新的segment文件
  17. zookeeper.connect=192.168.9.210:2181,192.168.9.120:2181,192.168.9.140:2181123行,配置连接Zookeeper集群地址
  18. #复制配置到其他两个服务器
  19. cd /usr/local
  20. scp -r kafka/ 192.168.73.40:/usr/local/
  21. scp -r kafka/ 192.168.73.140:/usr/local/

修改环境变量

  1. 所有服务器操作
  2. vim /etc/profile
  3. export KAFKA_HOME=/usr/local/kafka
  4. export PATH=$PATH:$KAFKA_HOME/bin
  5. suorce /etc/profile

启动kafka

  1. cd /usr/local/kafka/bin/
  2. ./kafka-server-start.sh -daemon /usr/local/kafka/config/server.properties
  3. netstat -lntp | grep 9092

 Kafka 命令行操作

  1. kafka/bin/kafka-topics.sh --zookeeper IP1:2181,IP2:2181,IP3:2181 --create --topic 主题名 --partitions 分区数 --replication-factor 副本数 #创建topic
  2. kafka/bin/kafka-topics.sh --zookeeper IP1:2181,IP2:2181,IP3:2181 --list #查看topic列表
  3. kafka/bin/kafka-topics.sh --zookeeper IP1:2181,IP2:2181,IP3:2181 --discribe --topic 主题名 #查看topic详细信息
  4. kafka/bin/kafka-topics.sh --zookeeper IP1:2181,IP2:2181,IP3:2181 --delete --topic 主题名 #删除topic
  5. kafka/bin/kafka-topics.sh --zookeeper IP1:2181,IP2:2181,IP3:2181 --alter --topic 主题名 --partitions 分区数 #修改topic的分区数(只能增不能减)
  6. kafka/bin/kafka-console-producer.sh --broker-list IP1:9092,IP2:9092,IP3:9092 --topic 主题名 #向topic推送数据
  7. kafka/bin/kafka-console-consumer.sh --bootstrap-server IP1:9092,IP2:9092,IP3:9092 --topic 主题名 [--from-beginning] #从topic拉取数据

搭建ELK+Filebead+zookeeper+kafka

主机名ip服务
es01

192.168.73.80

es  kibana
es02192.168.73.100es

es03

192.168.73.110es 
nginx01192.168.73.120ngixn logstash
192.168.73.130ngixn filebeat
192.168.73.140zookeeper  kafka
192.168.73.30zookeeper  kafaka
192.168.73.40zookeeper  kafka

1.部署 Filebeat 

  1. cd /usr/local/filebeat
  2. vim filebeat.yml
  3. 注释162164行内容
  4. 163行起添加
  5. output.kafka:
  6. enabled: true
  7. hosts: ["192.168.73.30:9092","192.168.73.40","192.168.73.140"] #指定 Kafka 集群配置
  8. topic: "nginx" #指定 Kafka 的 topic

浏览器访问filebeat,生成新日志数据

http://192.168.73.130/test.html、http://192.168.73.130/test1.html、http://192.168.73.130/

  1. 启动 filebeat
  2. ./filebeat -e -c filebeat.yml

2.Logstash配置

  1. cd /etc/logstash/conf.d/
  2. vim kafka.conf
  3. input {
  4. kafka {
  5. bootstrap_server => "192.168.73.30:9092,192.168.73.40:9092,192.168.73.140:9092"
  6. topics => "nginx"
  7. type => "nginx_kafka"
  8. auto_offset_reset => "latest"
  9. }
  10. }
  11. #filter {}
  12. output {
  13. elasticsearch {
  14. hosts => ["192.168.73.80:9200", "192.168.73.100:9200", "192.168.73.110:9200"]
  15. index => "nginx_kafka-%{+yyyy.MM.dd}"
  16. }
  17. }
  18. logstash -t -f kafka.conf
  19. logstash -f kafka.conf

3.浏览器kibana访问验证

 

本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号