运维做开发

这个屌丝很懒，什么也没留下！

热门标签

kafka的基本使用_卡夫卡使用

作者：运维做开发 | 2024-06-28 18:23:48

踩

卡夫卡使用

一，消息中间件的设计

1，基本需求

最基本的是要能支持消息的发送和接收，需要涉及到网络通信就一定会涉及到NIO

消息中心的消息存储（持久化/非持久化）

消息的序列化和反序列化

是否跨语言

消息的确认机制，如何避免消息重发

2，高级功能

消息的有序性

是否支持事务消息

消息收发的性能，对高并发大数据量的支持

是否支持集群

消息的可靠性存储

是否支持多协议

二，Kafka的介绍

1，什么是卡夫卡

Kafka是一款分布式消息发布和订阅系统，它的特点是高性能、高吞吐量。

2，卡夫卡的应用场景

由于kafka具有更好的吞吐量、内置分区、冗余及容错性的优点(kafka每秒可以处理几十万消息)，让kafka成为了一个很好的大规模消息处理应用的解决方案。所以在企业级应用长，主要会应用于如下几个方面

行为跟踪：kafka可以用于跟踪用户浏览页面、搜索及其他行为。通过发布-订阅模式实时记录到对应的topic中，通过后端大数据平台接入处理分析，并做更进一步的实时处理和监控

日志收集：日志收集方面，有很多比较优秀的产品，比如Apache Flume，很多公司使用kafka代理日志聚合。日志聚合表示从服务器上收集日志文件，然后放到一个集中的平台（文件服务器）进行处理。在实际应用开发中，我们应用程序的log都会输出到本地的磁盘上，排查问题的话通过linux命令来搞定，如果应用程序组成了负载均衡集群，并且集群的机器有几十台以上，那么想通过日志快速定位到问题，就是很麻烦的事情了。所以一般都会做一个日志统一收集平台管理log日志用来快速查询重要应用的问题。所以很多公司的套路都是把应用日志集中到kafka上，然后分别导入到es和hdfs上，用来做实时检索分析和离线统计数据备份等。而另一方面，kafka本身又提供了很好的api来集成日志并且做日志收集。

三，kafka本身的架构

架构介绍

一个典型的kafka集群包含若干Producer（可以是应用节点产生的消息，也可以是通过Flume收集日志产生的事件），若干个Broker（kafka支持水平扩展）、若干个Consumer Group，以及一个zookeeper集群。kafka通过zookeeper管理集群配置及服务协同。Producer使用push模式将消息发布到broker，consumer通过监听使用pull模式从broker订阅并消费消息。

多个broker协同工作，producer和consumer部署在各个业务逻辑中。三者通过zookeeper管理协调请求和转发。这样就组成了一个高性能的分布式消息发布和订阅系统。

有一个细节是和其他mq中间件不同的点，producer 发送消息到broker的过程是push，而consumer从broker消费消息的过程是pull，主动去拉数据。而不是broker把数据主动发送给consumer

在这里插入图片描述

名词解释

1）Broker

Kafka集群包含一个或多个服务器，这种服务器被称为broker。broker端不维护数据的消费状态，提升了性能。直接使用磁盘进行存储，线性读写，速度快：避免了数据在JVM内存和系统内存之间的复制，减少耗性能的创建对象和垃圾回收。

2）Producer

负责发布消息到Kafka broker

3）Consumer

消息消费者，向Kafka broker读取消息的客户端，consumer从broker拉取(pull)数据并进行处理。

4）Topic

每条发布到Kafka集群的消息都有一个类别，这个类别被称为Topic。（物理上不同Topic的消息分开存储，逻辑上一个Topic的消息虽然保存于一个或多个broker上但用户只需指定消息的Topic即可生产或消费数据而不必关心数据存于何处）

5）Partition

Parition是物理上的概念，每个Topic包含一个或多个Partition.

6）Consumer Group

每个Consumer属于一个特定的Consumer Group（可为每个Consumer指定group name，若不指定group name则属于默认的group）

7）Topic & Partition

Topic在逻辑上可以被认为是一个queue，每条消费都必须指定它的Topic，可以简单理解为必须指明把这条消息放进哪个queue里。为了使得Kafka的吞吐率可以线性提高，物理上把Topic分成一个或多个Partition，每个Partition在物理上对应一个文件夹，该文件夹下存储这个Partition的所有消息和索引文件。若创建topic1和topic2两个topic，且分别有13个和19个分区，则整个集群上会相应会生成共32个文件夹（本文所用集群共8个节点，此处topic1和topic2 replication-factor均为1）。

四，kafka的安装部署

1，下载kafka

https://archive.apache.org/dist/kafka/2.0.0/kafka_2.11-2.0.0.tgz

2，安装过程

tar -zxvf kafka_2.11-2.0.0.tgz 解压

3，配置zookeeper

因为kafka依赖于zookeeper来做master选举以及其他数据的维护，所以需要先启动zookeeper节点

kafka内置了zookeeper的服务，所以在bin目录下提供了这些脚本

zookeeper-server-start.sh
zookeeper-server-stop.sh
1
2

在config目录下，存在一些配置文件

zookeeper.properties
server.properties
1
2

所以我们可以通过下面的脚本来启动zk服务，当然，也可以自己搭建zk的集群来实现

sh zookeeper-server-start.sh -daemon ../config/zookeeper.properties
1

4，启动和停止kafka

修改server.properties, 增加zookeeper的配置

zookeeper.connect=localhost:2181
1

启动kafka

sh kafka-server-start.sh -daemon ../config/server.properties
1

停止kafka

sh kafka-server-stop.sh -daemon config/server.properties
1

五，kafka的基本操作

创建topic

sh kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
1

Replication-factor 表示该topic需要在不同的broker中保存几份，这里设置成1，表示在两个broker中保存两份

Partitions 分区数

查看topic

sh kafka-topics.sh --list --zookeeper localhost:2181
1

查看topic属性

sh kafka-topics.sh --describe --zookeeper localhost:2181 --topic first_topic
1

消费消息

sh kafka-console-consumer.sh --bootstrap-server 192.168.13.106:9092 --topic test --from-beginning
1

发送消息

sh kafka-console-producer.sh --broker-list 192.168.244.128:9092 --topic first_topic
1

六，集群环境安装

1，环境准备

准备三台虚拟机

分别把kafka的安装包部署在三台机器上

2，修改配置

以下配置修改均为server.properties

分别修改三台机器的server.properties配置，同一个集群中的每个机器的id必须唯一

broker.id=0
broker.id=1
broker.id=2
1
2
3

修改zookeeper的连接配置

zookeeper.connect=192.168.13.106:2181
1

修改listeners配置

如果配置了listeners，那么消息生产者和消费者会使用listeners的配置来进行消息的收发，否则，会使用localhost

PLAINTEXT表示协议，默认是明文，可以选择其他加密协议

listeners=PLAINTEXT://192.168.13.102:9092
1

分别启动三台服务器

sh kafka-server-start.sh -daemon ../config/server.properties
1

用listeners的配置来进行消息的收发，否则，会使用localhost

PLAINTEXT表示协议，默认是明文，可以选择其他加密协议

listeners=PLAINTEXT://192.168.13.102:9092
1

分别启动三台服务器

sh kafka-server-start.sh -daemon ../config/server.properties
1

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/运维做开发/article/detail/766904