赞
踩
ZooKeeper 是一个开源的分布式协调框架,它的定位是为分布式应用提供一致性服务ZooKeeper 会封装好复杂易出错的关键服务,将高效、稳定、易用的服务提供给用户使用。
ZooKeeper = 文件系统 + 监听通知机制。(重点)
Zookeeper 提供一个多层级的节点命名空间(节点称为 znode)。这些节点都可以设置关联的数据。每个znode都可以通过其路径唯一标识。
Zookeeper 为了保证高吞吐和低延迟,在内存中维护了这个树状的目录结构,这种特性使得 Zookeeper 不能用于存放大量的数据,每个节点的存放数据上限为1M。
Watcher 监听机制是 Zookeeper 中非常重要的特性,我们基于 Zookeeper上创建的节点,可以对这些节点绑定监听事件,比如可以监听节点数据变更、节点删除、子节点状态变更等事件,通过这个事件机制,可以基于 Zookeeper 实现分布式锁、集群管理等多种功能。客户端向服务端注册指定的 watcher ,当服务端符合了 watcher 的某些事件或要求则会 向客户端发送事件通知 ,客户端收到通知后找到自己定义的 Watcher 然后 执行相应的回调方法 。
ZooKeeper 的 Watcher 机制,总的来说可以分为三个过程:
客户端注册 Watcher,注册 watcher 有 3 种方式,getData、exists、getChildren。
服务器处理 Watcher 。
客户端回调 Watcher 客户端。
Watcher 特性总结:
Zookeeper事件类型:
None: 连接建立事件
NodeCreated: 节点创建
NodeDeleted: 节点删除
NodeDataChanged:节点数据变化
NodeChildrenChanged:子节点列表变化
DataWatchRemoved:节点监听被移除
ChildWatchRemoved:子节点监听被移除
Zookeeper 对节点的 watch 监听通知是永久的吗?为什么不是永久的?
不是。如果服务端变动频繁,而监听的客户端很多情况下,每次变动都要通知到所有的客户端,给网络和服务器造成很大压力。在实际应用中,很多情况下,我们的客户端不需要知道服务端的每一次变动,我只要最新的数据即可。
create [‐s] [‐e] [‐c] [‐t ttl] path [data] [acl]
-s: 顺序节点 -e: 临时节点 -c: 容器节点
-t: 可以给节点添加过期时间,默认禁用,需要通过系统参数启用
//举例
[zk: localhost:2181(CONNECTED) 10] create /data-test data1 创建一个持久化节点
Created /data-test
get [-s] [-w ] path
-s 查看节点状态
-w
[zk: localhost:2181(CONNECTED) 1] get /data-test
data1
set [-v] path [data]
-v 当前cversion版本号 乐观锁机制
[zk: localhost:2181(CONNECTED) 2] set /data-test test
[zk: localhost:2181(CONNECTED) 1] stat /data-test
cZxid = 0x8 创建znode的事务ID(Zxid的值)。
ctime = Fri Sep 23 10:23:59 UTC 2022 znode创建时间
mZxid = 0xb 最后修改znode的事务ID。
mtime = Mon Sep 26 08:56:12 UTC 2022 znode最近修改时间
pZxid = 0x8 最后添加或删除子节点的事务ID(子节点列表发生变化才会发生改变)。
cversion = 0 znode的子节点结果集版本(一个节点的子节点增加、删除都会影响这个版本)。
dataVersion = 1 znode的当前数据版本。
aclVersion = 0 表示对此znode的acl版本。
ephemeralOwner = 0x0 znode是临时znode时,表示znode所有者的 session ID。 如果
znode不是临时znode,则该字段设置为零。
dataLength = 4 znode数据字段的长度
numChildren = 0 znode的子znode的数量
ls [-R][-w] /
-R 子目录
-w 监听
[zk: localhost:2181(CONNECTED) 2] ls /
[data-test, runoob0000000000, zookeeper]
get ‐w /path // 注册监听的同时获取数据
[zk: localhost:2181(CONNECTED) 5] get -w /data-test
test
[zk: localhost:2181(CONNECTED) 6] set /data-test test2
WATCHER::
WatchedEvent state:SyncConnected type:NodeDataChanged path:/data-test
监听根目录以其子目录变化
[zk: localhost:2181(CONNECTED) 7] ls ‐R ‐w /
[data-test, runoob0000000000, zookeeper]
[zk: localhost:2181(CONNECTED) 8] delete data-test
Path must start with / character
[zk: localhost:2181(CONNECTED) 9] delete /data-test
WATCHER::
WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/
上面我们说到ZooKeeper 是一个的分布式协调服务框架,为分布式系统提供一致性服务。
什么是分布式,什么是集群,为什么需要协调各服务?
将一套系统拆分成不同子系统部署在不同服务器上(这叫分布式),大的问题拆分为多个小的问题,并分别解决,最终协同合作,分布式的主要工作是分解任务,将职能拆解。
然后部署多个相同的子系统在不同的服务器上(这叫集群), 集群主要是简单加机器解决问题,对于问题本身不做任何分解,集群主要的使用场景是为了分担请求的压力。
大白话:
分布式 :多个人在一起作不同的事 。
集群:多个人在一起作同样的事 。
集群
分布式
对于集群来说,多加几台服务器就行(当然还得解决session共享,负载均衡等问题),而对于分布式来说,你首先需要将业务进行拆分,然后再加服务器,同时还要去解决分布式带来的一系列问题。比如各个分布式组件如何协调起来,如何减少各个系统之间的耦合度,如何处理分布式事务,如何去配置整个分布式系统,如何解决各分布式子系统的数据不一致问题等等。ZooKeeper 主要就是解决这些问题的。
由上面可知,zookeeper数据的组织形式为一个类似文件系统的数据结构,而这些数据都是存储在内存中的,所以我们可以认为,Zookeeper是一个基于内存的小型数据库
数据类型:内存数据库
事务日志:每次数据写操作完成会保存到内存数据库的同时,会记录到事务日志中 ,频繁进行磁盘IO操作,事务日志的不断追加写操作会触发底层磁盘IO为文件开辟新的磁盘块,即磁盘Seek。因此,为了提升磁盘IO的效率,Zookeeper在创建事务日志文件的时候就进行文件空间的预分配- 即在创建文件的时候,就向操作系统申请一块大一点的磁盘块。
快照日志:数据快照用于记录Zookeeper服务器上某一时刻的全量数据,并将其写入到指定的磁盘文件中。可以通过配置snapCount配置每间隔事务请求个数,生成快照,数据存储在dataDir 指定的目录中。
有了事务日志,为啥还要快照数据。:快照数据主要时为了快速恢复, 事务日志文件是每次事务请求都会进行追加的操作,而快照是达到某种设定条件下的内存全量数据。所以通常快照数据是反应当时内存数据的状态。事务日志是更全面的数据,所以恢复数据的时候,可以先恢复快照数据,再通过增量恢复事务日志中的数据即可。
完整流程:
1.接收写操作,ZooKeeper集群中的每个服务器节点每次接收到写操作请求时,都会先将这次请求发送给leader。
2.协调写操作,leader将这次写操作转换为带有状态的事务,然后leader会对这次写操作广播出去以便进行协调。
3.记录数据,当协调通过(大多数节点允许这次写)后,leader通知所有的服务器节点,让它们将这次写操作应用到内存数据库中,并将其记录到事务日志中
4.记录快照数据,当事务日志记录的次数达到一定数量后(默认10W次),将内存数据库序列化一次,持久化保存到磁盘上,序列化后的文件为快照文件
5.基于事务日志和快照,就可以让任意节点恢复到任意时间点(只要没有清理事务日志和快照)
Session 可以看作是 ZooKeeper 服务器与客户端的之间的一个 TCP 长连接,客户端与服务端之间的任何交互操作都和Session 息息相关,其中包含zookeeper的临时节点的生命周期、客户端请求执行以及Watcher通知机制等。
session会话状态有:
作用:
简介了介绍zookeeper数据模型,监听机制,持久化,指令以及一些特性。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。