当前位置:   article > 正文

分布式事务:CAP定理和BASE理论_对于分布式事务的cap定理中和base

对于分布式事务的cap定理中和base

分布式事务:CAP定理和BASE理论

1) CAP定理

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OFXXjmAA-1616402877207)(assets/9-20.jpg)]

CAP定理是在 1998年加州大学的计算机科学家 Eric Brewer (埃里克.布鲁尔)提出,分布式系统有三个指标

  • Consistency 一致性
  • Availability 可用性
  • Partition tolerance 分区容错(容错性)

它们的第一个字母分别是 C、A、P。Eric Brewer 说,这三个指标不可能同时做到。这个结论就叫做 CAP 定理。

一般要求P必须要成立,A和C只能顾及一个,也就是说,我们只能满足AP或者CP。

分区容错 Partition tolerance

大多数分布式系统都分布在多个子网络。每个子网络就叫做一个区(partition)。分区容错的意思是,区间通信可能失败。比如,一台服务器放在中国,另一台服务器放在美国,这就是两个区,它们之间可能无法通信。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dSYgCYi7-1616402877208)(assets/9-21.png)]

上图中,G1 和 G2 是两台跨区的服务器。G1 向 G2 发送一条消息,G2 可能无法收到。系统设计的时候,必须考虑到这种情况。

一般来说,分区容错无法避免,因此可以认为 CAP 的 P 总是成立。CAP 定理告诉我们,剩下的 C 和 A 无法同时做到。

可用性 Availability

Availability 中文叫做"可用性",意思是只要收到用户的请求,服务器就必须给出回应。

用户可以选择向 G1 或 G2 发起读操作。不管是哪台服务器,只要收到请求,就必须告诉用户,到底是 v0 还是 v1,否则就不满足可用性。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JCogHByQ-1616402877209)(assets/9-22.png)]

一致性 Consistency

Consistency 中文叫做"一致性"。意思是,写操作之后的读操作,必须返回该值。

举例来说,某条记录是 v0,用户向 G1 发起一个写操作,将其改为 v1。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-60jsaJOK-1616402877210)(assets/9-23.png)]

问题是,用户有可能向 G2 发起读操作,由于 G2 的值没有发生变化,因此返回的是 v0。G1 和 G2 读操作的结果不一致,这就不满足一致性了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zxEpqTH0-1616402877211)(assets/9-24.png)]

为了让 G2 也能变为 v1,就要在 G1 写操作的时候,让 G1 向 G2 发送一条消息,要求 G2 也改成 v1。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Mkf7UA1f-1616402877212)(assets/9-25.png)]

一致性和可用性的矛盾

一致性和可用性,为什么不可能同时成立?答案很简单,因为可能通信失败(即出现分区容错)。

如果保证 G2 的一致性,那么 G1 必须在写操作时,锁定 G2 的读操作和写操作。只有数据同步后,才能重新开放读写。锁定期间,G2 不能读写,没有可用性。

如果保证 G2 的可用性,那么势必不能锁定 G2,所以一致性不成立。

综上所述,G2 无法同时做到一致性和可用性。系统设计时只能选择一个目标。如果追求一致性,那么无法保证所有节点的可用性;如果追求所有节点的可用性,那就没法做到一致性。

小总结:

1)以数据为例:
在这里插入图片描述

C:一致性。一个服务器的数据更新,等到所有服务器数据同步完毕,才可以访问。
A:可用性。用户随时随地可以访问服务器,而且立即返回数据!
P:容错性。区间通行可能失败

2)以框架为例:
zookeeper遵循的是CP原则
dubbo在网络通信的过程中通过心跳机制确保各个服务节点的通信是否成功,倘若没有收到心跳回复,则使整个注册服务瘫痪,直到心跳回复为止。这样就体现了分布式事务的一致性,zookeeper稳定性确保用户请求收到的数据都是最新的。

Eureka遵循的是AP原则
失效剔除
在网络区间通信过程中出现问题时,或当服务由于内存溢出等原因变得不可用,亦或是正常关闭服务,此时服务注册中心并未
收到“服务下线”的请求。服务注册中心在启动时会创建一个定时任务,每隔一段时间(默认为60秒)将当前服务列表中超时(默认为90秒)没有续约的服务剔除,这个操作被称为失效剔除。
容错处理
在生产环境下,因为网络延迟等原因,EurekaServer未收到的心跳续约数量非常多,超标了,但是此时就把服务剔除列表并不妥当,因为服务可能没有宕机。因此会开启自我保护机制,EurekaServer在这段时间内不会剔除任何服务实例(否则服务其实是好的,岂不是误杀了),直到网络恢复正常。生产环境下这很有效,保证了大多数服务依然可用,不过也有可能获取到失败的服务实例,因此服务调用者必须做好容错处理。

Eureka可以很好得应因网络故障导致部分节点失去联系得情况,而不会像zookeeper那样使整个注册服务瘫痪,体现了分布式事务的可用性。

2)BASE理论

BASE:全称:Basically Available(基本可用),Soft state(软状态),和 Eventually consistent(最终一致性)三个短语的缩写,来自 ebay 的架构师提出。BASE 理论是对 CAP 中一致性和可用性权衡的结果,其来源于对大型互联网分布式实践的总结,是基于 CAP 定理逐步演化而来的。其核心思想是:

既是无法做到强一致性(Strong consistency),但每个应用都可以根据自身的业务特点,采用适当的方式来使系统达到最终一致性(Eventual consistency)。

Basically Available(基本可用)

什么是基本可用呢?假设系统,出现了不可预知的故障,但还是能用,相比较正常的系统而言:

  1. 响应时间上的损失:正常情况下的搜索引擎 0.5 秒即返回给用户结果,而基本可用的搜索引擎可以在 1 秒作用返回结果。
  2. 功能上的损失:在一个电商网站上,正常情况下,用户可以顺利完成每一笔订单,但是到了大促期间,为了保护购物系统的稳定性,部分消费者可能会被引导到一个降级页面。
Soft state(软状态)

什么是软状态呢?相对于原子性而言,要求多个节点的数据副本都是一致的,这是一种 “硬状态”。

软状态指的是:允许系统中的数据存在中间状态,并认为该状态不影响系统的整体可用性,即允许系统在多个不同节点的数据副本存在数据延时。

Eventually consistent(最终一致性)

系统能够保证在没有其他新的更新操作的情况下,数据最终一定能够达到一致的状态,因此所有客户端对系统的数据访问最终都能够获取到最新的值。

Memorial Day is 538 days
I miss you
xiaokeai

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/75224
推荐阅读
  

闽ICP备14008679号