当前位置:   article > 正文

《亿级流量系统架构设计与实战》第二章 通用的高并发架构设计

《亿级流量系统架构设计与实战》第二章 通用的高并发架构设计

内容总结自《亿级流量系统架构设计与实战》

一、高并发系统概述

高并发系统的三大必要条件:

  1. 高性能(PCT99):响应时间PCTn统计方式,表示请求响应时间按从小到大排序后,第n分位的响应时间。即如果100个请求,从小打大排序后,第99分位的响应时间是100ms,则PCT99=100ms。从经验数据来看,平均响应时间200ms,且PCT99=1s的高并发系统基本能够保证高性能的要求;如果请求的响应时间在200ms以内,用户不会感受到延迟;如果请求响应的时间超过1s,用户会明显感受到延迟
  2. 高可用性(服务几个9):一般用N个9来描述系统的可用性如何,高可用系统至少保证3个9或4个9的可用性,实际的系统指标监控中,很多公司会取3个9和4个9的中位数99.95%作为系统可用性监控的阈值
  3. 可扩展性(服务扩容收益):面对突发的流量,来不及对系统做改造,更快捷有效的做法是增加系统集群中的节点来水平扩展系统的服务能力。可扩展性 = 吞吐量提升比例/集群节点增加比例。最理想情况是,集群节点增加几倍,系统吞吐量就能增加几倍,一般来说70%-80%的比例基本能够满足扩展性要求


二、高并发读场景(CQRS模式)

基本的高并发读场景的解决方案,本质都是读/写分离,这也是微服务架构中经常被提及的CQRS模式。将数据读取操作与更新操作分离的模式。Q为query,C为command,指会引起数据变化(增、删、该)的操作的总称
在这里插入图片描述


特点:

  1. 写数据存储要选用写性能高的存储系统,而读数据存储要选用读性能高的存储系统,所以两者往往有不同的存储模型和存储选型。数据库读/写分离只是一个最简单的特例
  2. 读数据有延迟。写数据存储中数据实时变化,而读数据存储中获取到的最新数据,依赖数据传输通道的传输延迟。无论是消息队列还是定时任务都会到来一定的数据延迟,因此写数据存储和读数据存储仅保证数据的最终一致性

1、数据库读/写分离

路由方式

  1. 基于数据库Proxy代理的方式,如MySQL-Proxy和MyCat
  2. 基于应用内嵌的方式,如gorm,sharding-jdbc

主从延迟与解决方案

  1. 同步数据复制:影响数据库吞吐量,低并发请求业务场景中使用
  2. 强制读主节点:针对主从延迟容忍度低的场景,强制将读请求路由到数据库主节点
  3. 会话分离:某会话在数据库执行了写操作,那么在接下来极短的一段时间内,此会话的读请求暂时会被强制路由到数据库Master,保证每个用户的写操作立即对自己可见

2、多级缓存

添加数据缓存,提高数据查询性能,注意数据淘汰策略,以及数据一致性问题

  1. 添加分布式缓存
  2. 添加单机内存缓存

3、搜索引擎

选定读数据存储和写数据存储后,通过消息中间件为两者建立数据关联。创建一个消费者服务并使消息中间件监听数据库的binlog数据变更日志,当数据有变更时,将最新的数据同步更新到搜索引擎中

4、数据宽表

遇到需要多张表join查询时,提前将多张表关联的数据进行聚合计算,把聚合结果单独存储到一个包含全部关联字段的宽表中,查询时直接读取宽表中的聚合结果,而不用执行join语句



二、高并发写场景

1、分库

用户请求并发大,海量用户访问数据库,很快会达到数据库处理能力的上限,无论是数据库的最大请求连接数、CPU资源、内存资源还是网络带宽均有可能成为性能瓶颈。为解决数据库性能问题,一般会进行分库。

拆分策略:

  1. 垂直分库:按照业务归属将单个数据库中的数据表进行分类,与不同业务相关的数据表被拆分到不同的数据库中,其核心是“专库专用”
  2. 水平分库:将同一个数据库中的数据按照某种规则拆分到多个数据库中,这些数据库可以被部署在不同的服务器上。并且每个数据库拥有哪些表,以及每个表的结构都与拆分前的数据库完全一致

2、分表

当业务发展到一定阶段,数据表存储了千万行甚至上亿行数据,查询性能急剧下降。此外,在涉及数据表结构修复的场景下,DDL语句执行完成消耗的时间令人难以接受。为解决但表的读/写效率问题,一般会进行分表操作。

拆分策略:

  1. 垂直分表:将数据表按照字段(字段访问频率、字段容量大小)分为多个表,每个表存储器中一部分字段;
  2. 水平分表:在同一个数据表中的数据按照某种规则(业务id取hash、数据时间范围、一致性hash环分区)拆分到多个表中,每个表的结果都与拆分前的表完全一致

一致性hash环特点:当增加或移除数据分区是,只有被操作的节点的逆时针相邻的数据需要重新分区。由于一致性哈希分区法并不指定每个数据分区的哈希值范围,所以数据分区在哈希环上分布越均匀,各个数据分区的数据量就越均衡。避免出现“数据倾斜”(存的不均匀)和“热点数据”(读的不均匀)


3、数据分片

类比数据库分库分表外,还有其他数据分片形式

  1. Kafka的多Partition:一个Topic的Partition数据越多,越能增加这个Topic的消息写入吞吐量
  2. 秒杀系统分布式锁、ConcurrentHashMap:将目标对象进行分区分段,即而达成并发量提升

4、异步写

将“用户发起写请求并同步等待结果返回”转变为“用户提交写请求后,异步查询结果”两阶段:

  1. 将用户的写请求先以适当的方式快速暂存到一个数据池中,然后立刻响应用户,告知提交成功,以便缩短写请求的响应时间
  2. 真正的写操作由后台任务不断地从数据池中读取请求并真正执行
  3. 写操作结果依靠用户主动查询,有的业务场景为了提高实时性,也会在写操作执行完成之后主要将结果通知给用户

5、写聚合

将若干个写请求,聚合为一个写请求,减少写请求量。如Kafka的Producer批量生产、AliSQL热点数据优化

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/人工智能uu/article/detail/932562
推荐阅读
相关标签
  

闽ICP备14008679号