当前位置:   article > 正文

9、Kafka flush刷盘机制

kafka flush

熟悉Linux操作系统原理的都知道,当我们把数据写入到文件系统之后,数据其实在操 作系统的page cache里面,并没有刷到磁盘上去。如果此时操作系统挂了,其实数据就 丢了。

一方面,应用程序可以调用fsync这个系统调用来强制刷盘;
另一方面,操作系统有后 台线程,定期刷盘。

如果应用程序每写入1次数据,都调用一次fsync,那性能损耗就很大,所以一般都会 在性能和可靠性之间进行权衡。因为对应一个应用来说,虽然应用挂了,只要操作系统 不挂,数据就不会丢。

另外, kafka是多副本的,当你配置了同步复制之后。多个副本的数据都在page cache里 面,出现多个副本同时挂掉的概率比1个副本挂掉,概率就小很多了。

对于kafka来说,也提供了相关的配置参数,来让你在性能与可靠性之间权衡:
kafka broker端配置

log.flush.interval.messages		在将消息刷新到磁盘之前,在日志分区上累积的消息数量
log.flush.interval.ms			在刷新到磁盘之前,任何topic中的消息保留在内存中的最长时						间(以毫秒为单位)。如果未设置,则使用										log.flush.scheduler.interval.ms中的值
log.flush.scheduler.interval.ms	日志刷新器检查是否需要将所有日志刷新到磁盘的频								率
  • 1
  • 2
  • 3
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/215496
推荐阅读
相关标签
  

闽ICP备14008679号