赞
踩
对集群健康状况、使用主题、消费组资源的巡检,发现达到阈值则发送告警信息给管理员或者资源申请者。监控是告警的基础,告警的巡检基于前面两篇文章中监控采集到的数据。
告警的重要性不必过多地赘述,RocketMQ 集群往往承载着公司核心业务流转。如果集群不可用往往影响是全公司的业务,事故责任是公司最高级别的。
本文从告警项的设计、告警流程、告警实战给出指导建议,在实践中以此为思路扩展完善,实现自己公司的定制化告警。
下图分别从主题、消费组、集群维度罗列了比较重要的告警项以及触发条件包括哪些方面。
发送速度:当发送速度满足触发条件设定的阈值时发送告警信息。
例如:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。