赞
踩
1.n9e支持多个采集插件。所以内置的仪表盘也支持多个
#我采用的是官方推荐的categraf采集器
1.设定磁盘利用率大于多少就报警
--disk_used_percent{ident=~'dps.*',path='/'} >= 90
ident=~'dps.*':正则匹配。抓取客户端主机名为dps开头的节点进行判断
path='/':判断根路径的使用率
1.需要先设定可以接收告警的用户
#夜莺接收webhok调用机器人的地址,绑定到用户上可以直接转发.
2.设定组并分配接收告警的用户
#接下来就可以进行调用了
3.给自己的test组创建告警规则
#触发的值有没有对应的机器。可以去Prometheus上看一下。监听9090端口
4.可以看活跃告警是否触发了告警
5.查看是否调用成功发送报警到飞书群
#可以看到顺利发送通知。如果勾选了恢复通知.恢复了会发生recover信息
1.n9e支持快捷试图
#可以通过快捷试图去查看一些可配置的监控项或者指标
#可以通过categraf的配置conf开启有查看的模块
!!!!!!!必须安装ibex模块噢!!!!
1.刚才发送了磁盘利用率的报警。
#n9e支持通过bash脚本进行自动修复
2.要在不同的业务组内创建。不同的业务组对应不同的机器。
#机器可以通过主机名进行分组。categraf中的hostname配置。
#不同的业务组调用自己组内的自愈脚本
3.配置监控项。
#报警后调用脚本
4.查看脚本执行的结果
#可以通过执行历史查看输出
#点击stdout查看命令的输出信息!
5.假设执行的是自愈脚本后
#恢复后也会发送通知!!!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。