赞
踩
今天下午16点多时,我正想着晚上去哪里转转呢,某重要客户的数据库出问题了,节点一集群实例正常,节点二集群正常,但启动实例特别的慢。而且故障时好时坏,我赶紧要来环境一起查看,同事说两个节点心跳延迟很大。
首先关闭db1的实例,db2上实例启动很快,再启动db1上实例时间较长但可以启动。都启动正常后,业务可连接数据库但时好时坏,因下班时间点了,使用人很少,客户已准备安排人去现场让2个主机心跳网卡直连,不经过网络交换机了
我开始查看/var/log/messages,直接查找心跳网卡eth0信息,看到了NetworkManager立刻明白过来了,立刻和客户商量不要动物理设备了,申请停机时间两个节点轮流操作解决
# systemctl enable network.service;systemctl start network.service
# systemctl disable NetworkManager;systemctl stop NetworkManager
# echo 'NM_CONTROLLED=no' >> /etc/sysconfig/network-scripts/ifcfg-eth0
# systemctl restart network.service
让eth0网卡不受NetworkManager控制后,手动启动集群和实例都很快,两个主机都操作后,所有的都恢复正常了。
说明一点:NetworkManager不仅仅影响网络,对multipath也有影响的,rac环境强烈建议关闭NetworkManager
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。