当前位置:   article > 正文

db故障:mysql无法连接的排错指南_dboperator mysql 连接不上

dboperator mysql 连接不上

基本上平均几天下来都会处理一个mysql无法连接的case,现总结如下,能解决99%以上的mysql无法连接问题

1  先弄清楚mysql.user表的host和user列的含义,host列表示ip地址或者hostname,它和user列组成联合主键,host列的约束关系:比如172.%即代表只能172开头的网段才能登     陆该db;%表示任何网段都能登陆;同一user下如果既有172.%和%的host,那就取并集,即任何网段都能登陆,不过这个时候如果是本地登陆,假如有localhost和%,他会去优先使用localhost对应的user的密码。

2  密码错误,一般报1045错误

一般是以下误操作

2.0  首先明确一点,grant方式新建用户后其实不用flush privileges,这个操作自带flush功能,不过只针对这个当前创建的账户有效;而正常的flush privileges命令对所有user表生效,不过只对后续的连接有效,对本次连接无效

2.1  可能是update user表的方式修改了密码以后,忘记flush privileges,这时并没有生效,断开重连后沿用的还是旧密码

2.2 可能是update user表的方式修改了密码以后,忘记flush privileges,这时并没有生效,db重启以后必须用新密码才能登陆

2.3 就是简单的修改了密码,忘记了新密码,一般可以用skip-grant-tables的方式免密码登陆,修改回来,这个方法比较简单,但是需要重启db;

在云服务器中,一般都会保存一个管理账户密码,总是被客户随意修改导致备份,监控等失败,可以通过以下方法在线修改回来,无须重启db

 

2.3.1 copy 用户库的user表相关的文件到自己测试库

2.3.2 在测试库更改用户密码或添加用户

2.3.3 把user表相关的文件copy到用户库

2.3.4 kill -SIGHUP 用户的mysqld进程

 

 

 

是否设置了禁用dns解析,即设置了skip_name_resolve却还是用主机名称连接

是否设置了绑定ip访问,即设置了bind-address却还是用其他ip连接

5 确认是否是网络问题,一般直接ping ip的方式确定,这时先解决网络问题

6 确认是否能够telnet通对应ip的端口,如果不通的话,一般是以下原因

6.1   检查磁盘空间是否已经满了,即磁盘不足,这时应该无法telnet

6.2  检查mysqld进程是否存活,是否正好处于关闭中或者启动中,看错误日志即可,这时无法telnet

6.3  检查防火墙,是否开通了对应的db port

6.4  mysqld oom内存不足重启,这时会有短暂的时间连接不上,通过查看mysqld进程的启动时间或系统日志搜索oom关键字 /var/log/message

7 确认是否连接数打满了,一般报too many connections

8 确认是否是本地端口耗尽,这时一般报错 ERROR 2003 (HY000): Can't connect to MySQL server on '192.168.0.10' (99),注意最后括号的数字是99,解决方法一般是增加 local_port的范围 , /proc/sys/net/ipv4/ip_local_port_range 这里的值,两者相减 就是目前的范围 

9 还有一种情况,比如敲的登陆命令为mysql -uxx -pxx -hxxx database1,这时相当于连接到mysql后还有一个use  database1的操作,如果卡住了一般就是卡在那不动,也不提示错误,这时需要注释掉database1登录进去查看是哪个线程卡住了它,或者本身这个db下表太多,本来就慢

10  报错ERROR 1135 (HY000): Can't create a new thread (errno 11); if you are not out of available memory, you can consult the manual for a possible OS-dependent bug,这个一般是操作系统级别的错误,表现为物理机登陆不上,估计需要重启物理机才能解决了

11 还碰到一种情况,mysql -u -p -h后一直卡着,登陆物理机后发现ps -ef|grep mysql一直卡着。最后分析的原因是我们采用cgroup技术,内存不足造成oom,但是oom却没有正常完成,可能是croup已经用到极限,无法调用oom kill,后来临时调大cgroup的内存限制后就oom动作就完成了。

 

12 mysql -S -u -p以socket方式无法登陆,提示密码错误的话,可能是你的user表存在localhost账户,这时mysql会优先选择localhost对应的密码,所以建议清楚user表里不用的信息,保证user表的每个账户是实际有意义的,有需求的

13 又碰到一种情况,ping  telnet都ok,但就是连不上,仔细查看了下mysql客户端的配置my.cnf,原来在client那里做了设置,默认client的端口是3308,而登陆的时候没有填,显示加上-P 3306就行了.......

14 登录卡住,kill -9杀不死进程,这一般是linux其他组件引发的问题,比如碰到过cpu调度bug,跳过调整cpu的限制解决

15 登陆卡住,有可能是mysql本身的bug,比如general_log表在宕机后损坏,新连接无法建立,或者是内部的什么bug导致死锁,这时一般做法都是pstack打印出堆栈信息,分析堆栈信息涉及到的函数猜测原因

16 ERROR 2013 (HY000): Lost connection to MySQL server at 'reading initial communication packet', system error: 0,之前碰到这样的报错是由于短连接太多导致服务器端口耗尽,与8中的本地客户端端口耗尽类似

17 ERROR 2013 (HY000): Lost connection to MySQL server at 'reading authorizsation packet', system error: 54,一些特殊的网络设置导致,可能需要做下网络转发

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/968694
推荐阅读
相关标签
  

闽ICP备14008679号