当前位置:   article > 正文

系统运行缓慢,linux解决方案_barad_agent干嘛的

barad_agent干嘛的

一. 检查CPU信息

命令 cat  /proc/cpuinfo

命令 lscpu

介绍关于CPU信息的几个重要细节。

  • bogomips:bogo是bogus(伪)的意思,MIPS是指每秒百万条指令。它是显示系统性能的独立程序。
  • model_name:表示CPU的制造商、型号和速度。在本文中,我们拥有速度为1.73GHz的英特尔(R)赛扬(R)CPU。
  • CPU MHZ(兆赫):用于测量通道、总线和计算机内部时钟的传输速度。在本文中,传输速度是1733.329GHz。

如果是上述原因导致的慢的话,建议直接购买新的机器;

二. 查看Linux的进程, top命令

先看开头部分,up 后面是系统开机时间;users代表用户数 load average:是系统最近1min、5min、15min的CPU荷载信息. 

  • 第一行(top):系统当前时间,当前登录用户个数以及系统负载。
  • 第二行(tasks):系统总进程数、运行中进程数、休眠、睡眠和僵尸进程数量。
  • 第三行(cpu):CPU 当前使用情况。
  • 第四行(kib mem):内存当前使用情况。
  • 第五行(kib swap):Swap 空间当前使用情况。

total:当前有的任务数量

running:正在运行的任务数量 

sleeping:处于睡眠状态 的进程数量

stopped:停止的进程数量 

zombie:基本不动的进程数量

us:用户态进程占用CPU时间百分比 

sy:内核占用CPU时间百分比 

ni:renice值为负的任务的用户态进程的CPU时间百分比。nice是优先级的意思 

id:空闲CPU时间百分比 0.0%wa:等待I/O的CPU时间百分比 

hi:CPU硬中断时间百分比 

si:CPU软中断时间百分比

  • PID:进程 ID。
  • USER:进程所有者。
  • PR:进程优先级 NI:NICE 值,NICE 值越小,优先级越高。
  • VIRT:使用的虚拟内存大小,单位 KB。
  • RES:当前使用的内存大小,单位 KB。
  • SHR:使用的共享内存的大小,单位 KB。
  • S:进程状态。
  • %CPU:更新时间间隔内进程所使用的 CPU 时间的百分比。
  • %MEM:更新时间间隔内进程所使用的内存的百分比。
  • TIME+:进程使用的 CPU 时间,精确到 0.01s。
  • COMMAND:进程名称。

根据 %CPU 列与 %MEM 列,确定占用较多资源的进程

分析进程

  • 如果是业务进程占用了大量 CPU 或内存资源,建议分析业务程序是否有优化空间,进行优化或者  升级服务器配置。
  • 如果是异常进程占用了大量 CPU 或内存资源,则实例可能中毒,您可以自行终止进程或者使用安全软件进行查杀,必要时考虑备份数据,重装系统。
  • 如果是第三方组件进程占用了大量 CPU 或内存资源,请联系第三方进行进一步定位处理。
    如常见的腾讯云组件有:
    • sap00x:安全组件进程
    • Barad_agent:监控组件进程
    • secu-tcs-agent:安全组件进程

终止进程

  1. 根据分析的占用资源的进程情况,记录需要终止的进程 PID。
  2. 输入 k
  3. 输入需要终止进程的 PID ,按 Enter

CPU 空闲但高负载情况处理

问题描述

Load average 是 CPU 负载的评估,其值越高,说明其任务队列越长,处于等待执行的任务越多。
通过 top 观察,类似如下图所示,CPU 很空闲,但是 load average 却非常高。

处理办法

执行以下命令,查看进程状态,并检查是否存在 D 状态进程。 命令  ps -axjf

D 状态指不可中断的睡眠状态。该状态进程无法被杀死,也无法自行退出。

若出现较多 D 状态进程,可通过恢复该进程依赖资源或重启系统进行解决。

三. 分析进程中cpu偏高的进程

根据top分析出cpu过高的进程;

(图片来源于网络,copy的)

根据top -Hp 命令查看该进程下各个线程的cpu使用情况; 命令:top -Hp 23344

上图中可以看出pid为25077的线程占了较多的cpu资源,利用jstack命令可以继续查看该线程当前的堆栈状态。

jstack命令

通过top命令定位到cpu占用率较高的线程之后,继续使用jstack pid命令查看当前java进程的堆栈状态

jstack命令生成的thread dump信息包含了JVM中所有存活的线程,为了分析指定线程,必须找出对应线程的调用栈,应该如何找?

在top命令中,已经获取到了占用cpu资源较高的线程pid,将该pid转成16进制的值,在thread dump中每个线程都有一个nid,找到对应的nid即可;隔段时间再执行一次stack命令获取thread dump,区分两份dump是否有差别,在nid=0x246c的线程调用栈中,发现该线程一直在执行JstackCase类第33行的calculate方法,得到这个信息,就可以检查对应的代码是否有问题。

通过thread dump分析线程状态

除了上述的分析,大多数情况下会基于thead dump分析当前各个线程的运行情况,如是否存在死锁、是否存在一个线程长时间持有锁不放等等。

在dump中,线程一般存在如下几种状态:
1、RUNNABLE,线程处于执行中
2、BLOCKED,线程被阻塞
3、WAITING,线程正在等待

很明显:线程1获取到锁,处于RUNNABLE状态,线程2处于BLOCK状态
1、locked <0x000000076bf62208>说明线程1对地址为0x000000076bf62208对象进行了加锁;
2、waiting to lock <0x000000076bf62208> 说明线程2在等待地址为0x000000076bf62208对象上的锁;
3、waiting for monitor entry [0x000000001e21f000]说明线程1是通过synchronized关键字进入了监视器的临界区,并处于"Entry Set"队列,等待monitor,具体实现可以参考深入分析synchronized的JVM实现

实例2:通过wait挂起线程

  1. static class Task implements Runnable {
  2. @Override
  3. public void run() {
  4. synchronized (lock) {
  5. try {
  6. lock.wait();
  7. //TimeUnit.SECONDS.sleep(100000);
  8. } catch (InterruptedException e) {
  9. e.printStackTrace();
  10. }
  11. }
  12. }
  13. }

dump结果

线程1和2都处于WAITING状态
1、线程1和2都是先locked <0x000000076bf62500>,再waiting on <0x000000076bf62500>,之所以先锁再等同一个对象,是因为wait方法需要先通过synchronized获得该地址对象的monitor;
2、waiting on <0x000000076bf62500>说明线程执行了wait方法之后,释放了monitor,进入到"Wait Set"队列,等待其它线程执行地址为0x000000076bf62500对象的notify方法,并唤醒自己;

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/70200
推荐阅读
相关标签
  

闽ICP备14008679号