葡京网投哪个正规 > 首页 > 常用系统性能监控命令

原标题:常用系统性能监控命令

浏览次数:151 时间:2020-01-19

监控CPU使用率

使用下面的命令:

[root@localhost ~]# gnome-system-monitor

将会出现图形化工具GNOME System Monitor,如下图所示:

图片 1

概述

监控CPU调度程序运行队列

linux可以使用vmstat命令

vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写, 是实时系统监控工具。该命令通过使用knlist子程序和/dev/kmen伪设备驱动器访问这些数据,输出信息直接打印在屏幕。vmstat反馈的与CPU相关的信息包括:

(1)多少任务在运行
(2)CPU使用的情况
(3)CPU收到多少中断
(4)发生多少上下文切换

下面只介绍 Vmstat与CPU相关的参数

vmstat的语法如下:

vmstat [delay [count]]

参数的含义如下:

参数 解释
delay 相邻的两次采样的间隔时间
count 采样的次数,count只能和delay一起使用

当没有参数时,vmstat则显示系统启动以后所有信息的平均值。有delay时,第一行的信息自系统启动以来的平均信息。从第二行开始,输出为前一个delay时间段的平均信息。当系统有多个CPU时,输出为所有CPU的平均值。

参数 解释 从/proc/stat获得数据
r 在internal时间段里,运行队列里等待CPU的任务(任务)的个数,即不包含vmstat进程 procs_running-1
b 在internal时间段里,被资源阻塞的任务数(I/0,页面调度,等等.)通常情况下是接近0的 procs_blocked
us 在internal时间段里,用户态的CPU时间(%),包含 nice值为负进程 (user+nice)/total*100
sy 在internal时间段里,核心态的CPU时间(%) (system+irq+softirq)/total*100
id 在internal时间段里,cpu空闲的时间,不包括等待i/o的时间(%) idle/total*100
wa 在internal时间段里,等待i/o的时间(%) iowait/total*100
in 在internal时间段里,每秒发生中断的次数 intr/interval
cs 在internal时间段里,每秒上下文切换的次数,即每秒内核任务交换的次数 ctxt/interval

total_cur = user + system + nice + idle + iowait + irq + softirq

total_pre = pre_user + pre_system + pre_nice + pre_idle + pre_iowait + pre_irq + pre_softirq

total = total_cur – total_pre

[root@localhost ~]# vmstat

运行结果如下:

图片 2

[root@localhost ~]# rpm -qa|grep sysst
sysstat-9.0.4-22.el6.x86_64
mpstat是MultiProcessor Statistics的缩写,是实时系统监控工具。其报告与CPU的一些统计信息,这些信息存放在/proc/stat文件中。在多CPUs系统里,其不但能查看所有CPU的平均状况信息,而且能够查看特定CPU的信息。下面只介绍mpstat与CPU相关的参数,mpstat的语法如下:
mpstat [-P {|ALL}] [internal [count]]

监控锁竞争

使用 sysstat包中的pidstat命令来监控

[root@localhost ~]# pidstat

运行结果如下:

Linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 CPU)

09:58:18 PID %usr %system %guest %CPU CPU Command
09:58:18 1 0.00 0.00 0.00 0.00 0 init
09:58:18 4 0.00 0.00 0.00 0.00 0 ksoftirqd/0

……

09:58:18 37143 0.00 0.00 0.00 0.00 0 dbus-launch
09:58:18 37144 0.00 0.00 0.00 0.00 0 dbus-daemon
09:58:18 37268 0.00 0.00 0.00 0.00 0 fprintd
09:58:18 37272 0.00 0.00 0.00 0.00 0 pidstat

总结的说,CPU性能监控包含以下方面:

监控网络I/O使用率

nicstat原本是Solaris平台下显示网卡流量的工具,Tim Cook将它移植到linux平台

首先安装之,源码在这里下, 这里使用的版本是1.92。

安装make环境:

yum install gcc gcc-c++ make automake autoconf -y

由于nicstat依赖32 bit glibc package,所以

yum install libgcc.i686 glibc.i686 glibc-devel.i686  -y

下载文件并安装:

# wget -c http://nchc.dl.sourceforge.net/project/nicstat/nicstat-1.92.tar.gz
# tar zxvf nicstat-1.92.tar.gz
# cd nicstat-1.92
# cp Makefile.Linux Makefile
# uname -m

[root@localhost nicstat-1.92]# make
gcc -O3 -m32 nicstat.c -o nicstat
nicstat.c:99:1: warning: “DUPLEX_UNKNOWN” redefined
In file included from nicstat.c:84:
/usr/include/linux/ethtool.h:691:1: warning: this is the location of the previous definition
mv nicstat `./nicstat.sh –bin-name`

[root@localhost nicstat-1.92]# ./nicstat.sh

图片 3

检查系统的运行队列,确保每一个CPU的运行队列不大于3.

磁盘I/O使用率

iostat [-t] [-c] [interval [count]]

参数的含义如下:

参数 解释
T 表示输出采用的时间
C 表示只显示CPU的信息
Internal 相邻的两次采样的间隔时间
count 采样的次数,count只能和delay一起使用

当没有参数时,iostat则显示系统启动以后所有信息的平均值。与CPU有关的输出的含义

参数

解释

从/proc/stat获得

CPU

处理器ID

user

在internal时间段里,用户态的CPU时间(%) ,不包含 nice值为负进程

usr/total*100

nice

在internal时间段里,nice值为负进程的CPU时间(%)

nice/total*100

sys

在internal时间段里,核心时间(%)

(system+irq+softirq)/total*100

iowait

在internal时间段里,硬盘IO等待时间(%)

iowait/total*100

idle

在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间 (%)

idle/total*100

total_cur = user + system + nice + idle + iowait + irq + softirq

total_pre = pre_user + pre_system + pre_nice + pre_idle + pre_iowait + pre_irq + pre_softirq

total = total_cur – total_pre

有interval时,第一行的信息自系统启动以来的平均信息。从第二行开始,输出为前一个interval时间段的平均信息。

使用iostat命令

[root@localhost ~]# iostat

运行结果如下:

Linux 2.6.32-431.el6.x86_64 (localhost.localdomain) 05/07/15 _x86_64_ (1 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle
6.12 0.00 1.35 2.35 0.00 90.19

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 6.03 267.11 272.53 26904430 27450404

PS:附上Brendan Gregg 个人站点上分享了很多 Linux 性能相关的资源:

Linux observability tools | Linux 性能观测工具

图片 4

Linux benchmarking tools | Linux 性能测评工具

图片 5

Linux tuning tools | Linux 性能调优工具

图片 6

Linux observability sar

图片 7

另外,我们之前也分享过另外一篇Linux监控命令的文章,有兴趣可以看看。

确保CPU使用分布满足70/30原则(用户70%,系统30%)。

如果系统时间过长,可能是因为频繁的调度和改变优先级。

CPU Bound进程总是会被惩罚(降低优先级)而IO Bound进程总会被奖励(提高优先级)。

正如我们之前讨论的任何系统的性能比较都是基于基线的,并且监控CPU的性能就是以下3点,运行队列、CPU使用率和上下文切换。

mpstat最大的特点是:可以查看多核心cpu中每个计算核心的统计数据;而类似工具vmstat只能查看系统整体cpu情况

解释
-P {|ALL} 表示监控哪个CPU, cpu在[0,cpu个数-1]中取值
internal 相邻的两次采样的间隔时间
count 采样的次数,count只能和delay一起使用
当没有参数时,mpstat则显示系统启动以后所有信息的平均值。有interval时,第一行的信息自系统启动以来的平均信息。
从第二行开始,输出为前一个interval时间段的平均信息。

CPU 处理器ID
user 在internal时间段里,用户态的CPU时间(%),不包含 nice值为负 进程 (usr/total)*100
nice 在internal时间段里,nice值为负进程的CPU时间(%) (nice/total)*100
system 在internal时间段里,核心时间(%) (system/total)*100
iowait 在internal时间段里,硬盘IO等待时间(%) (iowait/total)*100
irq 在internal时间段里,硬中断时间(%) (irq/total)*100
soft 在internal时间段里,软中断时间(%) (softirq/total)*100
idle 在internal时间段里,CPU除去等待磁盘IO操作外的因为任何原因而空闲的时间闲置时间(%)(idle/total)*100
intr/s 在internal时间段里,每秒CPU接收的中断的次数intr/total)*100
CPU总的工作时间=total_cur=user+system+nice+idle+iowait+irq+softirq
total_pre=pre_user+ pre_system+ pre_nice+ pre_idle+ pre_iowait+ pre_irq+ pre_softirq
user=user_cur – user_pre
total=total_cur-total_pre
其中_cur 表示当前值,_pre表示interval时间前的值。上表中的所有值可取到两位小数点。

样例
范例1:average mode (粗略信息),当mpstat不带参数时,输出为从系统启动以来的平均值。
# mpstat
范例2: 每2秒产生了2个处理器的统计数据报告
# mpstat -P ALL 2 3

pidstat

pidstat主要用于监控全部或指定进程占用系统资源的情况,如CPU,内存、设备IO、任务切换、线程等。pidstat首次运行时显示自系统启动开始的各项统计信息,之后运行pidstat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。
执行pidstat,将输出系统启动后所有活动进程的cpu统计信息:
执行”pidstat -u”与单独执行”pidstat”的效果一样
pidstat -r 1    各列输出的含义如下
minflt/s: 每秒次缺页错误次数(minor page faults),次缺页错误次数意即虚拟内存地址映射成物理内存地址产生的page fault次数
majflt/s: 每秒主缺页错误次数(major page faults),当虚拟内存地址映射成物理内存地址时,相应的page在swap中,这样的page fault为major page fault,一般在内存使用紧张时产生
VSZ:      该进程使用的虚拟内存(以kB为单位)
RSS:      该进程使用的物理内存(以kB为单位)
%MEM:     该进程使用内存的百分比
Command:  拉起进程对应的命令

pidstat -r -p pid 1
pidstat -r -p pid 1          针对特定进程
pidstat -u 1            
pidstat -r 1
pidstat -d 1
以上命令以1秒为信息采集周期,分别获取cpu、内存和磁盘IO的统计信息。

本文由葡京网投哪个正规发布于首页,转载请注明出处:常用系统性能监控命令

关键词:

上一篇:没有了

下一篇:没有了