赞
踩
本指标适用于使用性能测试进行性能测试项目技术质量评价依据,规范技术测试结果评价,统一性能测试技术测试质量度量。应用系统技术质量度量指标范围广泛,本文难以涵盖全部。 预期读者为测试管理人员、测试实施人员、技术支持人员、项目管理人员等系统技术质量相关人员。
响应时间(Response Time: RT
)指用户从客户端发起一个请求开始,到客户端接收到从服务器端返回的响应结束,整个过程所耗费的时间。在性能检测中一般以 压力发起端至被压测服务器返回处理结果的时间 为计量,单位一般为秒(s)或毫秒(ms)。
平均响应时间指系统稳定运行时间段内,同一交易的平均响应时间。一般而言,交易响应时间都是指平均响应时间。 平均响应时间指标值应根据不同的交易分别设定,一般情况下,分为 复杂交易响应时间、简单交易响应时间、特殊交易响应时间。其中,特殊交易响应时间的设定必须明确该交易在响应时间方面的特殊性。
不同行业不同业务可接受的响应时间是不同的,一般情况,对于 在线实时交易:
对于 批量交易:
系统处理能力是指 系统在利用系统硬件平台和软件平台进行信息处理的能力。系统处理能力通过 系统每秒钟能够处理的交易数量 来评价,交易有两种理解:
前者称为业务交易过程,后者称为事务。两种交易指标都可以评价应用系统的处理能力。一般建议与系统交易日志保持一致,以便于统计业务量或者交易量。系统处理能力指标是技术测试活动中重要指标。
一般情况下,用以下指标来度量:
对于互联网业务中,如果某些业务有且仅有一个请求连接,那么 T P S = Q P S = H P S TPS=QPS=HPS TPS=QPS=HPS,一般情况下用 TPS 来衡量 整个业务流程,用 QPS 来衡量 接口查询次数,用 HPS 来表示 对服务器单击请求。
无论 T P S 、 Q P S 、 H P S TPS、QPS、HPS TPS、QPS、HPS,此指标是衡量系统处理能力非常重要的指标,越大越好,根据经验,一般情况下:
并发用户数(Virtual User:VU
)指在同一时刻内,登录系统并进行业务操作的用户数量。
并发用户数对于 长连接系统 来说最大并发用户数即是系统的并发接入能力。对于 短连接系统 而言最大并发用户数并不等于系统的并发接入能力,而是与系统架构、系统处理能力等各种情况相关。例如系统吞吐能力很强,加上短连接一般都有连接复用,往往并发用户数大于系统的并发接入连接数。所以对于大部分短连接类型的系统,吞吐量模式(RPS 模式,Request Per Second
)比较适合,也是阿里的最佳实践,PTS 支持 RPS 模式的压测,吞吐量的压测构建和衡量一步到位。 在测试中,采用虚拟用户来模拟现实中用户进行业务操作。
一般情况下,性能测试是将 系统处理能力容量 测出来,而不是测试并发用户数,除了服务器长连接可能影响并发用户数外,系统处理能力不受并发用户数影响,可以用最小的用户数将系统处理能力容量测试出来,也可以用更多的用户将系统处理能力容量测试出来。
错误率(Virtual Failure Ratio:FR
)指系统在负载情况下,失败交易的概率。错误率=(失败交易数 / 交易总数)×100%。稳定性较好的系统,其错误率应该由 超时 引起,即为超时率。
不同系统对错误率的要求不同,但一般不超出千分之六,即成功率不低于99.4%。
中央处理器(Central Processing Unit:CPU
)是一块超大规模的集成电路,是一台计算机的运算核心(Core
)和控制核心(Control Unit
)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。CPU Load:系统正在干活的多少的度量,队列长度。系统平均负载。
CPU 指标主要指的:CPU使用率、利用率,包括用户态(user)、系统态(sys)、等待态(wait)、空闲态(idle)。
CPU 使用率、利用率要低于业界警戒值范围之内,即小于或者等于 75%、CPU sys% 小于或者等于30%,CPU wait% 小于或者等于5%。单核 CPU 也需遵循上述指标要求。CPU Load 要小于 CPU 核数。
内存(Memory
)是计算机中重要的部件之一,它是与 CPU 进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。
现代的操作系统为了最大利用内存,在内存中存放了缓存,因此内存利用率 100% 并不代表内存有瓶颈,衡量系统内有瓶颈主要靠 SWAP(与虚拟内存交换)交换空间利用率,一般情况下,SWAP 交换空间利用率要低于 70%,太多的交换将会引起系统性能低下。
磁盘吞吐量(Disk Throughput
)是指在无磁盘故障的情况下单位时间内通过磁盘的数据量。
磁盘指标主要有 每秒读写多少兆,磁盘繁忙率,磁盘队列数,平均服务时间,平均等待时间,空间利用率。其中 磁盘繁忙率 是直接反映磁盘是否有瓶颈的重要依据,一般情况下,磁盘繁忙率要低于70%。
网络吞吐量(Network Throughput
)是指在无网络故障的情况下 单位时间内通过的网络的数据数量。单位为 Byte/s。网络吞吐量指标用于衡量系统对于网络设备或链路传输能力的需求。当网络吞吐量指标接近网络设备或链路最大传输能力时,则需要考虑升级网络设备。
网络吞吐量指标主要有 每秒有多少兆流量进出,一般情况下不能超过设备或链路最大传输能力的 70%。
操作系统内核参数主要包括 信号量、进程、文件句柄,一般不要超过设置的参数值即可,具体如下:
二级指标 | 单位 | 解释 |
---|---|---|
Maxuprc | 个 | 限制每个用户的用户进程的最大数量 |
Max_thread_proc | 个 | 定义每个进程允许的最大线程数量 |
Filecache_max | 字节 | 最大可用于cache file I/O 的物理内存 |
Ninode | 个 | 内存中 HFS 文件系统打开 i 节点的最大数量 |
Nkthread | 个 | 限制允许同时运行的线程数量 |
Nproc | 个 | 限制允许同时运行的进程数量 |
Nstrpty | 个 | 基于 STREAMS 的伪终端(pts)的最大数量 |
Maxdsiz | 字节 | 任何用户进程的数据段的最大大小(以字节为单位) |
maxdsiz_64bit | 字节 | 任何用户进程的数据段的最大大小(以字节为单位) |
maxfiles_lim | 个 | 每个进程的文件描述符的最大数目硬限制 |
maxssiz_64bit | 字节 | 任何用户进程的堆栈的最大大小 |
Maxtsiz | 字节 | 任一用户进程的文本段的最大大小 |
nflocks | 个 | 文件锁的最大数量 |
maxtsiz_64bit | 字节 | 任一用户进程的文本段的最大大小 |
msgmni | 个 | 系统级 System V IPC 消息队列(ID)所允许的最大数量 |
msgtql | 个 | 系统中任意时间的最大 System V IPC 消息数 |
npty | 个 | BSD 伪终端(pty)的最大数量 |
nstrtel | 个 | 指定内核可支持传入 telnet 会话的 telnet 设备文件的数量 |
nswapdev | 个 | 可用于交换的设备的最大数量 |
nswapfs | 个 | 可用于交换的文件系统的最大数量 |
semmni | 个 | System V IPC 系统级信号量标识符的数量 |
semmns | 个 | System V 系统级信号量的数量 |
shmmax | 字节 | System V 共享内存段的最大大小 |
shmmni | 个 | 系统中 System V 共享内存段标识符的数量 |
shmseg | 个 | 每个进程 System V 共享内存段的最大数量 |
常用的中间件例如 Tomcat、Weblogic(一个基于 JAVAEE 架构的中间件),指标主要包括 JVM、ThreadPool、JDBC,具体如下:
Garbage Collection,垃圾回收
)频率不能频繁,特别是FULL GC 更不能频繁,一般情况下系统性能较好的情况下,JVM 最小堆大小和最大堆大小分别设置1024M 比较合适。常用的数据库例如MySQL,指标主要包括 SQL、吞吐量、缓存命中率、连接数 等,具体如下:
前端指标主要包括 页面展示 和 网络 所花的时间,具体如下:
最短稳定时间:系统按照 最大容量的 80% 或标准压力(系统的预期日常压力)情况下运行,能够稳定运行的最短时间。
一般来说,对于正常工作日(8小时)运行的系统,至少应该能保证系统稳定运行 8 小时以上。对于 7×24 运行的系统,至少应该能够保证系统稳定运行 24 小时以上。 如果系统不能稳定的运行,上线后,随着业务量的增长和长时间运行,将会出现性能下降甚至崩溃的风险。
批量处理程序单位时间内处理的数据数量。一般用每秒处理的数据量来衡量。处理效率 是估算批量处理时间窗口最重要的计算指标。 关于批量处理时间窗口,不同系统的批量处理时间窗口在起止时间上可以部分重叠。另外,同一系统内部,也可能存在多个批量处理过程同时进行,其时间窗口相互叠加。 长时间批量处理将会对联机在线实时交易产生重大的性能影响。
指应用软件或操作系统以集群方式部署,增加的硬件资源与增加的处理能力之间的关系。计算公式为:(增加性能 / 原始性能)/(增加资源 / 原始资源)× 100%。
扩展能力应通过多轮测试获得扩展指标的变化趋势。 一般扩展能力非常好的应用系统,扩展指标应是 线性或接近线性的,现在很多大规模的分布式系统的扩展能力非常好。
双机热备系统 是 集群的最小组成单位,就是将中心服务器安装成互为备份的两台服务器,并且在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会迅速的自动启动并运行(一般为数分钟左右),从而保证整个网络系统的正常运行!双机热备的工作机制实际上是为整个网络系统的中心服务器提供了一种故障自动恢复能力。
对于将双机热备作为可靠性保障手段的系统,可衡量的指标如下:
对于使用集群方式的系统,主要通过以下方式考量其集群可靠性:
本指标为了验证系统的备份、恢复机制是否有效可靠,包括系统的备份和恢复、数据库的备份和恢复、应用的备份和恢复,包括以下测试内容:
本篇文章转载于阿里云的 性能测试 PTS - 测试指标。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。