赞
踩
前言
现在不管是分布式还是其他服务器还是深度学习训练模型等,都离不开GPU,因此了解一下GPU常见的参数命令以及性能指标是十分重要的,几个十分重要的参数如:温度、内存占用情况、GPU使用情况等。
Nvidia自带了一个nvidia-smi的命令行工具,会显示显存使用情况:
$ nvidia-smi
输出:
但是有时我们希望不仅知道那一固定时刻的GPU使用情况,我们希望一直掌握其动向,此时我们就希望周期性地输出,比如每 10s 就更新显示。 这时候就需要用到 watch命令,来周期性地执行nvidia-smi命令了。
了解一下watch的功能:
-
$ whatis watch
-
watch(
1) - execute a program periodically, showing output fullscreen
作用:周期性执行某一命令,并将输出显示。
watch的基本用法是:
$ watch [options] command
最常用的参数是 -n, 后面指定是每多少秒来执行一次命令。
监视显存:我们设置为每 10s 显示一次显存的情况:
$ watch -n 10 nvidia-smi
显示如下:
这样,只要开着这个命令行窗口,就可以每十秒刷新一次,是不是很方便呢?
如果我们希望来周期性地执行其他命令行操作,那么就可以简单地更换后面的nvidia-smi即可,So Cool !
转载地址:http://blog.csdn.net/jasonzzj/article/details/52649174
具体如下所示:重要的参数主要是温度、内存使用、GPU占有率,具体如下红框所示。
转载地址:http://blog.csdn.net/vbskj/article/details/52194372
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。