nvidia常用命令
Nvidia相关命令
- nvidia-smi: 调用nvidia系统管理界面
- nvidia-smi -L: 列出所有GPU
- nvidia-smi -i 0: 查询特定卡的信息,0.1.2.为GPU编号
- nvidia-smi pmon: 监控线程
- nvidia-smi dmon: 监控设备
- nvidia-smi -q: 查询所有信息
- nvidia-smi -l 3:持续监控gpu状态,每三秒刷新一次状态
nvidia-smi 信息解读
- Fan:风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温
- Temp:温度,单位摄氏度。
- Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
- Pwr:能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少。
- Bus-Id:GPU总线,domain:bus:device.function
- Disp.A:Display Active,表示GPU的显示是否初始化。
- Memory Usage:显存使用率。
- Compute M:是计算模式。