nvidia常用命令

Nvidia相关命令

  • nvidia-smi: 调用nvidia系统管理界面
  • nvidia-smi -L: 列出所有GPU
  • nvidia-smi -i 0: 查询特定卡的信息,0.1.2.为GPU编号
  • nvidia-smi pmon: 监控线程
  • nvidia-smi dmon: 监控设备
  • nvidia-smi -q: 查询所有信息
  • nvidia-smi -l 3:持续监控gpu状态,每三秒刷新一次状态
    nvidia-smi.png

nvidia-smi 信息解读

20200729_204726000_iOS.jpg

  • Fan:风扇转速,从0到100%之间变动,这个速度是计算机期望的风扇转速,实际情况下如果风扇堵转,可能打不到显示的转速。有的设备不会返回转速,因为它不依赖风扇冷却而是通过其他外设保持低温
  • Temp:温度,单位摄氏度。
  • Perf:性能状态,从P0到P12,P0表示最大性能,P12表示状态最小性能。
  • Pwr:能耗,上方的Persistence-M:是持续模式的状态,持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少。
  • Bus-Id:GPU总线,domain:bus:device.function
  • Disp.A:Display Active,表示GPU的显示是否初始化。
  • Memory Usage:显存使用率。
  • Compute M:是计算模式。