Nvidia: NVRM: GPU at 0000:01:00.0 Has Fallen Off The Bus
时间:2019-11-20 08:53:13 来源:igfitidea点击:
问题
在CentOS /var/log/messages文件中,提示下面报错:
May 28 06:53:19 kart1 kernel: [49298.937949] NVRM: GPU at 0000:01:00.0 has fallen off the bus. May 29 06:14:01 kart1 kernel: [28508.567838] NVRM: GPU at 0000:01:00.0 has fallen off the bus.
NVIDIA 内核模块版本为 x86_64 282.15。
解决方案
安装最新的内核版本和NVIDIA驱动程序
更新内核并安装最新的NVIDIA Unix驱动程序。
将NVIDIA驱动程序置于持久模式
将GPU设置为持久性模式。
编辑/etc/rc.local文件,并在exit 0语句之前添加以下行:
/usr/bin/nvidia-smi -pm 1
这样,GPU在启动后立即设置为持久模式。
使用命令设置持久模式?
以root用户身份执行以下命令:
# /usr/bin/nvidia-smi -pm 1
如何验证显卡设置了持久模式?
以root用户身份执行以下命令:
# /usr/bin/nvidia-smi -q | grep -i Persistence
Linux如何查看显卡GPU的设置?
执行以下命令以显示GPU或单元信息:
# nvidia-smi -q | less
输出示例:
==============NVSMI LOG============== Timestamp : Tue Feb 21 07:20:20 2012 Driver Version : 280.13 Attached GPUs : 1 GPU 0000:01:00.0 Product Name : Quadro FX 2800M Display Mode : N/A Persistence Mode : Enabled Driver Model Current : N/A Pending : N/A Serial Number : N/A GPU UUID : N/A Inforom Version OEM Object : N/A ECC Object : N/A Power Management Object : N/A PCI Bus : 1 Device : 0 Domain : 0 Device Id : 061D10DE Bus Id : 0000:01:00.0 Fan Speed : N/A Memory Usage Total : 1023 Mb Used : 74 Mb Free : 949 Mb Compute Mode : Default Utilization Gpu : N/A Memory : N/A Ecc Mode Current : N/A Pending : N/A ECC Errors Volatile Single Bit Device Memory : N/A Register File : N/A L1 Cache : N/A L2 Cache : N/A Total : N/A Double Bit Device Memory : N/A Register File : N/A L1 Cache : N/A L2 Cache : N/A Total : N/A Aggregate Single Bit Device Memory : N/A Register File : N/A L1 Cache : N/A L2 Cache : N/A Total : N/A Double Bit Device Memory : N/A Register File : N/A L1 Cache : N/A L2 Cache : N/A Total : N/A Temperature Gpu : 48 C Power Readings Power State : N/A Power Management : N/A Power Draw : N/A Power Limit : N/A Clocks Graphics : N/A SM : N/A Memory : N/A