windows CUDA错误后重置GPU和驱动程序

jum4pzuy  于 2022-11-26  发布在  Windows
关注(0)|答案(6)|浏览(256)

有时,我的CUDA程序中的错误会导致桌面图形中断(在Windows中)。通常,屏幕仍保持一定的可读性,但当图形发生变化时,例如拖动窗口时,会出现大量半随机颜色的像素和小块。
我试过通过改变桌面分辨率来重置GPU和驱动程序,但没有用。我找到的唯一修复方法是重新启动计算机。
有没有一个程序在那里或一些技巧,我可以用来让驱动程序和GPU重置而不重新启动?

taor4pac

taor4pac1#

因为同样的问题有时会发生在unix和谷歌转发我到这个线程,我希望这有助于别人...
在ubuntu上卸载和重新加载nvidia内核模块为我解决了这个问题:

sudo rmmod nvidia_uvm
sudo modprobe nvidia_uvm
a6b3iqyw

a6b3iqyw2#

编辑:

如果您使用Linux上的Tesla硬件,并且可以运行nvidia-smi,则可以使用

nvidia-smi -r

nvidia-smi --gpu-reset

以下是此开关的man输出:
重置GPU状态。可用于清除双位ECC错误或恢复挂起的GPU。需要-i开关才能将特定设备作为目标。仅在Linux上可用。
否则......
真正重置硬件的方法是重新启动。
您描述的情况不应该发生。我建议您使用不同的硬件进行测试,如果仍然发生,请告诉我们。

zvms9eto

zvms9eto3#

要在Windows中重置图形堆栈,请按Win+Ctrl+Shift+B。

ovfsdjhp

ovfsdjhp4#

我有一个GeForce GTX 260在NVDIA GPU SDK 4.2和我遇到了一些问题。有时开发我有程序错误。这导致屏幕显示随机彩色像素描述在这篇文章。
正如这里所述,如果我改变分辨率,它们不会消失。而且,如果我只改变颜色深度从32位到16位,随机颜色像素消失,但回到32位(不重新启动)使它们再次出现。最后一个导致这种行为的bug是使用__constant__ memory,但将其作为指针传递:

test<<<grid, threadsPerBlock>>>( cuda_malloc_data, cuda_constant_data );

如果我没有传递cudb_constant_data,那么就没有bug(因此,随机彩色像素不会出现)。

vof42yt1

vof42yt15#

1.在“设备管理器”的"显示适配器“选项卡下,找到驱动程序
1.禁用它
1.按win + ctrl +shift + B(监视器将闪烁)
1.启用驱动程序
给你。

8yparm6h

8yparm6h6#

  1. ps -ef
    1.找到类似root 4066644 1 99 08:56 ? 04:32:25 /opt/conda/bin/python /data/的内容
  2. kill 4066644

相关问题