nvidia-smi无法在ubuntu/linux下的zbook studio g8工作[已关闭]

o2rvlv0m  于 2023-04-29  发布在  Linux
关注(0)|答案(1)|浏览(259)

**关闭。**这个问题是not about programming or software development。目前不接受答复。

这个问题似乎不是关于a specific programming problem, a software algorithm, or software tools primarily used by programmers的。如果你认为这个问题与another Stack Exchange site的主题有关,你可以留下评论,解释在哪里可以回答这个问题。
8天前关闭
Improve this question
当我运行nvidia-smi时,它总是显示:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

我试过Popos,Manjaro,Ubuntu 22。04,没有一个能用。GPU只在Windows中可用,这很糟糕。
我该怎么解决呢?
我希望看到GPU的实时内存使用情况

bxgwgixi

bxgwgixi1#

方法一

1.从HP网站开始安装一个专门的ubuntu系统

https://support.hp.com/hk-en/drivers/selfservice/hp-zbook-studio-15.6-inch-g8-mobile-workstation-pc/2100677682
选择ubuntu,下载iso文件,使用Balena Etcher将其放入usb中,将其刷新到笔记本电脑中

2.进入ubuntu 20后。04系统

您可以使用nvidia-smi检查GPU内存。

3.使用anaconda安装tensorflow

Tensorflow在这里有一个教程:https://www.tensorflow.org/install/pip
大概是这样的

conda install -c conda-forge cudatoolkit=11.8.0
python3 -m pip install nvidia-cudnn-cu11==8.6.0.163 tensorflow==2.12.*
mkdir -p $CONDA_PREFIX/etc/conda/activate.d
echo 'CUDNN_PATH=$(dirname $(python -c "import nvidia.cudnn;print(nvidia.cudnn.__file__)"))' >> $CONDA_PREFIX/etc/conda/activate.d/env_vars.sh
echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib/:$CUDNN_PATH/lib' >> $CONDA_PREFIX/etc/conda/activate.d/env_vars.sh
source $CONDA_PREFIX/etc/conda/activate.d/env_vars.sh
# Verify install:
python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"

4.安装pytorch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

https://pytorch.org/get-started/locally/
验证它:

import torch

print(torch.cuda.is_available())

方法二

1.升级HP bios

你可以直接使用在线bios更新来更新你的bios防火墙。

Reboot -> F2 -> Esc -> Set up WiFi -> reboot -> F10 -> update bios in a online way

或者您可以使用Windows系统进行更新:
https://support.hp.com/us-en/document/ish_3894564-1633733-16

2.切换到integrated graphics only mode

在popos中,你可以在右上角的图标,电源设置。
在ubuntu中,您可以在nvidia-settings-〉profile-settings-〉use integrated graphics中执行此操作
重新启动

3.使用gcc-12

which gcc


# if gcc is not gcc-12, then do the following

sudo rm /usr/bin/gcc

sudo ln -s /usr/bin/gcc-12 /usr/bin/gcc

4.为您的特殊gpu版本安装nvidia专用驱动

对我来说是GeForce RTX 3070 Mobile
从nvidia驱动程序下载页面,您可以下载类似NVIDIA-Linux-x86_64-525.105.17.run的文件。
https://www.nvidia.com/download/index.aspx?lang=en-us
然后执行以下操作:

sudo chmod 777 NVIDIA-Linux-x86_64-525.105.17.run

sudo ./NVIDIA-Linux-x86_64-525.105.17.run

5.切换回nvidia graphics only mode

重新启动
现在,您应该能够使用nvidia-smi查看实时的gpu内存信息

6.安装anaconda

https://conda.io/projects/conda/en/latest/user-guide/install/linux.html#installing-on-linux
下载一个类似Anaconda3-2023.03-Linux-x86_64.sh的文件

sudo chmod 777 Anaconda3-2023.03-Linux-x86_64.sh

sudo ./Anaconda3-2023.03-Linux-x86_64.sh

7.使用conda安装cuda

现在,打开一个新的终端窗口
然后,尝试使用tensorflow官方文档中的脚本安装tensorflow:
https://www.tensorflow.org/install/pip

conda install -c conda-forge cudatoolkit=11.8.0

python3 -m pip install nvidia-cudnn-cu11==8.6.0.163 tensorflow==2.12.*

mkdir -p $CONDA_PREFIX/etc/conda/activate.d

echo 'CUDNN_PATH=$(dirname $(python -c "import nvidia.cudnn;print(nvidia.cudnn.__file__)"))' >> $CONDA_PREFIX/etc/conda/activate.d/env_vars.sh

echo 'export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CONDA_PREFIX/lib/:$CUDNN_PATH/lib' >> $CONDA_PREFIX/etc/conda/activate.d/env_vars.sh

source $CONDA_PREFIX/etc/conda/activate.d/env_vars.sh

# Verify install:

python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"

8.完成

作者:@yingshaoxo

相关问题