pytorch 如何使用NVIDIA GeForce RTX 3090 GPU启动chenrocks/uniter?

col17t5w  于 2022-11-09  发布在  其他
关注(0)|答案(1)|浏览(269)
docker run --gpus '"'device=$CUDA_VISIBLE_DEVICES'"' --ipc=host --rm -it \
    --mount src=$(pwd),dst=/src,type=bind \
    --mount src=$OUTPUT,dst=/storage,type=bind \
    --mount src=$PRETRAIN_DIR,dst=/pretrain,type=bind,readonly \
    --mount src=$TXT_DB,dst=/txt,type=bind,readonly \
    --mount src=$IMG_DIR,dst=/img,type=bind,readonly \
    -e NVIDIA_VISIBLE_DEVICES=$CUDA_VISIBLE_DEVICES \
    -w /src chenrocks/uniter

当我运行这个文件时,它打印错误

NVIDIA Release 19.05 (build 6411784) PyTorch Version 1.1.0a0+828a6a3

...

WARNING: Detected NVIDIA NVIDIA GeForce RTX 3090 GPU, which is not yet supported in this version of the container
ERROR: No supported GPU(s) detected to run this container

它不适合我NVIDIA GeForce RTX 3090 GPU,所以我想将版本更改为22.05,但当我运行此程序时,

docker run --gpus '"'device=$CUDA_VISIBLE_DEVICES'"' --ipc=host --rm
-it nvcr.io/nvidia/pytorch:22.05-py3 \
    --mount src=$(pwd),dst=/src,type=bind \
    --mount src=$OUTPUT,dst=/storage,type=bind \
    --mount src=$PRETRAIN_DIR,dst=/pretrain,type=bind,readonly \
    --mount src=$TXT_DB,dst=/txt,type=bind,readonly \
    --mount src=$IMG_DIR,dst=/img,type=bind,readonly \
    -e NVIDIA_VISIBLE_DEVICES=$CUDA_VISIBLE_DEVICES \
    -w /src chenrocks/uniter

它打印错误

/opt/nvidia/nvidia_entrypoint.sh: line 49: exec: --: invalid option
exec: usage: exec [-cl] [-a name] [command [arguments ...]] [redirection ...]

如果您能告诉我如何更改版本,我将非常感激。

w6lpcovy

w6lpcovy1#

第二个docker run命令指定2个图像:

docker run ... nvcr.io/nvidia/pytorch:22.05-py3 chenrocks/uniter

你只能通过一个。
另请注意docker run命令的一般格式:

$ docker run [OPTIONS] IMAGE [COMMAND] [ARG...]

更新

但是如果docker图像的nvidia/pytorch版本不适合我的GPU,我可以不使用docker图像吗?或者我可以做些什么?
您可以尝试编辑引用项目的Dockerfile以构建自定义Docker映像。
大概是这样的:

git clone https://github.com/ChenRocks/UNITER.git
cd UNITER

# replace the first line of the Dockerfile with:

# FROM nvcr.io/nvidia/pytorch:22.05-py3

docker build .

# ...

# Successfully built <image_id>

然后,只需编辑您的docker run命令,以使用您自定义构建的映像:

docker run ... <image_id>

看起来至少还有一个人有一个similar issue。不幸的是,该项目没有得到积极的维护,所以很难得到任何形式的支持,当试图使它与最新的硬件工作。

相关问题