tensorflow 运行时错误:资源耗尽:试图分配553305856字节时内存不足,BufferAssignment OOM

0qx6xfy6  于 2022-11-25  发布在  其他
关注(0)|答案(1)|浏览(313)

我得到这个错误时,在多个GPU上运行一个jax脚本.

jaxlib.xla_extension.XlaRuntimeError: RESOURCE_EXHAUSTED: Out of memory while trying to allocate 553305856 bytes. BufferAssignment OOM

我能做些什么来解决这个问题吗?

zi8p0yeb

zi8p0yeb1#

这似乎对我起了作用。

os.environ["XLA_PYTHON_CLIENT_PREALLOCATE"]="false"
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"]=".XX"
os.environ["XLA_PYTHON_CLIENT_ALLOCATOR"]="platform"

https://jax.readthedocs.io/en/latest/gpu_memory_allocation.html

相关问题