vllm [Bug]: 部署Phi-3-mini-128k-instructAssert错误

mbskvtky 于 2个月前发布在其他

关注(0)|答案(9)|浏览(39)

当前环境信息如下：

PyTorch版本：2.3.0+cu121
是否为调试构建：否
用于构建PyTorch的CUDA版本：12.1
是否使用ROCm进行构建：N/A
操作系统：Ubuntu 22.04.1 LTS(x86_64)
GCC版本：(Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
Clang版本：无法收集
CMake版本：3.29.0
Libc版本：glibc-2.35
Python版本：3.11.8(main, Feb 26 2024, 21:39:34) [GCC 11.2.0] (64-bit runtime)
Python平台：Linux-6.2.0-39-generic-x86_64-with-glibc2.35
是否可用CUDA:是
CUDA运行时版本：12.1.66
CUDA模块加载设置：LAZY
GPU模型和配置：
GPU 0:NVIDIA GeForce RTX 4090
GPU 1:NVIDIA GeForce RTX 4090
Nvidia驱动版本：530.30.02
cuDNN版本：可能是以下之一：
/usr/lib/x86_64-linux-gnu/libcudnn.so.8.9.4
/usr/lib/x86_64-linux-gnu/libcudnn_adv_infer.so.8.9.4
/usr/lib/x86_64-linux-gnu/libcudnn_adv_train.so.8.9.4
/usr/lib/x86_64-linux-gnu/libcudnn_cnn_infer.so.8.9.4
/usr/lib/x86_64-linux-gnu/libcudnn_cnn_train.so.8.9.4
/usr/lib/x86_64-linux-gnu/libcudnn_ops_infer.so.8.9.4
/usr/lib/x86_64-linux-gnu/libcudnn_ops_train.so.8.9.4
HIP运行时版本：N/A
MIOpen运行时版本：N/A
XNNPACK可用性：是
文件 "/home/hua-project/vllm/vllm/engine/arg_utils.py",第528行，在create_engine_config函数中
model_config = ModelConfig(
^^^^^^^^^^^^
文件 "/home/hua-project/vllm/vllm/config.py",第125行，在init函数中
self.max_model_len = _get_and_verify_max_len(self.hf_text_config,
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
文件 "/home/hua-project/vllm/vllm/config.py",第1163行，在_get_and_verify_max_len函数中
assert "factor" in rope_scaling
^^^^^^^^^^^^^^^^^^^^^^^
AssertionError