vllm [杂项]:我想使用推测法运行Llama 3.1 405B,你能给我一个指南吗?

7kqas0il  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(37)

从日志中可以看出,问题出在模型的sampler属性上。错误提示为:AttributeError: 'LlamaForCausalLM' object has no attribute 'sampler'. Did you mean: 'sample'?。这意味着LlamaForCausalLM模型没有sampler属性,可能是因为使用了错误的属性名。

要解决这个问题,你需要检查你的代码,确保使用正确的属性名。如果你想要使用采样功能,可以尝试将sampler替换为sample
(RayWorkerWrapper pid=7834) mngc-001:7834:7834 [7] NCCL INFO Trees [0] -1/-1/-1->7->6 [1] -1/-1/-1->7->6 [2] -1/-1/-1->7->6 [3] -1/-1/-1->7->6 [4] -1/-1/-1->7->6 [5] -1/-1/-1->7->6 [6] -1/-1/-1->7->6 [7] -1/-1/-1->7->6 [8] -1/-1/-1->7->6 [9] -1/-1/-1->7->6 [10] -1/-1/-1->7->6 [11] -1/-1/-1->7->6 [12] -1/-1/-1->7->6 [13] -1/-1/-1->7->6 [14] -1/-1/-1->7->6 [15] -1/-1/-1->7->6 [16] -1/-1/-1->7->6 [17] -1/-1/-1->7->6 [18] -1/-1/-1->7->6 [19] -1/-1/-1->7->6 [20] -1/-1/-1->7->6 [21] -1/-1/-1->7->6 [22] -1/-1/-1->7->6 [23] -
(RayWorkerWrapper pid=7834) mngc-001:7834:7834 [7] NCCL INFO P2P Chunksize set to 524288 [repeated 2x across cluster]
(RayWorkerWrapper pid=7834) mngc-001:7834:7834 [7] NCCL INFO Channel 23/0 :[7 -> 6][6 -> 4][4 -> 2][2 -> 0][0 -> ...](重复了59次,共跨越了集群)

6gpjuf90

6gpjuf901#

如果你能用fp8权重运行,它将起作用。否则需要#6911来完成。

相关问题