PaddleNLP [Question]:如何设置多卡pipline并行推理？

e4eetjau 于 2个月前发布在其他

关注(0)|答案(2)|浏览(119)

要开启流水线并行，您需要在strategy.hybrid_configs中设置pp_degree的值。例如，如果您想要使用4个数据并行进程和1个模型并行进程，您可以将pp_degree设置为5。以下是修改后的代码：

strategy = fleet.DistributedStrategy()
strategy.hybrid_configs = {
    "dp_degree": 1,
    "mp_degree": 1,
    "pp_degree": 5,  # 将pp_degree设置为5以使用4个数据并行进程和1个模型并行进程
    "sharding_degree": 1,
}
fleet.init(is_collective=True, strategy=strategy)
hcg = fleet.get_hybrid_communicate_group()
tensor_parallel_rank = hcg.get_model_parallel_rank()
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path, tensor_parallel_rank=tensor_parallel_rank, dtype="float32")

这样，您的模型将使用流水线并行。

PaddleNLP

来源：https://github.com/PaddlePaddle/PaddleNLP/issues/8501