pyspark 级联两个机器学习模型

blmhpbnm  于 2023-01-20  发布在  Spark
关注(0)|答案(1)|浏览(146)

我构建了一个机器学习(ML)模型,使用大约300万条记录的数据集将实时网络流量分类为攻击流量或正常流量。然后,我构建了第二个ML模型,使用大约150万条记录的数据集根据应用程序(Google、Facebook、YouTube等)对实时网络流量进行分类。
现在我想将这两个模型级联,如果流量正常,那么流量应该被第二个ML模型分类,否则,由于不需要经过第二个模型,所以应该被丢弃
我可以级联这两个模型吗?即使它们是使用不同的数据集构建的?如果可以,我该怎么做?

vecaoik1

vecaoik11#

我只使用C++或Python语言代码来进行级联逻辑,而不使用ML工具的功能。如果第二个模型的数据对第一个模型的决策没有贡献,只需将模型分开即可。

相关问题