我将数据分为三组。在此之后,我尝试在SVM中实现它,如下所示:
我不确定这是否是正确的方法,因为我得到的分数和论文中提到的分数之间的差距是巨大的。我想要达到的最终目标是获得所有三个集合的准确率、精确度和召回率。
y53ybaqx1#
如果你得到了出乎意料的高分,可能是由于未知的数据泄露。这完全取决于你的数据如何。* 例如,* 默认情况下train_test_split的shuffle为True。如果数据是时间敏感的,这意味着模型在未来已经达到峰值-因此有这么高的准确性。尝试:
train_test_split
True
train_test_split(..., shuffle=False)
1条答案
按热度按时间y53ybaqx1#
如果你得到了出乎意料的高分,可能是由于未知的数据泄露。这完全取决于你的数据如何。* 例如,* 默认情况下
train_test_split
的shuffle为True
。如果数据是时间敏感的,这意味着模型在未来已经达到峰值-因此有这么高的准确性。尝试: