通过与pandas数据框中标注的相关性选择要素

6l7fqoea  于 2023-05-12  发布在  其他
关注(0)|答案(2)|浏览(202)

我有一个格式的dataframe:

df = pd.DataFrame({ 'A' : [1,2,3],
                    'B' : [4,5,6],
                    'label' : [1.0, 0.0, 1.0]
                 })

我首先只选择与'label'列的相关性高于阈值的特征。

cor = df.corr()
cor_target = abs(cor["label"])
relevant_features = cor_target[cor_target>0.05]

我如何使用relevant_features对象来过滤出一个新的 Dataframe ,比如说从df中过滤出df2,它只具有这些功能?

oprakyz7

oprakyz71#

可以使用.loc

cor = df.corr()
cor_target = abs(cor["label"])
relevant_features = cor_target[cor_target>0.05]
df2 = df.loc[:, relevant_features.index]
mzsu5hc0

mzsu5hc02#

如果你更喜欢一个班轮

out = df[cor["label"].abs().gt(0.5).loc[lambda s: s].index]
print(out)

   label
0    1.0
1    0.0
2    1.0

相关问题