我有一个包含60多个列的 Dataframe 。我想计算以'FLAG_'开头的列名的sum和以'RESPONSE_'开头的列名的mean。如何实现这一点?我尝试使用agg(),但没有成功。
注意:我正在尝试将此作为数据管道得一部分
sum_cols = [col for col in df.columns if 'FLAG_' in col]
mean_cols = [col for col in df.columns if 'RESPONSE_' in col]
dict_ = {tuple(sum_cols): 'sum', tuple(mean_cols): 'mean'}
df = df.groupby('ID').agg(dict_)
但是我得到了错误,因为在选择列时,它应该是一个列表而不是元组。因为它是一个字典,我不能将列表作为键传递。
KeyError: "Column(s) [array([#<All the FLAG_ columns listed>], dtype=object)] do not exist"
1条答案
按热度按时间wj8zmpe11#