Pandas练习:按两个值分组并求平均值

jutyujz0  于 2022-11-05  发布在  其他
关注(0)|答案(1)|浏览(176)

我目前正在做Pandas练习:https://github.com/guipsamora/pandas_exercises/blob/master/03_Grouping/Occupation/Exercises_with_solutions.ipynb
我正在使用的数据框架有一个年龄,性别和职业列。这个问题要求对每一个职业和性别的组合,计算平均年龄。
我在想我的解决方案有什么不同:

users.groupby(['occupation', 'gender']).age.mean()

而答案中建议的解决方案是:


# create a data frame and apply count to gender

gender_ocup = users.groupby(['occupation', 'gender']).agg({'gender': 'count'})

# create a DataFrame and apply count for each occupation

occup_count = users.groupby(['occupation']).agg('count')

# divide the gender_ocup per the occup_count and multiply per 100

occup_gender = gender_ocup.div(occup_count, level = "occupation") * 100

# present all rows from the 'gender column'

occup_gender.loc[: , 'gender']

我在解中得到的值肯定与答案不同,但我不明白在引擎盖下有什么不同。

pgx2nnw8

pgx2nnw81#

我的答案是正确的。我真傻。我在看下面问题的答案。

相关问题