我目前正在做Pandas练习:https://github.com/guipsamora/pandas_exercises/blob/master/03_Grouping/Occupation/Exercises_with_solutions.ipynb
我正在使用的数据框架有一个年龄,性别和职业列。这个问题要求对每一个职业和性别的组合,计算平均年龄。
我在想我的解决方案有什么不同:
users.groupby(['occupation', 'gender']).age.mean()
而答案中建议的解决方案是:
# create a data frame and apply count to gender
gender_ocup = users.groupby(['occupation', 'gender']).agg({'gender': 'count'})
# create a DataFrame and apply count for each occupation
occup_count = users.groupby(['occupation']).agg('count')
# divide the gender_ocup per the occup_count and multiply per 100
occup_gender = gender_ocup.div(occup_count, level = "occupation") * 100
# present all rows from the 'gender column'
occup_gender.loc[: , 'gender']
我在解中得到的值肯定与答案不同,但我不明白在引擎盖下有什么不同。
1条答案
按热度按时间pgx2nnw81#
我的答案是正确的。我真傻。我在看下面问题的答案。