我试图将一列除以另一列中某个票号的占用量。
虽然在这里并不完全清楚,但票价是由共享一个票号的乘客总数组成的,所以我想将其分割以获得个人票价。我希望输出结果是票价除以相同票号的乘客总数。是在新列中还是在已经存在的Fare列中是次要的。应该计算出现次数的列是“机票”,“票价”列应该除以特定“机票”值下的条目数量。
完整的数据集可在这里:https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv
到目前为止,我已经尝试在字典中输入occupational并使用value_counts()方法,但我一直遇到一个不可散列的对象错误。
感谢您的帮助!
1条答案
按热度按时间bzzcjhmw1#
使用
groupby_transform
将size
广播到每一行,然后您可以将单个Fare
除以同一张票的数量:输出量:
门票数量:
替代(不推荐):