**结束。**此问题需要详细的调试信息。它目前不接受答案。
**想改进这个问题吗?**更新问题,使其成为堆栈溢出的主题。
8小时前关门了。
改进这个问题
我有一个场景:我有一个dataframe,其中列'account'和'delay in pay'(值1表示yes,值0表示no),现在我想创建一个新列'delay\u num\u count',其中我想知道给定帐户延迟付款的次数,在给定的Dataframe中,帐户值可以不止一个,并且来自同一帐户的所有条目都应有延迟总和。有什么建议怎么在Pandas身上做吗?
输入:[在此处输入图像描述][1]
预期输出:[在此处输入图像描述][2]
输出说明:由于我们在支付账户123中有2个条目延迟,所以总和是2[1]:https://i.stack.imgur.com/u56ec.png [2]: https://i.stack.imgur.com/nid7v.png
1条答案
按热度按时间46scxncf1#
很难说没有更多的细节,但这里的一个选项是创建一个pivot表,在这里您可以将行设置为
['Account']
,值等于{'Delay in pay': 'sum'}
.pandas中透视表语法的概述如下:https://pbpython.com/pandas-pivot-table-explained.html
顺便说一句,在pandas中,pivot表可能非常棘手。如果你发现这种情况适合你,你可以试试水户。您可以在这里看到创建透视表的示例。完全公开,我是水户的首席开发人员!