我有一个pandas dataframe A,ID,date_yyyymmdd,金额和小时如下所示。并非所有日历日期都已填充。
| 日期_yyyymmdd|数量|小时数| hours |
| --|--|--| ------------ |
| 20230101|一千四百二十八点九五|十一个| 11 |
| 20230103|一七九一点二九|十三个| 13 |
| 20230101| 2516.84|十五个| 15 |
| 20230105| 3046.08|五个| 5 |
| 20230102|七一三七点九二|十一个| 11 |
| 20230103|一千一百零四点三十五|一个| 1 |
| 20230104|二十五个|一个| 1 |
我想在两个变量start_date和end_date之间填充缺少的日历日期,并生成另一个数据框B,如下所示,并将这些日期的金额和小时数填充为0。在下面的示例中,开始日期是20230101,结束日期是20230105。我发现了一个使用日期作为索引并填充缺失值的代码。我不认为它会在我的情况下工作。我想为每个ID填写日期。我怎么能做到这一点?- 谢谢-谢谢
| 日期_yyyymmdd|数量|小时数| hours |
| --|--|--| ------------ |
| 20230101|一千四百二十八点九五|十一个| 11 |
| 20230102| 0个|0个| 0 |
| 20230103|一七九一点二九|十三个| 13 |
| 20230104| 0个|0个| 0 |
| 20230105| 0个|0个| 0 |
| 20230101| 2516.84|十五个| 15 |
| 20230102| 0个|0个| 0 |
| 20230103| 0个|0个| 0 |
| 20230104| 0个|0个| 0 |
| 20230105| 3046.08|五个| 5 |
| 20230101| 0个|0个| 0 |
| 20230102|七一三七点九二|十一个| 11 |
| 20230103|一千一百零四点三十五|一个| 1 |
| 20230104|二十五个|一个| 1 |
| 20230105| 0个|0个| 0 |
3条答案
按热度按时间smdnsysy1#
下面是一种方法,通过构造一个新的
MultiIndex
,并使用它来reindex
您的df。字符串
输出量:
型
wgx48brx2#
试试看:
字符串
印刷品:
型
63lcw9qa3#
一个选项是具有pyjanitor's完整功能:
字符串