如果值连续出现,则仅保留最后一条记录。
输入_df:
|日期|值|
| ------------ | ------------ |
| 2022/01/01 | 5 |
| 2022/01/03 | 4 |
| 2022/01/05 | 3 |
| 2022/01/06 | 3 |
| 2022/01/07 | 3 |
| 2022/01/08 | 4 |
| 2022/01/09 | 3 |
输出(_D):
|日期|值|
| ------------ | ------------ |
| 2022/01/01 | 5 |
| 2022/01/03 | 4 |
| 2022/01/07 | 3 |
| 2022/01/08 | 4 |
| 2022/01/09 | 3 |
--值3连续重复3个日期,因此我们只保留三个连续日期中的最新记录,如果在连续性中断之间传输了不同的值,则不要删除该记录。
2条答案
按热度按时间xsuvu9jc1#
您可以使用
pandas.Series.diff
创建一个标志,并查看列值是否连续。请参阅文档here。然后放下连续的线。
vqlkdk9b2#
尝试使用sql