我有一个从csv文件读取的 Dataframe 。类似这样的东西:
| 时间戳|价格|
| - ------| - ------|
| 2022年8月1日09时30分00秒005037|一百五十万一千四百零五千元|
| 2022年8月1日09时30分00秒005038| 155.405千元|
| 2022年8月1日09时30分00秒005040| 153 405 000美元|
| 2022年8月1日09时31分00秒00秒5000秒|16140万5千|
| 2022年8月1日09时31分00秒006038| 165,405,000欧元|
| 2022年8月1日09时31分00秒007038秒|163 405 000美元|
理想的结果是按1秒分组,并查找最低的higest、最早的和最后的值
| 时间戳|最低价格|最高价格|最早_价格|最新价格|
| - ------| - ------| - ------| - ------| - ------|
| 2022年8月1日09时30分00秒|一百五十万一千四百零五千元|155.405千元|一百五十万一千四百零五千元|153 405 000美元|
| 2022年8月1日09时31分00万|16140万5千|165,405,000欧元|16140万5千|163 405 000美元|
我使用过:
df.resample('1S').agg(['min','max', 'first', 'last'])
但是我总是遇到索引错误,而且我不知道如何在数据框中添加一个新的列。可以通过函数实现吗?
1条答案
按热度按时间b09cbbtk1#
使用
pandas.Grouper
对象和管理列索引:输出: