我有一个impala表,我想用ibis查询它。该表如下所示:
id | timestamp
-------------------
A | 5
A | 7
A | 3
B | 9
B | 5
我想去 group_by
此表根据 id
以及 timestamp range
. 分组操作最终应该产生一个 grouped
然后可以对其应用聚合的对象。例如:
第1组条件: id == A; 4 < timestamp < 11
第2组条件: id == A; 1 < timestamp < 6
第3组条件: id == B; 4 < timestamp < 7
产生 grouped
对象包含以下组:
第1组:
id | timestamp
-------------------
A | 5
A | 7
第2组:
id | timestamp
-------------------
A | 5
A | 3
第3组:
id | timestamp
-------------------
B | 5
一旦我有了组,我将执行各种聚合以获得最终结果。如果有人能帮我搞清楚这一组的话,我将不胜感激,即使是一个正规的Pandas表达也会很有帮助!
1条答案
按热度按时间3zwtqj6y1#
这里有一个例子
groupby
(无下划线):为您的应用程序创建一个grouper列
timestamp
.或者您可以同时使用:
您可能还希望应用整数除法来生成时间间隔:
编辑:
你的例子:
解决方案:
或更好: