我有PandasDataFrame像下面:
数据类型:
- ID -整数
- 时间-整数
- TG -整数
| 识别号|时间|TG|
| - ------|- ------|- ------|
| 一百一十一|二〇二一〇一〇一|无|
| 一百一十一|小行星2021|无|
| 一百一十一|小行星2021| 1个|
| 二百二十二|小行星2021|无|
| 二百二十二|小行星2021| 1个|
| 三百三十三|小行星2021| 1个|
我需要聚合上面的DataFrame,以便知道:
- TIME中每个值有多少个ID
- TIME中每个值有多少个TG“1”
- TIME中每个值有多少个TG“0”
所以我需要像下面这样的东西:
TIME | num_ID | num_1 | num_0
---------|--------|-------|--------
20210101 | 2 | 0 | 2
20210201 | 3 | 2 | 1
20210301 | 1 | 1 | 0
在Python Padas中我如何才能做到这一点?
3条答案
按热度按时间vktxenjb1#
将
GroupBy.size
用于计数TIME
值,将crosstab
用于计数0
和1
值:如果需要仅计算
GroupBy.agg
中的0
和1
值,则另一个想法是:km0tfn4u2#
irlmq6kh3#
结果: