我有两个 Dataframe ,
df1 df2
country country
US AR
US AD
CA AO
CN AU
AR US
如何通过将国家/地区列表合并为一个集合来比较两个 Dataframe 之间的差异,从而按它们进行分组?
我的预期结果是,
country code df1_country_count df2_country_count
AR 1 1
AD 0 1
AO 0 1
AU 0 1
US 2 1
CA 1 0
CN 1 0
3条答案
按热度按时间oipij1gg1#
结果:
jslywgbw2#
您可以使用
value_counts
,然后使用concat。dxxyhpgq3#
pd.concat
合并所有 Dataframe (不管有多少),并在列表解析中使用.assign
添加'source'
列。source=f'df{i}'
:构造f字符串,以确定列名在频率表中的显示方式。pd.crosstab
计算这两列的频数表。