为了显示我的数据,我想创建一个频率图。该图将基于两列之间的组合发生的次数。我在数据集中有两列(df):acq_cc: [CN, IN, CN, CN, CN, IN, CN, CN, CN, ZA]
tar_cc: [GB, ZA, NO, AR, VG, JP, NL, PK, PK, SG]
列的值需要组合,例如CN - GB、IN - ZA。然后,我想计算组合出现的频率。在这种情况下,CN - PK出现了两次。
我使用了this示例,但由于没有“Client”值,因此收到错误代码。最终频率图应显示前10个最多组合的组合(在x轴上)及其计数(在y轴上)。
1条答案
按热度按时间jk9hmnmh1#
只需对多个列执行
value_counts
,然后使用head
选择前10个最常见的组合: