我有数据框:
import pandas as pd
data = [[101, 1, 2, 10, 3, 2, 3, 1], [5,5, 5, 5, 5, 5, 5, 5], [30, 3, 7, 14, 10, 7, 10, 2], [11, 2, 6, 15, 20, 6, 20, 11]]
df = pd.DataFrame(data, columns = ['xen', 'sim', 'tab', 'sim', 'simm', 'box', 'simm', 'res'])
它看起来像:
| xen | sim | tab | sim | simm | box | simm | res |
|------:|------:|------:|------:|-------:|------:|-------:|------:|
| 101 | 1 | 2 | 10 | 3 | 2 | 3 | 1 |
| 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 |
| 30 | 3 | 7 | 14 | 10 | 7 | 10 | 2 |
| 11 | 2 | 6 | 15 | 20 | 6 | 20 | 11 |
我需要得到列表中的重复列的名称的值(它可以重复的名称或可能没有)。对于上面的数据框输出应该像:
[["tab", "box"], ["simm", "simm"]]
4条答案
按热度按时间ffscu2ro1#
试试这个:
v64noz0r2#
看起来你需要比较每对列。所以
broadcast
是一个想法:输出:
vqlkdk9b3#
pdtvr36n4#
下面是一个方法:
输出: