我希望将重复的列元素的索引作为列表。到目前为止,我发现的方式是
test = ['a', 'a', 'b', 'c', 'b'] testdf = pd.DataFrame(test, columns=['test']) np.asarray(np.where(list(testdf['test'].duplicated()))).tolist()[0] # [1, 4]
这似乎错综复杂得可笑。还有更好的办法吗?
kxe2p93d1#
可以将.duplicated()与.tolist()一起使用
.duplicated()
.tolist()
testdf.index[testdf.test.duplicated()].tolist()
sczxawaw2#
只需对索引进行索引即可:
testdf.index[testdf['test'].duplicated()]
添加to_list:
to_list
testdf.index[testdf['test'].duplicated()].to_list()
产出:
[1, 4]
9wbgstp73#
%%time test = ['a', 'a', 'b', 'c', 'b'] testdf = pd.DataFrame(test, columns=['test']) testdf[testdf.test.duplicated()].index.to_list() # Wall time: 2 ms # [1, 4]
3条答案
按热度按时间kxe2p93d1#
可以将
.duplicated()
与.tolist()
一起使用sczxawaw2#
只需对索引进行索引即可:
添加
to_list
:产出:
9wbgstp73#