我有下面的dataframe,它有两列。
输入Dataframe:
col1,col2
1,2
2,3
7,0
2,1
在上面的Dataframe中,第一行和第四行是对称的,应该只考虑一次。我们可以使用输出中的第一行或第四行。
可能的输出Dataframe。
可能性1:
col1,col2
2,3
7,0
2,1
可能性2:
col1,col2
1,2
2,3
7,0
我有下面的dataframe,它有两列。
输入Dataframe:
col1,col2
1,2
2,3
7,0
2,1
在上面的Dataframe中,第一行和第四行是对称的,应该只考虑一次。我们可以使用输出中的第一行或第四行。
可能的输出Dataframe。
可能性1:
col1,col2
2,3
7,0
2,1
可能性2:
col1,col2
1,2
2,3
7,0
2条答案
按热度按时间xe55xuns1#
你可以打电话
dropDuplicates
在排序的数组列上:f2uvfpb92#
你可以用
row_number
隔着Windows的least
以及greatest
值来自col1
以及col2
:也可以按排序的数组列进行分区: