我试图将一个数据集中的数据与另一个数据集进行比较,每当我在第一个数据集中看到代码时,我希望检查第二个数据集,如果该代码出现在那里,则检查其他列的值是否匹配。
df1
code count length width
13525 64 5 10
13456 20 10 20
13455 22 10 25
12334 10 2 5
12333 12 5 5
13234 18 8 10
现在我想检查第二个数据集,检查每个代码的计数,长度和宽度列是否正确。例如,我知道代码12333不在第二个数据集中,这不是一个问题,我担心的是其他任何列都不同。
df2
code count length width
13525 64 5 10
13456 20 10 22
13455 22 11 25
12334 10 2 5
13234 18 8 10
我想得到的是不同价值观的第三个同义词。我不完全确定最好的方法去做这件事,我努力匹配的代码主要。比如说;
codes_that_dont_match
13456 20 10 22
13455 22 11 25
2条答案
按热度按时间wsxa1bj11#
你可以尝试
或
这给
3vpjnl9f2#
正如其他人所提到的,可以用
anti_join
来检测差异。如何使用该函数取决于您想要找到的差异。
df1
中没有匹配项的行或者
df2
中的行在df1
中没有匹配项