如果pysparkDataframe的行位于另一个Dataframe中,如何基于两列的值删除这些行?

llycmphe  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(461)

我有两个dataframe,一个包含user和item列,另一个包含所有user-item对及其分数。 user| item 以及 user | item | item2 | rating2 | score 我想从第二个表中删除第一个Dataframe中出现用户和项的所有行。我不能用减法,因为它们的列数不一样?
这是可以通过反连接实现的吗?

szqfcxe2

szqfcxe21#

  1. df2.join(df1, on=['user', 'item'], how="left_anti")

相关问题