我需要比较dataframe值和list值,得到dataframe中不存在的值的列表。
请有人帮帮我!
list =['682.9', '682.12', '682.11', '682.13', '682.14', '682.15']
Dataframe:
+-----------+
|sheetnumber|
+-----------+
| 682.11|
| 682.12|
| 682.13|
| 682.14|
| 682.15|
| 783.4|
+-----------+
预期产量:
['682.9']
3条答案
按热度按时间tzdcorbm1#
您可以将列表转换为pysparkDataframe,并与其他Dataframe进行左反联接:
7jmck4yq2#
你可以用
exceptAll
要将列表(转换为Dataframe)与Dataframe进行比较,请执行以下操作:为了把结果列出来,你可以
cbwuti443#
您可以使用filter/where语句并检查它是否在列表中
这个
~
代表不