我试图过滤Dataframe中一列为空的数据。从源json文件中,我得到列的值,如下所示:
col:null
该列的架构将变成字符串。
当我过滤行时,我仍然得到记录。以下命令均无效。不知道我在这里错过了什么。
df.filter($"col" =!= "null")
df.filter($"col" =!= lit("null"))
Dataframe输出低于
+----------+-------------------+
|RecordCnt |col |
+----------+-------------------+
| 500000| null|
+----------+-------------------+
2条答案
按热度按时间r8xiu3jd1#
3bygqnnd2#
不能使用相等运算符与null进行比较。你需要使用
is not null
,例如。或者在Dataframeapi中,