关于spark scala array()需要澄清

ao218c7q  于 2021-05-24  发布在  Spark
关注(0)|答案(1)|浏览(472)

我有一个Dataframe。该Dataframe中很少有列值是array(),即array[nothing]。如何过滤这些?因为如果我不这样做,如果有人试图打印Dataframe,它就会抛出错误。

p4rjhz4m

p4rjhz4m1#

只需过滤空数组。

val df1 = df.withColumn("array", array())
df1.show()

+---+-----+
| id|array|
+---+-----+
|  1|   []|
+---+-----+

val df2 = df1.filter("array != array()")
df2.show()

+---+-----+
| id|array|
+---+-----+
+---+-----+

相关问题