如何将wrappedarray转换为spark scala中的列表?

9udxz4iz  于 2021-07-14  发布在  Spark
关注(0)|答案(1)|浏览(450)

我使用Dataframe来处理spark中的数据。我在这个Dataframe中有一个数组列。在我想做的所有转换的末尾,我有一个Dataframe,其中有一个数组列和一行。为了应用groupby、map和reduce,我想把这个数组作为一个列表,但我做不到。

.drop("ScoresArray")
                    .filter($"min_score" < 0.2)
                    .select("WordsArray")
                    .agg(collect_list("WordsArray"))
                    .withColumn("FlattenWords", flatten($"collect_list(WordsArray)"))
                    .drop("collect_list(WordsArray)")
                    .collect()

        val test1 = words(0).getAs[immutable.List[String]](0)

以下是错误消息:

[error] (run-main-0) java.lang.ClassCastException: scala.collection.mutable.WrappedArray$ofRef cannot be cast to scala.collection.immutable.List
[error] java.lang.ClassCastException: scala.collection.mutable.WrappedArray$ofRef cannot be cast to scala.collection.immutable.List
[error]         at analysis.Analysis$.main(Analysis.scala:37)
[error]         at analysis.Analysis.main(Analysis.scala)
[error]         at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
[error]         at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
[error]         at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
[error]         at java.lang.reflect.Method.invoke(Method.java:498)
[error] stack trace is suppressed; run last Compile / bgRun for the full output

思想?

kadbb459

kadbb4591#

不能将数组强制转换为列表,但可以将一个数组转换为另一个数组。

val test1 = words(0).getSeq[String](0).toList

相关问题