每行中的spark sql排序字符串

uplii1fm  于 2021-07-13  发布在  Spark
关注(0)|答案(2)|浏览(354)

我有以下Dataframe:

+-------+
|letters|
+-------+
|  [b,a]|
|[f,c,s]|
|[m,d,l]|
+-------+

我试着把每一行的字母按字母顺序排序。最终结果应为:

+-------+
|letters|
+-------+
|  [a,b]|
|[c,f,s]|
|[d,m,l]|
+-------+
envsm3lx

envsm3lx1#

如果 letters 是数组列,可以直接排序:

from pyspark.sql.functions import sort_array

df2 = df.withColumn("sortedCol", sort_array('letters', False))
ttcibm8c

ttcibm8c2#

如果有人正在使用microsoft.spark.sql程序集,则可以使用sortarray函数来执行此操作。
这是特定于使用.net spark的人的。
您可以在此处找到文档:
https://docs.microsoft.com/en-us/dotnet/api/microsoft.spark.sql.functions.sortarray?view=spark-dotnet

相关问题