每行中的spark sql排序字符串

uplii1fm 于 2021-07-13 发布在 Spark

关注(0)|答案(2)|浏览(383)

我有以下Dataframe：

+-------+
|letters|
+-------+
|  [b,a]|
|[f,c,s]|
|[m,d,l]|
+-------+

我试着把每一行的字母按字母顺序排序。最终结果应为：

+-------+
|letters|
+-------+
|  [a,b]|
|[c,f,s]|
|[d,m,l]|
+-------+

sql apache-spark pyspark apache-spark-sql sorting

来源：https://stackoverflow.com/questions/66277065/spark-sql-sort-string-in-each-row

2条答案

按热度按时间

envsm3lx1#

如果 letters 是数组列，可以直接排序：

from pyspark.sql.functions import sort_array

df2 = df.withColumn("sortedCol", sort_array('letters', False))

赞(0）回复(0）举报 2021-07-13

ttcibm8c2#

如果有人正在使用microsoft.spark.sql程序集，则可以使用sortarray函数来执行此操作。
这是特定于使用.net spark的人的。
您可以在此处找到文档：
https://docs.microsoft.com/en-us/dotnet/api/microsoft.spark.sql.functions.sortarray?view=spark-dotnet

赞(0）回复(0）举报 2021-07-13

我来回答

每行中的spark sql排序字符串

2条答案

相关问题

热门标签

最新问答