这个问题在这里已经有答案了:
groupby之后如何将值聚合到集合中(3个答案)
六个月前关门了。
我有一个Dataframe如下
scala> df.show
+----+------+
|SLNO|Values|
+----+------+
| A| y|
| A| t|
| A| e|
| B| f|
| C| g|
| B| h|
| C| k|
| C| u|
| B| p|
+----+------+
预计结果如下:
SLNO Values
A y,t,e
B f,h,p
C g,k,u
如何通过sparkscala的dataframe和dataset模型实现这一点?。
我在数据集中尝试了下面这样的方法,但在这之后就被打中了
scala> ds.filter(line=> line.split("\t")(0).size <=1 ).map(line => Map(line.split("\t")(0) -> line.split("\t")(1)))
res86:org.apache.spark.sql.Dataset[scala.collection.immutable.Map[String,String]] = [value: map<string,string>]
//不知道如何进一步分组
2条答案
按热度按时间1rhkuytd1#
检查以下代码。
wpcxdonn2#