将sparkDataframe转换为scalaMap集合

sauutmhj 于 2021-05-17 发布在 Spark

关注(0)|答案(3)|浏览(546)

我有如下的Dataframe。

scala> df.show
+---+-------+
|key|  count|
+---+-------+
| 11| 100212|
| 12| 122371|
| 13| 235637|
| 14|  54923|
| 15|   9785|
| 16|   5217|
+---+-------+

我正在研究如何将它转换成下面这样的Map。请帮忙。

Map(
"11" -> "100212",
"12" -> "122371",
"13" -> "235637",
"14" -> "54923",
"15" -> "9785",
"16" -> "9785"
)

scala apache-spark

来源：https://stackoverflow.com/questions/64908016/covert-spark-dataframe-to-scala-map-collection

3条答案

按热度按时间

w80xi6nr1#

使用 map 函数转换类型的列 map &收集数据。检查以下代码。

scala> df.show(false)
+---+------+
|key|value |
+---+------+
|11 |100212|
|12 |122371|
|13 |235637|
|14 |54923 |
|15 |9785  |
|16 |5217  |
+---+------+
scala> df
.select(map(df.columns.map(col):_*).as("map"))
.as[Map[String,String]]
.collect()
.reduce(_ ++ _)
res48: Map[String,String] = Map(12 -> 122371, 15 -> 9785, 11 -> 100212, 13 -> 235637, 16 -> 5217, 14 -> 54923)

展开查看全部

赞(0）回复(0）举报 2021-05-17

ijnw1ujt2#

df.collect().map(row => row.getAs[String](0) -> row.getAs[String](1)).toMap

赞(0）回复(0）举报 2021-05-17

krcsximq3#

你可以用 collectAsMap 方法。

val result = data.as[(String, String)].rdd.collectAsMap()
// result: Map[String, String] = Map(12 -> 122371, 15 -> 9785, 11 -> 100212, 14 -> 54923, 16 -> 5217, 13 -> 235637)

顺便说一句，记住收集所有数据到驱动程序是一个昂贵的操作，可能会导致内存不足的错误，请确保数据是小之前。

赞(0）回复(0）举报 2021-05-17

我来回答

将sparkDataframe转换为scalaMap集合

3条答案

相关问题

热门标签

最新问答