spark：取消持久化后未释放内存

f3temu5u 于 2021-05-27 发布在 Spark

关注(0)|答案(1)|浏览(756)

非常简单，我在一个17节点的集群上使用spark2.4.3，并且我有一个持久化的数据集。最后，在一些计算/操作之后，我使用unpersist（），但根据spark ui中的存储选项卡，数据集最终仍保留在内存中。即使我使用unpersist（true），数据集最终仍然存在。为什么会这样？

Java Dataset apache-spark Memory persistent-storage

来源：https://stackoverflow.com/questions/63952844/spark-memory-not-released-after-unpersist

1条答案

按热度按时间

修好了！最终问题出在代码中。我持久化了名为df的数据集，然后删除列或更改列的名称，并在相同的名称（df）上重新分配它。我想这意味着在我取消持久化的最后，只有新的数据集被取消持久化（尽管它从来没有被持久化）。我只是在“删除列等”之后保留了数据集并解决了问题。

赞(0）回复(0）举报 2021-05-27

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前