Spark 1.6即使在增加shuffle分区后也面临过大的帧错误

yshpjwxd 于 2023-10-23 发布在 Apache

关注(0)|答案(2)|浏览(212)

我正面临着这个问题。我无法解决太大的帧错误，即使在增加shuffle分区。
总记录：1.5亿

来源：https://stackoverflow.com/questions/58195845/spark-1-6-facing-too-large-frame-error-even-after-increasing-shuflle-partitions

2条答案

按热度按时间

你可以试试
1.查看故障节点上的日志文件。您希望查找文本“Killing container”。如果您看到文本“running beyond physical memory limits”，则增加memoryOverhead应该可以解决问题

org.apache.spark.shuffle.FetchFailedException可能由于超时检索shuffle分区而发生。请尝试以下配置
2.1. spark.reducer.maxReqsInFlight=1; --每次只拉取一个文件以使用全部网络带宽。
2.2 spark.shuffle.io.retryWait= 60 s; --在重试之前增加检索shuffle分区时的等待时间。对于较大的文件，需要更长的时间。
2.3 spark.shuffle.io.maxRetries=10;
2.4默认的120秒会导致很多执行程序在重负载下超时

赞(0）回复(0）举报 2023-10-23

错误是说其中一个shuffle块太大而无法获取。set spark.maxRemoteBlockSizeFetchToMem < 2g

赞(0）回复(0）举报 2023-10-23

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 9个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 9个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 9个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 9个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 9个月前