在Spark写入操作计时中核心没有影响

iswrvxsc 于 2021-05-27 发布在 Spark

关注(0)|答案(0)|浏览(385)

在我的sparkversion2.4.3作业中，经过所有的转换、计算和连接之后，我正在以Parquet格式将最终的Dataframe写入s3，但不管我的核心数是多少，我的作业都是以固定数量完成保存操作
对于distinct cores count-8,16,24，我的写入操作时间固定为8分钟，因此我的解决方案不具有可伸缩性我应该如何使我的解决方案具有可伸缩性，以便我的总体作业执行时间与使用的核心成比例
附加spark ui屏幕截图

sparkcore rdd DataFrame apache-spark apache-spark-sql

来源：https://stackoverflow.com/questions/63301478/no-impact-of-cores-in-spark-write-action-timings

暂无答案！

目前还没有任何答案，快来回答吧！

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 8个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 8个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 8个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 8个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 8个月前