numpy数组是在spark驱动程序还是executor上创建的？

lbsnaicq 于 2021-05-29 发布在 Spark

关注(0)|答案(1)|浏览(369)

当我在spark cluster上运行numpy阵列时，我不知道它是在哪里创建的：

a = np.zeros((100, 100), dtype="byte")

我觉得应该在驱动程序上创建。但如果是这样的话，我们如何利用spark的分布式计算能力，换句话说，我们为什么要使用spark呢 numpy 如果它不能被分配的话？

apache-spark pyspark numpy

来源：https://stackoverflow.com/questions/62253078/numpy-array-is-created-on-spark-driver-or-executor

1条答案

按热度按时间

答案是否定的。numpy会将数据拉入驱动程序，如果数据超出内存限制，可能会导致oom。

赞(0）回复(0）举报 2021-05-29

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 9个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 9个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 9个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 9个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 9个月前