执行器丢失

busg9geu 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(382)

我有一个由3台运行hadoop和spark-1.5.2的macos机器组成的集群（尽管spark-2.0.0也存在同样的问题）。使用'yarn'作为spark主url，我遇到了一个奇怪的问题，任务只分配给3台机器中的2台。
基于hadoop Jmeter 板（主机上的端口8088），很明显所有3个节点都是集群的一部分。但是，我运行的任何spark作业都只使用2个执行器。
例如，下面是长时间运行javawordcount示例的“executors”选项卡：

“ bat 服务器”是主人。应该有一个附加的从服务器“batservers2”，但它不在那里。
为什么会这样？
请注意，除了为yarn资源和节点管理器提供额外内存之外，我的yarn或spark（或hdfs）配置都不常见。

hadoop yarn apache-spark apache-spark-1.5

来源：https://stackoverflow.com/questions/39967805/spark-on-hadoop-yarn-executor-missing

1条答案

按热度按时间

值得注意的是，只需仔细查看spark submit帮助消息，就可以找到答案：
仅Yarn：
...
--num executors要启动的执行器的数量（默认值：2）。
如果我指定 --num-executors 3 在spark submit命令中，使用第3个节点。

赞(0）回复(0）举报 2021-06-03

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 6个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 6个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 6个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 6个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 6个月前