pyspark SparkSession或spark-submit中的执行者数量？

y53ybaqx 于 2024-01-06 发布在 Spark

关注(0)|答案(1)|浏览(140)

我很好奇在哪里指定执行者的数量的最佳实践是什么？
似乎有两个地方可以做到这一点，一个是当它提交时，另一个是当它构建SparkSession时。
正如检查的那样，它似乎可以同时使用（我使用Spark独立模式和pyspark，部署模式是客户端模式）。
有人知道什么是正确的方法或有什么不同吗？
谢谢你，谢谢
我尝试在spark-submit中指定执行者的数量

$ spark-submit --master spark://spark-master:7077 --py-files my_libs.zip my_spark-main.py

字符串
我的my_spark-main.py是这样的

spark = SparkSession.builder \
        .appName("Spark-job-on-cluster-example") \
        .master("spark://master-node:7077") \
        .config("spark.executor.instances", 3) \
        .config("spark.eventLog.enabled", True) \
        .getOrCreate()
# some code below ...