如何在google云平台上提交spark graphx工作示例?

uurv41yg  于 2021-07-13  发布在  Spark
关注(0)|答案(1)|浏览(417)

我在google云平台上创建了一个集群,它有五个基于linux的虚拟机(vm):一个主机和4个工作机。我跑了 ./start-master.sh 在主虚拟机和 ./start-worker.sh [external-master-IP:7077] 在worker vms上。
现在我只想使用./bin/spark submit运行一个graphx示例作业,例如已经在spark中的pagerank算法。
我知道,我读过文档,上面写着这样运行:

  1. ./bin/spark-submit \
  2. --class <main-class> \
  3. --master <master-url> \
  4. --deploy-mode <deploy-mode> \
  5. --conf <key>=<value> \
  6. ... # other options
  7. <application-jar> \
  8. [application-arguments]

我试过这个:

  1. ./bin/spark-submit \
  2. --class org.apache.spark.examples.graphx.PageRankExample \
  3. --master spark://<external-IP>:7077 \
  4. --deploy-mode cluster

上面写着:
“错误:缺少应用程序资源。”
我需要添加一个.jar吗?对于这个pagerank示例,我找不到它。
谢谢您。

bakd9h0s

bakd9h0s1#

是的,您需要在spark submit命令中添加jar:

  1. ./bin/spark-submit \
  2. --class org.apache.spark.examples.graphx.PageRankExample \
  3. --master spark://<external-IP>:7077 \
  4. --deploy-mode cluster
  5. ../examples/jars/spark-examples_[your version].jar

你应该在房间里找到它 examples/jars Spark装置下的文件夹。这个jar被命名为 spark-examples_*.jar :

相关问题