提交pyspark作业时出现语法错误

kh212irz  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(328)

我已经通过vmware在Ubuntu14上安装了hadoop和spark。我正在spark/examples/中运行wordcount的python脚本。。。在独立模式下,但它给出了语法错误。

./bin/spark-submit --master yarn --deploy-mode client --executor-memory  2g  usr/local/spark/examples/src/main/python/wordcount.py '/usr/local/spark/README.md'
     File "<stdin>", line 1
    ./bin/spark-submit --master yarn --deploy-mode client --executor-memory 1g 
    /usr/local/spark/examples/src/main/python/wordcount.py '/usr/local/README.md'
        ^
    SyntaxError: invalid syntax

我是spark的初学者,请告诉我怎么解决。。。。。

eh57zj3b

eh57zj3b1#

wordcount.py 需要两个输入参数,请参见此处

n53p2ov0

n53p2ov02#

当我从bin目录而不是spark目录调用./bin/spark submit时,我已经解决了这个错误。它不需要处理两个参数代码使用单参数指定文件路径。

相关问题