我已经通过vmware在Ubuntu14上安装了hadoop和spark。我正在spark/examples/中运行wordcount的python脚本。。。在独立模式下,但它给出了语法错误。
./bin/spark-submit --master yarn --deploy-mode client --executor-memory 2g usr/local/spark/examples/src/main/python/wordcount.py '/usr/local/spark/README.md'
File "<stdin>", line 1
./bin/spark-submit --master yarn --deploy-mode client --executor-memory 1g
/usr/local/spark/examples/src/main/python/wordcount.py '/usr/local/README.md'
^
SyntaxError: invalid syntax
我是spark的初学者,请告诉我怎么解决。。。。。
2条答案
按热度按时间eh57zj3b1#
wordcount.py
需要两个输入参数,请参见此处n53p2ov02#
当我从bin目录而不是spark目录调用./bin/spark submit时,我已经解决了这个错误。它不需要处理两个参数代码使用单参数指定文件路径。