所以我想在dataproc集群上运行pythonmapreduce作业,问题是我找不到需要提交到主类或jar输入中的hadoop流jar文件。我在hadoop2.7中使用dataproc映像,hadoop2.8的答案也可以。谢谢
zengzsys1#
hadoop流媒体jar位于 /usr/lib/hadoop-mapreduce/ dataproc群集节点上的文件夹: /usr/lib/hadoop-mapreduce/hadoop-streaming.jar
/usr/lib/hadoop-mapreduce/
/usr/lib/hadoop-mapreduce/hadoop-streaming.jar
1条答案
按热度按时间zengzsys1#
hadoop流媒体jar位于
/usr/lib/hadoop-mapreduce/
dataproc群集节点上的文件夹:/usr/lib/hadoop-mapreduce/hadoop-streaming.jar