rstudio连接到远程hadoop服务器

k75qkfdt  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(462)

我有一个带rstudio的ubuntu桌面,我还有一个运行在centos下的远程hadoop集群,我希望能从rstudio连接到它,据我所知,这是一个可行的方法,但是有人能确认一下吗?

9udxz4iz

9udxz4iz1#

rstudio将不允许您连接到hadoop,但是您可以使用hadoop流api提交hadoop作业。
有几个软件包可以帮助您入门。我使用rmr在hadoop集群上使用流api运行map/reduce作业。这些可以在这里找到。
https://github.com/revolutionanalytics/rhadoop/wiki
还有rhipe包,它允许您在r脚本中与hdfs文件系统通信。
http://www.datadr.org/doc/functions.html

相关问题