我有一个带rstudio的ubuntu桌面,我还有一个运行在centos下的远程hadoop集群,我希望能从rstudio连接到它,据我所知,这是一个可行的方法,但是有人能确认一下吗?
9udxz4iz1#
rstudio将不允许您连接到hadoop,但是您可以使用hadoop流api提交hadoop作业。有几个软件包可以帮助您入门。我使用rmr在hadoop集群上使用流api运行map/reduce作业。这些可以在这里找到。https://github.com/revolutionanalytics/rhadoop/wiki还有rhipe包,它允许您在r脚本中与hdfs文件系统通信。http://www.datadr.org/doc/functions.html
1条答案
按热度按时间9udxz4iz1#
rstudio将不允许您连接到hadoop,但是您可以使用hadoop流api提交hadoop作业。
有几个软件包可以帮助您入门。我使用rmr在hadoop集群上使用流api运行map/reduce作业。这些可以在这里找到。
https://github.com/revolutionanalytics/rhadoop/wiki
还有rhipe包,它允许您在r脚本中与hdfs文件系统通信。
http://www.datadr.org/doc/functions.html