有人知道hadoop是否可以与r/rstudio接口吗?如果是,怎么做?我有一些 hive 的table,我想去è用r/rstudio和'shiny'对它们进行视觉恢复(图形等…)。我将感谢任何帮助(想法,代码示例…)。
xpszyzbs1#
如果您只想访问hdfs上的配置单元表,可以使用rjdbc包和jdbc连接(这里解释:https://cwiki.apache.org/confluence/display/hive/hiveserver2+clients#hiveserver2clients-jdbc)。然后,您可以像使用关系数据库一样使用rjdbc,只是它可能会在集群上启动一些map/reduce作业来执行。
ny6fqffe2#
试试dplyr.hive.spark包。文档仍然有点更适合spark,但是我用最新的hdp沙盒在hive上测试了它,一切都很顺利。如果你试一下,请报告任何问题。
2条答案
按热度按时间xpszyzbs1#
如果您只想访问hdfs上的配置单元表,可以使用rjdbc包和jdbc连接(这里解释:https://cwiki.apache.org/confluence/display/hive/hiveserver2+clients#hiveserver2clients-jdbc)。然后,您可以像使用关系数据库一样使用rjdbc,只是它可能会在集群上启动一些map/reduce作业来执行。
ny6fqffe2#
试试dplyr.hive.spark包。文档仍然有点更适合spark,但是我用最新的hdp沙盒在hive上测试了它,一切都很顺利。如果你试一下,请报告任何问题。