library(sparklyr)
library(dplyr)
home <- "/usr/hdp/current/spark-client"
sc <- spark_connect(master = "yarn-client", spark_home = home, version = "1.6.2")
readFromSpark <- spark_read_csv(sc, name="test", path ="hdfs://hostname/user/test.csv",header=TRUE)
我已经成功访问 hdfs
使用SparkyR。但是如何使用 sparklyr
因为我需要储存这个 df
进入Hive。
3条答案
按热度按时间vaqhlq811#
您可以尝试spark\u write\u table:
如果还要创建架构,可以使用dbi包:
rxztt3cl2#
另外,SparkyR没有直接创建数据库/表的功能。但你可以用
DBI
创建数据库/表。fcwjkofz3#
我就是这样做到的:
设置:
现在用它做点什么