scala/sparkshell中有4个变量。
S1 = (a string) = "age"
S2 = (another string) = "school"
D1 = (a double) = 0.50
D2 = (another double) = 0.75
我要把这个喂到 hive 的table上,就像这样:
因子系数
年龄0.50
学校0.75
我能够从scala/spark shell创建表:
val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)
//后续工作
hiveContext.sql("create table students_table (factor STRING, coeff FLOAT) stored as orc")
但是,我不知道如何将这些值插入配置单元表。
我玩过插入和更新语句。我还玩过Dataframe。我也尝试过将数据转储到hdfs中的文本文件中(首先将它们转换为rdd),但是这种格式的出现使我无法将其用作配置单元表的素材。
我肯定我完全不知道该怎么做。
我们真诚地感谢您的帮助。
1条答案
按热度按时间f1tvaqid1#