我是hadoop堆栈的新手,我已经学会了MapReduce和现在的hive。但我不确定 hive 的用途?在map-r中,我们有一个或多个输出文件n这是我们的最终结果,但是在hive中,我们可以使用类似sql的查询(即hql)来选择记录,但是我们没有得到任何最终的输出文件。结果将仅显示在终端上。现在我的问题是如何使用这个selecthql,以便其他分析团队可以使用它?
f45qwnt81#
有很多方法可以从外部提取/导出配置单元查询结果。如果您想在任何rdbms存储中得到结果,可以使用sqoop。我建议你仔细研究一下sqoop是什么,它是做什么的。如果您想将查询结果保存在一个文件中,那么有很多方法。配置单元支持从表导出数据。
INSERT OVERWRITE LOCAL DIRECTORY '/home/lvermeer/temp' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' select * from table;
另一种简单的方法是在cli中运行配置单元查询时,将配置单元查询输出重定向到文件。
hive -e "select * from table" > output.txt
1条答案
按热度按时间f45qwnt81#
有很多方法可以从外部提取/导出配置单元查询结果。
如果您想在任何rdbms存储中得到结果,可以使用sqoop。我建议你仔细研究一下sqoop是什么,它是做什么的。
如果您想将查询结果保存在一个文件中,那么有很多方法。配置单元支持从表导出数据。
另一种简单的方法是在cli中运行配置单元查询时,将配置单元查询输出重定向到文件。