配置单元查询结果到xl

93ze6v8z  于 2021-06-24  发布在  Hive
关注(0)|答案(1)|浏览(340)

我是hadoop和hive的新手。我当前的需求是收集每个运行日加载到15个表中的记录数的统计信息。而不是执行每个 select Count(*) 手动查询并复制输出到xl。有没有人能建议一下自动化这项任务的最佳方法?
注意:我们没有任何gui来运行配置单元查询,在普通unix终端中提交配置单元查询。

wj8zmpe1

wj8zmpe11#

导出到csv或tsv文件,然后在excel中打开文件。通常它生成tsv文件(制表符分隔)。这是如何将它转换为逗号分隔,如果你喜欢csv;

hive -e "SELECT 'table1' as source,  count(*) cnt FROM db.table1
         UNION ALL
         SELECT 'table2' as source,  count(*) cnt FROM db.table2" | tr "\t" "," > mydata.csv

向查询中添加更多表。您可以在windows中使用samba/nfs挂载正在其中写入输出文件的目录。使用crontab和voila调度命令,每天更新文件。
您还可以使用odbc驱动程序直接连接:
https://mapr.com/blog/connecting-apache-hive-to-odbc/
https://docs.microsoft.com/en-us/azure/hdinsight/hadoop/apache-hadoop-connect-excel-hive-odbc-driver
在excel 2013中连接hortonworks配置单元odbc时出错

相关问题