如何使用hivewarehouse连接器在pyspark中执行hql文件

sauutmhj 于 2021-05-27 发布在 Spark

关注(0)|答案(1)|浏览(426)

我有一个hql文件。我想用pyspark和hive仓库连接器运行它。有一个executequery方法来运行查询。我想知道hql文件是否可以这样运行。我们可以这样运行复杂的查询吗。请建议。
谢谢

apache-spark pyspark hiveql

来源：https://stackoverflow.com/questions/62709213/how-to-execute-hql-file-in-pyspark-using-hive-warehouse-connector

1条答案

按热度按时间

vql8enpb1#

我有下面的解决方案，假设hql文件中有多个查询。
hql文件：sample_query.hql

select * from schema.table;
select * from schema.table2;

代码：迭代每个查询。在每次迭代中，您可以按照自己的意愿（在hwc操作方面）进行操作。

with open('sample_query.hql', 'r') as file:
    hql_file = file.read().rstrip()
for query in [x.lstrip().rstrip() for x in hql_file.split(";") if len(x) != 0] :
    hive.executeQuery("{0}".format(query))

赞(0）回复(0）举报 2021-05-27

我来回答

如何使用hivewarehouse连接器在pyspark中执行hql文件

1条答案

相关问题

热门标签

最新问答