我有一个hql文件。我想用pyspark和hive仓库连接器运行它。有一个executequery方法来运行查询。我想知道hql文件是否可以这样运行。我们可以这样运行复杂的查询吗。请建议。谢谢
vql8enpb1#
我有下面的解决方案,假设hql文件中有多个查询。hql文件:sample_query.hql
select * from schema.table;select * from schema.table2;
select * from schema.table;
select * from schema.table2;
代码:迭代每个查询。在每次迭代中,您可以按照自己的意愿(在hwc操作方面)进行操作。
with open('sample_query.hql', 'r') as file: hql_file = file.read().rstrip()for query in [x.lstrip().rstrip() for x in hql_file.split(";") if len(x) != 0] : hive.executeQuery("{0}".format(query))
with open('sample_query.hql', 'r') as file:
hql_file = file.read().rstrip()
for query in [x.lstrip().rstrip() for x in hql_file.split(";") if len(x) != 0] :
hive.executeQuery("{0}".format(query))
1条答案
按热度按时间vql8enpb1#
我有下面的解决方案,假设hql文件中有多个查询。
hql文件:sample_query.hql
代码:迭代每个查询。在每次迭代中,您可以按照自己的意愿(在hwc操作方面)进行操作。