如何使用hivewarehouse连接器在pyspark中执行hql文件

sauutmhj  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(426)

我有一个hql文件。我想用pyspark和hive仓库连接器运行它。有一个executequery方法来运行查询。我想知道hql文件是否可以这样运行。我们可以这样运行复杂的查询吗。请建议。
谢谢

vql8enpb

vql8enpb1#

我有下面的解决方案,假设hql文件中有多个查询。
hql文件:sample_query.hql

  1. select * from schema.table;
  2. select * from schema.table2;

代码:迭代每个查询。在每次迭代中,您可以按照自己的意愿(在hwc操作方面)进行操作。

  1. with open('sample_query.hql', 'r') as file:
  2. hql_file = file.read().rstrip()
  3. for query in [x.lstrip().rstrip() for x in hql_file.split(";") if len(x) != 0] :
  4. hive.executeQuery("{0}".format(query))

相关问题