我正在尝试使用python连接到hive。我安装了所需的所有依赖项(sasl、thrift\u sasl等)
以下是我尝试连接的方式:
configuration = {"hive.server2.authentication.kerberos.principal" : "hive/_HOST@REALM_HOST", "hive.server2.authentication.kerberos.keytab" : "/etc/security/keytabs/hive.service.keytab"}
connection = hive.Connection(configuration = configuration, host="host", port=port, auth="KERBEROS", kerberos_service_name = "hiveserver2")
但我有个错误:
次要代码可能提供更多信息(找不到领域“realm\u domain”的kdc)
我错过了什么?有没有人举过 pyHive
连接使用 kerberos
?
谢谢你的帮助。
2条答案
按热度按时间wsxa1bj11#
我不知道pyspark的情况,但我使用的是下面的scala代码,它从去年开始就在工作。如果你能用python修改这段代码。替换基于kerberos的属性值。
9w11ddsr2#
谢谢你@kishore。实际上在pyspark中,代码如下所示:
您可以通过以下方式请求:
我实际上是通过以下命令运行代码:
我想你可以使用pyspark来运行python,比如:
但我没有试过,所以我不能保证它能起作用