如何使用hdfscli python库？

6l7fqoea 于 2021-07-15 发布在 Hadoop

关注(0)|答案(0)|浏览(271)

我有以下用例，
我想连接一个远程hadoop集群。所以，我得到了所有hadoop conf文件（coresite.xml、hdfs-site.xml和其他文件），并将其存储在本地文件系统的一个目录中。我得到了正确的keytab和krb5.conf文件用于kerberos身份验证。我安装了hadoop并将untar文件放在某个目录下，比如 /User/xyz/hadoop . 我设置了以下环境变量： JAVA_HOME(), HADOOP_HOME, HADOOP_CONF_DIR 最后把krb5.conf文件放在 /etc/ . 此设置帮助我使用 kinit -kt <keytab> <principal user> 执行hadoop命令，比如 hadoop fs -ls / 从我的本地终端访问群集。
但是，我想在不下载hadoop的情况下执行相同的操作。有办法吗？我正在使用python，偶然发现了这个hdfs python库。然而，我很难理解和使用这个库。
我想要达到的目标，有可能吗？
如果是，正确的方法是什么？
有人能指导我用正确的配置设置hdfscli库吗？

hadoop python python-hdfs webhdfs pyhdfs-client

来源：https://stackoverflow.com/questions/66129417/how-to-use-hdfscli-python-library

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

如何使用hdfscli python库？

暂无答案！

相关问题

热门标签

最新问答