我正在研究hadoop和spark框架来进行图像聚类。我使用python作为我的编程语言。对于map reduce框架,使用mrjob包。我的疑问是如何在python中直接访问hdfs文件?例如,如果我在hdfs上的文件是/a.txt,那么现在如何在python中直接访问它以应用进一步的处理。我查看了许多库,但没有得到具体的答案。我看到了snakebite,但它只适用于Python2。
我正在研究hadoop和spark框架来进行图像聚类。我使用python作为我的编程语言。对于map reduce框架,使用mrjob包。我的疑问是如何在python中直接访问hdfs文件?例如,如果我在hdfs上的文件是/a.txt,那么现在如何在python中直接访问它以应用进一步的处理。我查看了许多库,但没有得到具体的答案。我看到了snakebite,但它只适用于Python2。
暂无答案!
目前还没有任何答案,快来回答吧!