我可以在jupyter/ipython中使用hadoop和mapreduce吗?有没有类似于pyspark for spark的东西?
lmyy7pcs1#
你当然可以。许多框架,比如hadoop流媒体、mrjob和dumbo等等。在jupyter中包含这些内容的技术方面应该包括 subprocess.Popen() 调用或典型的python导入,具体取决于框架。在这个cloudera博客文章中可以找到对这些框架的一个很好的概述/评论。
subprocess.Popen()
1条答案
按热度按时间lmyy7pcs1#
你当然可以。许多框架,比如hadoop流媒体、mrjob和dumbo等等。在jupyter中包含这些内容的技术方面应该包括
subprocess.Popen()
调用或典型的python导入,具体取决于框架。在这个cloudera博客文章中可以找到对这些框架的一个很好的概述/评论。