考虑一个csv文件,其中每行包含两个字母,构成一个链接:
A,B
A,C
B,C
D,E
B,D
任务是使用python中的mrjob编写一个mapreduce程序,该程序查找数据集中2个链接的所有路径。
mapreduce代码应输出:
B,D,E # example, there is B,D + D,E link
A,B,C
A,B,D
代码格式:
from mrjob.job import MRJob
class MRLink(MRJob):
def mapper(self,_, line):
pass
def reducer(self,key, values):
pass
if __name__ == "__main__":
MRLink.run()
暂无答案!
目前还没有任何答案,快来回答吧!