reducer.py的emr问题

piv4azn7  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(181)

我正在运行aws并尝试在emr设置上运行模拟。我知道我的mapper.py文件是正确的,但我似乎不明白为什么我的reducer.py文件不能正常工作。。这个想法是对movies.cvs文件进行排序,该文件保存来自imdb的数据,并从投票和评级的Angular 查找最差的20部电影。我一直在试图找出为什么我的代码不起作用,如果可能的话,我希望得到一些帮助。所有日志都显示mapper.py文件运行正常,但reducer.py文件运行不正常。我已经包括了我的reducer.py的代码。谢谢你的帮助。
更新***

异径管.py


# ! /usr/bin/env python

import sys
from operator import itemgetter

arraysize = 20

results_printed = [('x', int(0), 'x')]

for line in sys.stdin:
  line = line.strip()   
  title, votes, rating = line.split("\t")   
  try:
        results = (title, int(votes), rating)
        results_printed.append(results)
  except ValueError:    pass
results_printed = sorted(results_printed, key=itemgetter(1))
for q in range (0,arraysize):
    print(results_printed[q])

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题