我正在尝试编写一个代码,根据ncdc天气计算平均温度(reducer.py)。第一个
b4qexyjb1#
首先,您显示的数据没有制表符,所以不清楚为什么您显示了在制表符上拆分行并找到最大值的代码。要求平均值,需要将所有看到的值收集到一个列表(values.append(int(val)))中,然后可以在循环结束时执行from statistics import mean并调用mean(values)我强烈建议您使用mrjob或pyspark
values.append(int(val))
from statistics import mean
mean(values)
mrjob
pyspark
1条答案
按热度按时间b4qexyjb1#
首先,您显示的数据没有制表符,所以不清楚为什么您显示了在制表符上拆分行并找到最大值的代码。
要求平均值,需要将所有看到的值收集到一个列表(
values.append(int(val))
)中,然后可以在循环结束时执行from statistics import mean
并调用mean(values)
我强烈建议您使用
mrjob
或pyspark