当人们谈论hadoop、spark和大数据时，“中间结果”是什么意思？

blmhpbnm 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(671)

我正在努力学习更多关于大数据的知识，特别是关于利用hadoop和spark的知识。然而，我一直看到这个术语“中间结果”，我不太清楚它指的是什么。
例如，我读到“hadoop将中间结果写入计算机的存储磁盘，而spark尽可能将这些结果保存在内存中。”我假设这是指map reduce之后的结果，但我不太确定。
有人能更详细地介绍一下什么是“中间结果”以及它们在spark和hadoop之间的变化吗？

hadoop mapreduce apache-spark

来源：https://stackoverflow.com/questions/58158135/what-do-people-mean-by-intermediate-results-when-talking-about-hadoop-spark