hadoop：处理逻辑接近数据，而不是数据接近处理逻辑解释

jrcvhitl 于 2021-06-01 发布在 Hadoop

关注(0)|答案(1)|浏览(345)

我正在阅读一篇与hadoop相关的ibm文章，列出的要点之一是
hadoop分布式文件系统有很多目标。以下是一些最值得注意的：
处理逻辑接近数据，而不是数据接近处理逻辑
对我来说，这听起来像是一场话剧。接近数据的处理逻辑和接近处理逻辑的数据之间有什么区别吗。

hadoop distributed-system

来源：https://stackoverflow.com/questions/47664786/hadoop-processing-logic-close-to-data-rather-than-data-close-to-processing-log

1条答案

按热度按时间

xriantvc1#

有很大的不同。
使处理接近数据意味着在数据实际所在的服务器上运行业务逻辑。
将此与使数据接近处理相比较，在处理过程中，您可能查询数据库，并将其与其他系统连接。在这种情况下，数据通过网络发送。
有人认为，在网络传输中，发送代码和库的开销要比提取千兆字节和兆字节的数据要少得多。
在hadoop2中，这是由yarn处理的，在yarn上mapreduce或spark等进程与datanode进程并行地从进程容器运行。

赞(0）回复(0）举报 2021-06-01

我来回答

hadoop：处理逻辑接近数据，而不是数据接近处理逻辑解释

1条答案

相关问题

热门标签

最新问答