我可以找到许多与这个主题相关的答案,但是找不到与我正在思考的场景相关的东西如果我有一台有这些规格的机器每核线程数:每插槽2核:12插槽:4 ram内存:512 gb所以我得到的最大线程数是96(12x4x2)。我要处理的数据是400GB。在这种情况下,整个数据可以放入内存,96个线程可以并行工作。那么在这种情况下,使用hadoop有什么好处(考虑到数据处理的速度有多快)?hadoop的核心或“数据局部性”(将代码带到数据中而不是移动数据)在这里有什么效果?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!