我试图理解近似中值聚合在hadoop中是如何工作的,比如如何精确地进行Map和归约。如果你能给我一个简短的例子,或者给我指一些其他的在线资源/材料,那将是很棒的!我的最终目标是在crunch中创建一个近似的中位数聚合器。因此,我正在寻找一个好的算法/策略(细节),它可以以分布式的方式进行聚合。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!