hadoopmapreduce中knn的并行处理

vnzz0bqm  于 2021-06-04  发布在  Hadoop
关注(0)|答案(0)|浏览(251)

在寻找 K nearest neighbours 我们需要找到 distance 在r和s之间。
因此,我们将在hadoop中加载火车数据 setup 对于每个测试数据,我们将用测试数据计算距离。分布式缓存在存储数据方面有一定的限制。
如果我们需要找到一个大文件的距离,我们该怎么办。
还有其他更好的方法吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题