mahout:为什么我们要将输入数据转换成序列文件?

62lalag4  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(400)

我在mahout中看到了很多需要将输入数据转换为序列文件的示例。这样做的目的是什么?。

disbfnqx

disbfnqx1#

如果您正在操作大量的小文件,这几乎是不可能的,而且浪费资源将它们放在hdfs中,那么一个更简单的替代方法是创建一个序列文件并以这种方式对它们进行操作。看看这个:小文件问题

相关问题