我在mahout中看到了很多需要将输入数据转换为序列文件的示例。这样做的目的是什么?。
disbfnqx1#
如果您正在操作大量的小文件,这几乎是不可能的,而且浪费资源将它们放在hdfs中,那么一个更简单的替代方法是创建一个序列文件并以这种方式对它们进行操作。看看这个:小文件问题
1条答案
按热度按时间disbfnqx1#
如果您正在操作大量的小文件,这几乎是不可能的,而且浪费资源将它们放在hdfs中,那么一个更简单的替代方法是创建一个序列文件并以这种方式对它们进行操作。看看这个:小文件问题