我是hadoop新手,我已经安装了hadoop,并且能够编译和运行单词计数示例。我需要一些关于如何进行文件操作的信息。我有一些数据文件(a.txt,b.txt,…),其中每个文件有100行的时间戳和读数。我想处理这些,并给每个文件(a-10,b-15,…)赋值。主要问题是数据行的顺序对处理很重要。谢谢您。
3zwtqj6y1#
如果您想在自己的Map器中读取每个文件,可以尝试wholefileinputformat
1条答案
按热度按时间3zwtqj6y1#
如果您想在自己的Map器中读取每个文件,可以尝试wholefileinputformat