java—hadoop中用于输入拆分的自定义输入格式

slsn1g29  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(491)

我能得到全部吗 input split 而不是将每行输入拆分为Map器。
为此,我需要实现自己的自定义输入格式。但如果我在写作 WholeFileInputFormat 这是否意味着Map程序得到整行或整条输入分割?
nlineinputformat解决了我的问题吗?

thtygnil

thtygnil1#

我不想麻烦你 NLineInputFormat . 您可能并不总是知道n是什么,也不需要输入格式读取每个文件来查找行字节偏移量的开销。
这个 WholeFileInputFormat 从这里(我假设您引用的内容)将把整个文件作为值传递给 map 方法。

相关问题