为什么要在hadoop中将返回值定义为函数参数?

iklwldmw  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(286)

目前我正在阅读关于 Mapper
在签名(这是正确的命名法吗?)中,我们必须指定我们在签名中输入的内容,以及输出的内容:

Mapper<KEYIN,VALUEIN,KEYOUT,VALUEOUT>

这是否意味着我们需要在我们称之为数据结构的地方之外定义和示例化这些数据结构?

nnsrf1az

nnsrf1az1#

您需要定义特定mapreduce任务的inputformat和outputformat,是的。不过,这不是返回值,而是写入上下文输出的内容。
这都是通过job类配置的。
您所称的“签名”与java泛型的任何其他应用程序没有区别。
对于默认的textinputformat+linerecordreader,它们使用longwritable和text作为这些参数。
其他格式和可写内容已经由hadoop库定义了,如果这是您的问题的话。
不过,欢迎你自己来定义

相关问题