在mapper类中执行reducer操作

t1qtbnec 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(372)

在我的mapper类中，我逐行读取文件，并对每行执行一些字符串操作（即从字符串中删除特殊字符），然后在reducer中将每行存储在一个新文件中。
基本上，我的reducer只创建文件并在新文件上写每一行，其他什么都不写，所以我的Map器有可能创建文件，而不是将数据传递给reducer。这意味着我不想在mapper中使用reducer并执行它的操作。我对mapreduce了解不多，所以任何类型的帮助都是值得赞赏的

Java hadoop mapreduce

来源：https://stackoverflow.com/questions/23522013/perform-reducer-operation-in-mapper-class

1条答案

按热度按时间

是的，你想要的是非常有可能的，你需要的是一个Map只工作。i、这是一项只有绘图员而没有缩小器的工作。
实现它的方法是在driver类中将减速器的数量设置为0。

job.setNumReduceTasks(0);

关于这个主题的更详细的博客可以在这里找到
要为每个输入行生成一个文件，请考虑直接从Map器（即filesystem和filestatus）使用hdfsapi

赞(0）回复(0）举报 2021-06-03

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 5个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 5个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 5个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 5个月前