java—在hadoop节点之间分配工作

gab6jxml 于 2021-05-29 发布在 Hadoop

关注(0)|答案(0)|浏览(179)

我有一个hadoop集群，包括1个namenode和3个datanode。
为了处理一个csv文件的搜索操作，我将csv文件分为3个文件。因此，我将输入路径设置为包含我的3个csv文件的文件夹，以便使用我的3个节点处理这些文件上的Map操作。
它似乎工作良好，但有没有节省时间相比，进程Map操作1大csv文件。。。
我有1个namenode（4个vcpu-xeon@2.8ghz，6go-ram）和3个datanode（2个vcpu-xeon@2.8ghz，4go-ram），Map操作大约需要7秒钟来解析包含约500000行（300mb）的csv文件。
这是我的Map课：gist
谢谢您！

Java hadoop mapreduce csv

来源：https://stackoverflow.com/questions/43652423/distribute-work-between-hadoop-nodes

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

java—在hadoop节点之间分配工作

暂无答案！

相关问题

热门标签

最新问答