我最近尝试使用10个数据节点的hadoop集群从hbase示例导出一个表。命令行如下所示:
nohup hbase org.apache.hadoop.hbase.mapreduce.Export documents /export/documents 10 > ~/documents_export.out &
如您所见,我取消了进程,这样当ssh会话关闭时它就不会过早地死掉,我将整个过程放在了后台。为了捕获输出,我将其定向到一个文件。
正如预期的那样,进程开始运行,事实上运行了几个小时之后,输出在我要输出到的文件中神秘地停止了。在运行的mapreduce作业的Map阶段,它以大约31%的速度停止。然而,根据hadoop,mapreduce作业本身仍然在进行,事实上第二天早上就要完成了。
所以,我的问题是为什么输出停止进入我的日志文件?我最好的猜测是,我调用的父hbase进程在完成导出中涉及的mapreduce作业的初始设置时正常退出。
暂无答案!
目前还没有任何答案,快来回答吧!