我想在hadoop上以二进制安全的方式连接几个大文件(比如10个20-50gb的文件)。我可以编写一个特定的加载程序/存储来实现这一点,但是我想知道是否有一个标准的方法来实现它(例如hadoop fs cli)?我其实连内容顺序都不在乎。
wb1gzix01#
“getmerge”是您需要的->http://hadoop.apache.org/docs/r0.19.0/hdfs_shell.html#getmerge
1条答案
按热度按时间wb1gzix01#
“getmerge”是您需要的->http://hadoop.apache.org/docs/r0.19.0/hdfs_shell.html#getmerge