两个不同hadoop文件系统上文件的java校验和验证

ccrfmcuu 于 2021-06-02 发布在 Hadoop

关注(0)|答案(0)|浏览(293)

我对hadoop文件系统非常陌生。
我有两个不同的hadoop文件系统（一个是client，另一个是server），它们都在不同的域中，不能直接访问彼此。
我想将文件（以gb为单位）从服务器复制到客户端。
因为我不能直接访问服务器（从客户端），所以我按照下面的方法来复制文件。
我编写了一个服务器java程序，它读取带有服务器配置的文件，并将其作为字节写入stdout。

System.out.write(buf.array(), 0, length);
System.out.flush();

然后，我编写了cgi脚本，它调用这个服务器jar。
然后，我编写了一个客户机java程序，调用上面的cgi脚本来读取数据

FSDataOutputStream dataOut = fs.create(client_file, true, bufSize, replica, blockSize);
URL url = new URL("http://xxx.company.com/cgi/my_cgi_script?" + "file=" + server_file);
InputStream is = url.openStream();
byte[] byteChunk = new byte[1024 * 1024];
int n = 0;
while ( (n = is.read(byteChunk)) > 0 ) {
    dataOut.write(byteChunk, 0, n);
    received += n;
}
dataOut.close();

现在，复制文件没有任何问题，我看到服务器和客户端上的文件大小相同。
当我在客户机和服务器文件系统上对同一个文件执行filechecksum时，得到的是不同的值。

MD5-of-262144MD5-of-512CRC32C:86094f4043b9592a49ec7f6ef157e0fe
MD5-of-262144MD5-of-512CRC32C:a83a0b3f182db066da7520b36c79e696

你能帮我解决这个问题吗？
注意：我在客户机和服务器文件系统上使用相同的块大小

Java hadoop hdfs Checksum

来源：https://stackoverflow.com/questions/35965238/checksum-verification-for-a-file-on-two-different-hadoop-file-system

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

两个不同hadoop文件系统上文件的java校验和验证

暂无答案！

相关问题

热门标签

最新问答